makslevental
diff --git a/‎examples/mwe.py‎
Lines changed: 137 additions & 31 deletions b/‎examples/mwe.py‎
Lines changed: 137 additions & 31 deletions
diff --git a/‎mlir/extras/dialects/ext/bufferization.py‎
Lines changed: 2 additions & 0 deletions b/‎mlir/extras/dialects/ext/bufferization.py‎
Lines changed: 2 additions & 0 deletions
@@ -1,53 +1,159 @@
-import mlir.extras.types as T
 import numpy as np
 
+import mlir.extras.types as T
+from mlir.dialects import builtin
+from mlir.dialects.transform import any_op_t
+from mlir.dialects.transform.extras import named_sequence, apply_patterns
+from mlir.extras.util import find_ops
+from mlir.ir import StringAttr, UnitAttr
+
 # you need this to register the memref value caster
 # noinspection PyUnresolvedReferences
 import mlir.extras.dialects.ext.memref
-from mlir.extras.ast.canonicalize import canonicalize
 from mlir.extras.context import RAIIMLIRContext, ExplicitlyManagedModule
-from mlir.extras.dialects.ext.arith import constant
+from mlir.extras.dialects.ext.bufferization import LayoutMapOption
+from mlir.dialects.transform.vector import (
+    VectorContractLowering,
+    VectorMultiReductionLowering,
+    VectorTransferSplit,
+    VectorTransposeLowering,
+)
+from mlir.extras.dialects.ext import linalg
 from mlir.extras.dialects.ext.func import func
-from mlir.extras.dialects.ext.scf import canonicalizer as scf, range_ as range
-from mlir.extras.runtime.passes import Pipeline
+from mlir.extras.dialects.ext.transform import (
+    match,
+    tile_to_scf_for,
+    get_parent_op,
+    transform_any_op_t,
+)
+from mlir.extras.dialects.ext import transform
+from mlir.extras.runtime.passes import Pipeline, run_pipeline
 from mlir.extras.runtime.refbackend import LLVMJITBackend
 
 ctx = RAIIMLIRContext()
 backend = LLVMJITBackend()
 module = ExplicitlyManagedModule()
 
-K = 10
-memref_i64 = T.memref(K, K, T.i64())
+M, K, N = 2, 4, 6
 
 
 @func
-@canonicalize(using=scf)
-def memfoo(A: memref_i64, B: memref_i64, C: memref_i64):
-    one = constant(1)
-    two = constant(2)
-    if one > two:
-        three = constant(3)
-    else:
-        for i in range(0, K):
-            for j in range(0, K):
-                C[i, j] = A[i, j] * B[i, j]
-
-
-memfoo.emit()
-module = module.finish()
+def matmul_tensors(
+    A: T.tensor(M, K, T.f32()),
+    B: T.tensor(K, N, T.f32()),
+    C: T.tensor(M, N, T.f32()),
+):
+    return linalg.matmul(A, B, C)
+
+
+@builtin.module(attrs={"transform.target_tag": StringAttr.get("payload")})
+def payload():
+    matmul_tensors.emit(force=True)
+
+
+@builtin.module(attrs={"transform.with_named_sequence": UnitAttr.get()})
+def mod_transform():
+    @named_sequence("main", [any_op_t()], [])
+    def main(module_op: any_op_t()):
+        matmul = match(module_op, ops=["linalg.matmul"])
+        tiled_matmul, (_, _, inner_loop) = tile_to_scf_for(matmul, sizes=[2, 2, 2])
+        transform.structured.vectorize_children_and_apply_patterns(
+            get_parent_op(transform_any_op_t(), tiled_matmul, isolated_from_above=True)
+        )
+        new_mod = transform.bufferization.one_shot_bufferize(
+            module_op,
+            function_boundary_type_conversion=LayoutMapOption.IdentityLayoutMap,
+            bufferize_function_boundaries=True,
+        )
+
+        func_op = match(new_mod, ops=["func.func"])
 
-print(module)
+        @apply_patterns(func_op)
+        def pats():
+            transform.apply_patterns.vector.lower_contraction(
+                lowering_strategy=VectorContractLowering.OuterProduct
+            )
+            transform.apply_patterns.vector.transfer_permutation_patterns()
+            transform.apply_patterns.vector.lower_multi_reduction(
+                lowering_strategy=VectorMultiReductionLowering.InnerParallel
+            )
+            transform.apply_patterns.vector.split_transfer_full_partial(
+                split_transfer_strategy=VectorTransferSplit.LinalgCopy
+            )
+            transform.apply_patterns.vector.transfer_to_scf(
+                max_transfer_rank=1, full_unroll=True
+            )
+            transform.apply_patterns.vector.lower_transfer(max_transfer_rank=1)
+            transform.apply_patterns.vector.lower_shape_cast()
+            transform.apply_patterns.vector.lower_transpose(
+                lowering_strategy=VectorTransposeLowering.Shuffle1D
+            )
 
-module = backend.compile(
+
+module = module.finish()
+# print(module)
+
+vectorized_module = run_pipeline(
     module,
-    kernel_name=memfoo.__name__,
-    pipeline=Pipeline().bufferize().lower_to_llvm(),
+    pipeline=Pipeline().transform_interpreter(
+        entry_point="main", debug_payload_root_tag="payload"
+    ),
+)
+
+# print(vectorized_module)
+
+# https://github.com/makslevental/llvm-project/blob/f6643263631bcb0d191ef923963ac1a5ca9ac5fd/mlir/test/lib/Dialect/LLVM/TestLowerToLLVM.cpp#L44
+lower_to_llvm = (
+    Pipeline()
+    .Func(
+        Pipeline()
+        # Blanket-convert any remaining high-level vector ops to loops if any remain.
+        .convert_vector_to_scf()
+        # Blanket-convert any remaining linalg ops to loops if any remain.
+        .convert_linalg_to_loops()
+    )
+    # Blanket-convert any remaining affine ops if any remain.
+    .lower_affine()
+    # Convert SCF to CF (always needed).
+    .convert_scf_to_cf()
+    # Sprinkle some cleanups.
+    .canonicalize()
+    .cse()
+    # Convert vector to LLVM (always needed).
+    .convert_vector_to_llvm()
+    # Convert Math to LLVM (always needed).
+    .Func(Pipeline().convert_math_to_llvm())
+    # Expand complicated MemRef operations before lowering them.
+    .expand_strided_metadata()
+    # The expansion may create affine expressions. Get rid of them.
+    .lower_affine()
+    # Convert MemRef to LLVM (always needed).
+    .finalize_memref_to_llvm()
+    # Convert Func to LLVM (always needed).
+    .convert_func_to_llvm()
+    # Convert Index to LLVM (always needed).
+    .convert_index_to_llvm()
+    # Convert remaining unrealized_casts (always needed).
+    .reconcile_unrealized_casts()
 )
 
-# windows defaults to int32
-A = np.random.randint(0, 10, (K, K)).astype(np.int64)
-B = np.random.randint(0, 10, (K, K)).astype(np.int64)
-C = np.zeros((K, K), dtype=np.int64)
 
-backend.load(module).memfoo(A, B, C)
-assert np.array_equal(A * B, C)
+compiled_module = backend.compile(
+    find_ops(
+        vectorized_module.operation,
+        lambda x: "transform.target_tag" in x.attributes
+        and x.attributes["transform.target_tag"].value == "payload",
+        single=True,
+    ),
+    kernel_name=matmul_tensors.__name__,
+    pipeline=lower_to_llvm,
+)
+
+print(compiled_module)
+
+A = np.random.randint(0, 10, (M, K)).astype(np.float32)
+B = np.random.randint(0, 10, (K, N)).astype(np.float32)
+C = np.zeros((M, N), dtype=np.float32)
+
+backend.load(compiled_module).matmul_tensors_capi_wrapper(A, B, C)
+assert np.allclose(A @ B, C)
@@ -0,0 +1,2 @@
+# noinspection PyUnresolvedReferences
+from ....dialects.bufferization import *
Original file line number	Diff line number	Diff line change
`@@ -0,0 +1,2 @@`
	`1`	`+# noinspection PyUnresolvedReferences`
	`2`	`+from ....dialects.bufferization import *`