[Clang][XTHeadVector] Fix __riscv_v_elen and __riscv_v_elen_fp (llvm#115)

imkiva · web-flow · commit 180004b73ac5 · 2024-05-27T20:41:11.000+08:00
diff --git a/.github/workflows/ruyisdk-qemu-rvv-tests.yml b/.github/workflows/ruyisdk-qemu-rvv-tests.yml
@@ -104,7 +104,7 @@ jobs:
           pushd rvv-intrinsic-doc/examples
           TESTS=(
             # rvv_branch.c
-            # rvv_index.c
+            rvv_index.c
             # rvv_matmul.c
             rvv_memcpy.c
             # rvv_reduce.c
diff --git a/clang/include/clang/Basic/riscv_vector_xtheadv_wrappers.td b/clang/include/clang/Basic/riscv_vector_xtheadv_wrappers.td
@@ -4976,6 +4976,30 @@ let HeaderCode =
 #define __riscv_vfredsum_vs_f64m2_f64m1_m(mask, vector, scalar, vl) __riscv_th_vfredsum_vs_f64m2_f64m1_m(mask, vector, scalar, vl)
 #define __riscv_vfredsum_vs_f64m4_f64m1_m(mask, vector, scalar, vl) __riscv_th_vfredsum_vs_f64m4_f64m1_m(mask, vector, scalar, vl)
 #define __riscv_vfredsum_vs_f64m8_f64m1_m(mask, vector, scalar, vl) __riscv_th_vfredsum_vs_f64m8_f64m1_m(mask, vector, scalar, vl)
+#define __riscv_vfredusum_vs_f16m1_f16m1(vector, scalar, vl) __riscv_vfredsum_vs_f16m1_f16m1(vector, scalar, vl)
+#define __riscv_vfredusum_vs_f16m2_f16m1(vector, scalar, vl) __riscv_vfredsum_vs_f16m2_f16m1(vector, scalar, vl)
+#define __riscv_vfredusum_vs_f16m4_f16m1(vector, scalar, vl) __riscv_vfredsum_vs_f16m4_f16m1(vector, scalar, vl)
+#define __riscv_vfredusum_vs_f16m8_f16m1(vector, scalar, vl) __riscv_vfredsum_vs_f16m8_f16m1(vector, scalar, vl)
+#define __riscv_vfredusum_vs_f32m1_f32m1(vector, scalar, vl) __riscv_vfredsum_vs_f32m1_f32m1(vector, scalar, vl)
+#define __riscv_vfredusum_vs_f32m2_f32m1(vector, scalar, vl) __riscv_vfredsum_vs_f32m2_f32m1(vector, scalar, vl)
+#define __riscv_vfredusum_vs_f32m4_f32m1(vector, scalar, vl) __riscv_vfredsum_vs_f32m4_f32m1(vector, scalar, vl)
+#define __riscv_vfredusum_vs_f32m8_f32m1(vector, scalar, vl) __riscv_vfredsum_vs_f32m8_f32m1(vector, scalar, vl)
+#define __riscv_vfredusum_vs_f64m1_f64m1(vector, scalar, vl) __riscv_vfredsum_vs_f64m1_f64m1(vector, scalar, vl)
+#define __riscv_vfredusum_vs_f64m2_f64m1(vector, scalar, vl) __riscv_vfredsum_vs_f64m2_f64m1(vector, scalar, vl)
+#define __riscv_vfredusum_vs_f64m4_f64m1(vector, scalar, vl) __riscv_vfredsum_vs_f64m4_f64m1(vector, scalar, vl)
+#define __riscv_vfredusum_vs_f64m8_f64m1(vector, scalar, vl) __riscv_vfredsum_vs_f64m8_f64m1(vector, scalar, vl)
+#define __riscv_vfredusum_vs_f16m1_f16m1_m(mask, vector, scalar, vl) __riscv_vfredsum_vs_f16m1_f16m1_m(mask, vector, scalar, vl)
+#define __riscv_vfredusum_vs_f16m2_f16m1_m(mask, vector, scalar, vl) __riscv_vfredsum_vs_f16m2_f16m1_m(mask, vector, scalar, vl)
+#define __riscv_vfredusum_vs_f16m4_f16m1_m(mask, vector, scalar, vl) __riscv_vfredsum_vs_f16m4_f16m1_m(mask, vector, scalar, vl)
+#define __riscv_vfredusum_vs_f16m8_f16m1_m(mask, vector, scalar, vl) __riscv_vfredsum_vs_f16m8_f16m1_m(mask, vector, scalar, vl)
+#define __riscv_vfredusum_vs_f32m1_f32m1_m(mask, vector, scalar, vl) __riscv_vfredsum_vs_f32m1_f32m1_m(mask, vector, scalar, vl)
+#define __riscv_vfredusum_vs_f32m2_f32m1_m(mask, vector, scalar, vl) __riscv_vfredsum_vs_f32m2_f32m1_m(mask, vector, scalar, vl)
+#define __riscv_vfredusum_vs_f32m4_f32m1_m(mask, vector, scalar, vl) __riscv_vfredsum_vs_f32m4_f32m1_m(mask, vector, scalar, vl)
+#define __riscv_vfredusum_vs_f32m8_f32m1_m(mask, vector, scalar, vl) __riscv_vfredsum_vs_f32m8_f32m1_m(mask, vector, scalar, vl)
+#define __riscv_vfredusum_vs_f64m1_f64m1_m(mask, vector, scalar, vl) __riscv_vfredsum_vs_f64m1_f64m1_m(mask, vector, scalar, vl)
+#define __riscv_vfredusum_vs_f64m2_f64m1_m(mask, vector, scalar, vl) __riscv_vfredsum_vs_f64m2_f64m1_m(mask, vector, scalar, vl)
+#define __riscv_vfredusum_vs_f64m4_f64m1_m(mask, vector, scalar, vl) __riscv_vfredsum_vs_f64m4_f64m1_m(mask, vector, scalar, vl)
+#define __riscv_vfredusum_vs_f64m8_f64m1_m(mask, vector, scalar, vl) __riscv_vfredsum_vs_f64m8_f64m1_m(mask, vector, scalar, vl)
 #define __riscv_vfwredosum_vs_f16m1_f32m1(vector, scalar, vl) __riscv_th_vfwredosum_vs_f16m1_f32m1(vector, scalar, vl)
 #define __riscv_vfwredosum_vs_f16m2_f32m1(vector, scalar, vl) __riscv_th_vfwredosum_vs_f16m2_f32m1(vector, scalar, vl)
 #define __riscv_vfwredosum_vs_f16m4_f32m1(vector, scalar, vl) __riscv_th_vfwredosum_vs_f16m4_f32m1(vector, scalar, vl)
diff --git a/clang/lib/Basic/Targets/RISCV.cpp b/clang/lib/Basic/Targets/RISCV.cpp
@@ -185,8 +185,11 @@ void RISCVTargetInfo::getTargetDefines(const LangOptions &Opts,
     Builder.defineMacro("__riscv_fsqrt");
   }
 
-  if (MinVLen) {
-    Builder.defineMacro("__riscv_v_min_vlen", Twine(MinVLen));
+  auto HasXTHeadVector = ISAInfo->hasExtension("xtheadvector");
+
+  if (MinVLen || HasXTHeadVector) {
+    if (MinVLen)
+      Builder.defineMacro("__riscv_v_min_vlen", Twine(MinVLen));
     Builder.defineMacro("__riscv_v_elen", Twine(MaxELen));
     Builder.defineMacro("__riscv_v_elen_fp", Twine(MaxELenFp));
   }
@@ -200,7 +203,7 @@ void RISCVTargetInfo::getTargetDefines(const LangOptions &Opts,
     Builder.defineMacro("__riscv_v_intrinsic", Twine(getVersionValue(0, 12)));
   }
 
-  if (ISAInfo->hasExtension("xtheadvector")) {
+  if (HasXTHeadVector) {
     // https://github.com/riscv-non-isa/rvv-intrinsic-doc/pull/298/files
     Builder.defineMacro("__riscv_th_v_intrinsic", Twine(getVersionValue(0, 11)));
   }
diff --git a/clang/test/CodeGen/RISCV/rvv0p71-intrinsics-handcrafted/examples/rvv-index.c b/clang/test/CodeGen/RISCV/rvv0p71-intrinsics-handcrafted/examples/rvv-index.c
@@ -0,0 +1,61 @@
+// NOTE: Assertions have been autogenerated by utils/update_cc_test_checks.py UTC_ARGS: --version 2
+// RUN: %clang_cc1 -triple riscv64 -target-feature +xtheadvector \
+// RUN:   -disable-O0-optnone -emit-llvm %s -o - | \
+// RUN:   opt -S -passes=mem2reg | \
+// RUN:   FileCheck --check-prefix=CHECK-IR %s
+
+#include <riscv_vector.h>
+
+// CHECK-IR-LABEL: define dso_local void @index_vec
+// CHECK-IR-SAME: (ptr noundef [[A:%.*]], ptr noundef [[B:%.*]], ptr noundef [[C:%.*]], i32 noundef signext [[N:%.*]]) #[[ATTR0:[0-9]+]] {
+// CHECK-IR-NEXT:  entry:
+// CHECK-IR-NEXT:    [[TMP0:%.*]] = call i64 @llvm.riscv.th.vsetvlmax.i64(i64 2, i64 0)
+// CHECK-IR-NEXT:    [[TMP1:%.*]] = call <vscale x 2 x i32> @llvm.riscv.th.vid.nxv2i32.i64(<vscale x 2 x i32> poison, i64 [[TMP0]])
+// CHECK-IR-NEXT:    br label [[FOR_COND:%.*]]
+// CHECK-IR:       for.cond:
+// CHECK-IR-NEXT:    [[VEC_I_0:%.*]] = phi <vscale x 2 x i32> [ [[TMP1]], [[ENTRY:%.*]] ], [ [[TMP7:%.*]], [[FOR_INC:%.*]] ]
+// CHECK-IR-NEXT:    [[N_ADDR_0:%.*]] = phi i32 [ [[N]], [[ENTRY]] ], [ [[CONV3:%.*]], [[FOR_INC]] ]
+// CHECK-IR-NEXT:    [[C_ADDR_0:%.*]] = phi ptr [ [[C]], [[ENTRY]] ], [ [[ADD_PTR5:%.*]], [[FOR_INC]] ]
+// CHECK-IR-NEXT:    [[B_ADDR_0:%.*]] = phi ptr [ [[B]], [[ENTRY]] ], [ [[ADD_PTR4:%.*]], [[FOR_INC]] ]
+// CHECK-IR-NEXT:    [[A_ADDR_0:%.*]] = phi ptr [ [[A]], [[ENTRY]] ], [ [[ADD_PTR:%.*]], [[FOR_INC]] ]
+// CHECK-IR-NEXT:    [[CMP:%.*]] = icmp sgt i32 [[N_ADDR_0]], 0
+// CHECK-IR-NEXT:    br i1 [[CMP]], label [[FOR_BODY:%.*]], label [[FOR_END:%.*]]
+// CHECK-IR:       for.body:
+// CHECK-IR-NEXT:    [[CONV:%.*]] = sext i32 [[N_ADDR_0]] to i64
+// CHECK-IR-NEXT:    [[TMP2:%.*]] = call i64 @llvm.riscv.th.vsetvl.i64(i64 [[CONV]], i64 3, i64 1)
+// CHECK-IR-NEXT:    [[TMP3:%.*]] = call <vscale x 2 x double> @llvm.riscv.th.vfwcvt.f.xu.v.nxv2f64.nxv2i32.i64(<vscale x 2 x double> poison, <vscale x 2 x i32> [[VEC_I_0]], i64 [[TMP2]])
+// CHECK-IR-NEXT:    [[TMP4:%.*]] = call <vscale x 2 x double> @llvm.riscv.th.vle.nxv2f64.i64(<vscale x 2 x double> poison, ptr [[B_ADDR_0]], i64 [[TMP2]])
+// CHECK-IR-NEXT:    [[TMP5:%.*]] = call <vscale x 2 x double> @llvm.riscv.th.vle.nxv2f64.i64(<vscale x 2 x double> poison, ptr [[C_ADDR_0]], i64 [[TMP2]])
+// CHECK-IR-NEXT:    [[TMP6:%.*]] = call <vscale x 2 x double> @llvm.riscv.th.vfmadd.nxv2f64.nxv2f64.i64(<vscale x 2 x double> [[TMP5]], <vscale x 2 x double> [[TMP3]], <vscale x 2 x double> [[TMP4]], i64 7, i64 [[TMP2]])
+// CHECK-IR-NEXT:    call void @llvm.riscv.th.vse.nxv2f64.i64(<vscale x 2 x double> [[TMP6]], ptr [[A_ADDR_0]], i64 [[TMP2]])
+// CHECK-IR-NEXT:    [[CONV1:%.*]] = trunc i64 [[TMP2]] to i32
+// CHECK-IR-NEXT:    [[TMP7]] = call <vscale x 2 x i32> @llvm.riscv.th.vadd.nxv2i32.i32.i64(<vscale x 2 x i32> poison, <vscale x 2 x i32> [[VEC_I_0]], i32 [[CONV1]], i64 [[TMP2]])
+// CHECK-IR-NEXT:    br label [[FOR_INC]]
+// CHECK-IR:       for.inc:
+// CHECK-IR-NEXT:    [[CONV2:%.*]] = sext i32 [[N_ADDR_0]] to i64
+// CHECK-IR-NEXT:    [[SUB:%.*]] = sub i64 [[CONV2]], [[TMP2]]
+// CHECK-IR-NEXT:    [[CONV3]] = trunc i64 [[SUB]] to i32
+// CHECK-IR-NEXT:    [[ADD_PTR]] = getelementptr inbounds double, ptr [[A_ADDR_0]], i64 [[TMP2]]
+// CHECK-IR-NEXT:    [[ADD_PTR4]] = getelementptr inbounds double, ptr [[B_ADDR_0]], i64 [[TMP2]]
+// CHECK-IR-NEXT:    [[ADD_PTR5]] = getelementptr inbounds double, ptr [[C_ADDR_0]], i64 [[TMP2]]
+// CHECK-IR-NEXT:    br label [[FOR_COND]], !llvm.loop [[LOOP4:![0-9]+]]
+// CHECK-IR:       for.end:
+// CHECK-IR-NEXT:    ret void
+//
+void index_vec(double *a, double *b, double *c, int n) {
+  size_t vlmax = __riscv_vsetvlmax_e32m1();
+  vuint32m1_t vec_i = __riscv_vid_v_u32m1(vlmax);
+  for (size_t vl; n > 0; n -= vl, a += vl, b += vl, c += vl) {
+    vl = __riscv_vsetvl_e64m2(n);
+
+    vfloat64m2_t vec_i_double = __riscv_vfwcvt_f_xu_v_f64m2(vec_i, vl);
+
+    vfloat64m2_t vec_b = __riscv_vle64_v_f64m2(b, vl);
+    vfloat64m2_t vec_c = __riscv_vle64_v_f64m2(c, vl);
+
+    vfloat64m2_t vec_a = __riscv_vfmadd_vv_f64m2(vec_c, vec_i_double, vec_b, vl);
+    __riscv_vse64_v_f64m2(a, vec_a, vl);
+
+    vec_i = __riscv_vadd_vx_u32m1(vec_i, vl, vl);
+  }
+}
diff --git a/clang/test/Preprocessor/riscv-target-features.c b/clang/test/Preprocessor/riscv-target-features.c
@@ -231,6 +231,18 @@
 // CHECK-V0P7-EXT: __riscv_th_v_intrinsic 11000{{$}}
 // CHECK-V0P7-EXT: __riscv_xtheadvector 1000000{{$}}
 
+// RUN: %clang -target riscv32-unknown-linux-gnu \
+// RUN: -march=rv32i_xtheadvector -x c -E -dM %s \
+// RUN: -o - | FileCheck --check-prefix=CHECK-V0P7-EXT-RV32 %s
+// CHECK-V0P7-EXT-RV32: __riscv_v_elen 32
+// CHECK-V0P7-EXT-RV32: __riscv_v_elen_fp 0
+
+// RUN: %clang -target riscv64-unknown-linux-gnu \
+// RUN: -march=rv64i_xtheadvector -x c -E -dM %s \
+// RUN: -o - | FileCheck --check-prefix=CHECK-V0P7-EXT-RV64 %s
+// CHECK-V0P7-EXT-RV64: __riscv_v_elen 64
+// CHECK-V0P7-EXT-RV64: __riscv_v_elen_fp 0
+
 // RUN: %clang -target riscv32-unknown-linux-gnu \
 // RUN: -march=rv32izfhmin1p0 -x c -E -dM %s \
 // RUN: -o - | FileCheck --check-prefix=CHECK-ZFHMIN-EXT %s
diff --git a/llvm/lib/Support/RISCVISAInfo.cpp b/llvm/lib/Support/RISCVISAInfo.cpp
@@ -1199,6 +1199,11 @@ void RISCVISAInfo::updateMinVLen() {
 }
 
 void RISCVISAInfo::updateMaxELen() {
+  if (Exts.count("xtheadvector")) {
+    MaxELen = XLen;
+    MaxELenFp = FLen;
+    return;
+  }
   // handles EEW restriction by sub-extension zve
   for (auto const &Ext : Exts) {
     StringRef ExtName = Ext.first;
diff --git a/llvm/unittests/Support/RISCVISAInfoTest.cpp b/llvm/unittests/Support/RISCVISAInfoTest.cpp
@@ -89,14 +89,28 @@ TEST(ParseNormalizedArchString, AcceptsArbitraryExtensionsAndVersions) {
 }
 
 TEST(ParseNormalizedArchString, UpdatesFLenMinVLenMaxELen) {
-  auto MaybeISAInfo = RISCVISAInfo::parseNormalizedArchString(
-      "rv64i2p0_d2p0_zvl64b1p0_zve64d1p0");
-  ASSERT_THAT_EXPECTED(MaybeISAInfo, Succeeded());
-  RISCVISAInfo &Info = **MaybeISAInfo;
-  EXPECT_EQ(Info.getXLen(), 64U);
-  EXPECT_EQ(Info.getFLen(), 64U);
-  EXPECT_EQ(Info.getMinVLen(), 64U);
-  EXPECT_EQ(Info.getMaxELen(), 64U);
+  {
+    auto MaybeISAInfo = RISCVISAInfo::parseNormalizedArchString(
+        "rv64i2p0_d2p0_zvl64b1p0_zve64d1p0");
+    ASSERT_THAT_EXPECTED(MaybeISAInfo, Succeeded());
+    RISCVISAInfo &Info = **MaybeISAInfo;
+    EXPECT_EQ(Info.getXLen(), 64U);
+    EXPECT_EQ(Info.getFLen(), 64U);
+    EXPECT_EQ(Info.getMinVLen(), 64U);
+    EXPECT_EQ(Info.getMaxELen(), 64U);
+  }
+
+  {
+    auto MaybeISAInfo = RISCVISAInfo::parseNormalizedArchString(
+        "rv64i2p0_d2p0_xtheadvector1p0");
+    ASSERT_THAT_EXPECTED(MaybeISAInfo, Succeeded());
+    RISCVISAInfo &Info = **MaybeISAInfo;
+    EXPECT_EQ(Info.getXLen(), 64U);
+    EXPECT_EQ(Info.getFLen(), 64U);
+    EXPECT_EQ(Info.getMinVLen(), 0U);
+    EXPECT_EQ(Info.getMaxELen(), 64U);
+    EXPECT_EQ(Info.getMaxELenFp(), 64U);
+  }
 }
 
 TEST(ParseArchString, RejectsUpperCase) {

Original file line number	Diff line number	Diff line change
`@@ -185,8 +185,11 @@ void RISCVTargetInfo::getTargetDefines(const LangOptions &Opts,`
`185`	`185`	`Builder.defineMacro("__riscv_fsqrt");`
`186`	`186`	`}`
`187`	`187`
`188`		`- if (MinVLen) {`
`189`		`- Builder.defineMacro("__riscv_v_min_vlen", Twine(MinVLen));`
	`188`	`+ auto HasXTHeadVector = ISAInfo->hasExtension("xtheadvector");`
	`189`	`+`
	`190`	`+ if (MinVLen \|\| HasXTHeadVector) {`
	`191`	`+ if (MinVLen)`
	`192`	`+ Builder.defineMacro("__riscv_v_min_vlen", Twine(MinVLen));`
`190`	`193`	`Builder.defineMacro("__riscv_v_elen", Twine(MaxELen));`
`191`	`194`	`Builder.defineMacro("__riscv_v_elen_fp", Twine(MaxELenFp));`
`192`	`195`	`}`
`@@ -200,7 +203,7 @@ void RISCVTargetInfo::getTargetDefines(const LangOptions &Opts,`
`200`	`203`	`Builder.defineMacro("__riscv_v_intrinsic", Twine(getVersionValue(0, 12)));`
`201`	`204`	`}`
`202`	`205`
`203`		`- if (ISAInfo->hasExtension("xtheadvector")) {`
	`206`	`+ if (HasXTHeadVector) {`
`204`	`207`	`// https://github.com/riscv-non-isa/rvv-intrinsic-doc/pull/298/files`
`205`	`208`	`Builder.defineMacro("__riscv_th_v_intrinsic", Twine(getVersionValue(0, 11)));`
`206`	`209`	`}`