AMDGPU: Simplify demanded vector elts of readfirstlane sources #128646

arsenm · 2025-02-25T07:42:51Z

Stub implementation of simplifyDemandedVectorEltsIntrinsic for
readfirstlane.

arsenm · 2025-02-25T07:43:07Z

This stack of pull requests is managed by Graphite. Learn more about stacking.

llvmbot · 2025-02-25T07:44:10Z

@llvm/pr-subscribers-llvm-transforms

@llvm/pr-subscribers-backend-amdgpu

Author: Matt Arsenault (arsenm)

Changes

Stub implementation of simplifyDemandedVectorEltsIntrinsic for
readfirstlane.

Full diff: https://github.com/llvm/llvm-project/pull/128646.diff

2 Files Affected:

(modified) llvm/lib/Target/AMDGPU/AMDGPUInstCombineIntrinsic.cpp (+4)
(modified) llvm/test/Transforms/InstCombine/AMDGPU/simplify-demanded-vector-elts-lane-intrinsics.ll (+3-8)

diff --git a/llvm/lib/Target/AMDGPU/AMDGPUInstCombineIntrinsic.cpp b/llvm/lib/Target/AMDGPU/AMDGPUInstCombineIntrinsic.cpp
index ebc00e59584ac..617974713d6f0 100644
--- a/llvm/lib/Target/AMDGPU/AMDGPUInstCombineIntrinsic.cpp
+++ b/llvm/lib/Target/AMDGPU/AMDGPUInstCombineIntrinsic.cpp
@@ -1544,6 +1544,10 @@ std::optional<Value *> GCNTTIImpl::simplifyDemandedVectorEltsIntrinsic(
     std::function<void(Instruction *, unsigned, APInt, APInt &)>
         SimplifyAndSetOp) const {
   switch (II.getIntrinsicID()) {
+  case Intrinsic::amdgcn_readfirstlane:
+    // TODO: For a vector extract, should reduce the intrinsic call type.
+    SimplifyAndSetOp(&II, 0, DemandedElts, UndefElts);
+    return std::nullopt;
   case Intrinsic::amdgcn_raw_buffer_load:
   case Intrinsic::amdgcn_raw_ptr_buffer_load:
   case Intrinsic::amdgcn_raw_buffer_load_format:
diff --git a/llvm/test/Transforms/InstCombine/AMDGPU/simplify-demanded-vector-elts-lane-intrinsics.ll b/llvm/test/Transforms/InstCombine/AMDGPU/simplify-demanded-vector-elts-lane-intrinsics.ll
index 83d9d0d032ed1..836c739048411 100644
--- a/llvm/test/Transforms/InstCombine/AMDGPU/simplify-demanded-vector-elts-lane-intrinsics.ll
+++ b/llvm/test/Transforms/InstCombine/AMDGPU/simplify-demanded-vector-elts-lane-intrinsics.ll
@@ -306,10 +306,9 @@ define <2 x i16> @extract_elt13_v4i16readfirstlane(<4 x i16> %src) {
 define <2 x i32> @extract_elt13_v4i32_readfirstlane_source_simplify0(i32 %src0, i32 %src2) {
 ; CHECK-LABEL: define <2 x i32> @extract_elt13_v4i32_readfirstlane_source_simplify0(
 ; CHECK-SAME: i32 [[SRC0:%.*]], i32 [[SRC2:%.*]]) #[[ATTR0]] {
-; CHECK-NEXT:    [[INS_0:%.*]] = insertelement <4 x i32> poison, i32 [[SRC0]], i64 0
-; CHECK-NEXT:    [[INS_1:%.*]] = shufflevector <4 x i32> [[INS_0]], <4 x i32> poison, <4 x i32> <i32 0, i32 0, i32 poison, i32 poison>
+; CHECK-NEXT:    [[INS_1:%.*]] = insertelement <4 x i32> poison, i32 [[SRC0]], i64 1
 ; CHECK-NEXT:    [[VEC:%.*]] = call <4 x i32> @llvm.amdgcn.readfirstlane.v4i32(<4 x i32> [[INS_1]])
-; CHECK-NEXT:    [[SHUFFLE:%.*]] = shufflevector <4 x i32> [[VEC]], <4 x i32> poison, <2 x i32> <i32 1, i32 3>
+; CHECK-NEXT:    [[SHUFFLE:%.*]] = shufflevector <4 x i32> [[VEC]], <4 x i32> poison, <2 x i32> <i32 1, i32 poison>
 ; CHECK-NEXT:    ret <2 x i32> [[SHUFFLE]]
 ;
   %ins.0 = insertelement <4 x i32> poison, i32 %src0, i32 0
@@ -338,11 +337,7 @@ define < 2 x i32> @extract_elt13_v4i32_readfirstlane_source_simplify1(i32 %src0,
 define < 2 x i32> @extract_elt13_v4i32_readfirstlane_source_simplify2(i32 %src0, i32 %src2) {
 ; CHECK-LABEL: define <2 x i32> @extract_elt13_v4i32_readfirstlane_source_simplify2(
 ; CHECK-SAME: i32 [[SRC0:%.*]], i32 [[SRC2:%.*]]) #[[ATTR0]] {
-; CHECK-NEXT:    [[INS_0:%.*]] = insertelement <4 x i32> poison, i32 [[SRC0]], i64 0
-; CHECK-NEXT:    [[INS_1:%.*]] = shufflevector <4 x i32> [[INS_0]], <4 x i32> poison, <4 x i32> <i32 0, i32 poison, i32 0, i32 poison>
-; CHECK-NEXT:    [[VEC:%.*]] = call <4 x i32> @llvm.amdgcn.readfirstlane.v4i32(<4 x i32> [[INS_1]])
-; CHECK-NEXT:    [[SHUFFLE:%.*]] = shufflevector <4 x i32> [[VEC]], <4 x i32> poison, <2 x i32> <i32 1, i32 3>
-; CHECK-NEXT:    ret <2 x i32> [[SHUFFLE]]
+; CHECK-NEXT:    ret <2 x i32> poison
 ;
   %ins.0 = insertelement <4 x i32> poison, i32 %src0, i32 0
   %ins.1 = insertelement <4 x i32> %ins.0, i32 %src0, i32 2

pravinjagtap

LGTM

arsenm · 2025-02-28T05:52:00Z

Merge activity

Feb 28, 12:52 AM EST: A user started a stack merge that includes this pull request via Graphite.
Feb 28, 12:58 AM EST: Graphite rebased this pull request as part of a merge.
Feb 28, 1:01 AM EST: A user merged this pull request with Graphite.

Stub implementation of simplifyDemandedVectorEltsIntrinsic for readfirstlane.

…128646) Stub implementation of simplifyDemandedVectorEltsIntrinsic for readfirstlane.

arsenm mentioned this pull request Feb 25, 2025

AMDGPU: Add baseline tests for simplify elts of readfirstlane #128645

Merged

This was referenced Feb 25, 2025

AMDGPU: Reduce readfirstlane for single demanded vector element #128647

Merged

AMDGPU: Handle demanded subvectors for readfirstlane #128648

Merged

arsenm added the backend:AMDGPU label Feb 25, 2025 — with Graphite App

arsenm requested review from cdevadas, jayfoad, Pierre-vh, pravinjagtap, rampitec, rovka, shiltian, Sisyph and vikramRH February 25, 2025 07:44

arsenm marked this pull request as ready for review February 25, 2025 07:44

llvmbot added llvm:instcombine Covers the InstCombine, InstSimplify and AggressiveInstCombine passes llvm:transforms labels Feb 25, 2025

pravinjagtap mentioned this pull request Feb 25, 2025

[AMDGPU][NFC] Added test for live-in CSR SGPR used partially giving MachineVerifier error #126696

Merged

pravinjagtap approved these changes Feb 25, 2025

View reviewed changes

arsenm force-pushed the users/arsenm/amdgpu/add-baseline-tests-simplify-demanded-vector-elts-readfirstlane branch from fe33057 to 859a8cb Compare February 28, 2025 05:54

Base automatically changed from users/arsenm/amdgpu/add-baseline-tests-simplify-demanded-vector-elts-readfirstlane to main February 28, 2025 05:57

AMDGPU: Simplify demanded vector elts of readfirstlane sources

e32caff

Stub implementation of simplifyDemandedVectorEltsIntrinsic for readfirstlane.

arsenm force-pushed the users/arsenm/amdgpu/simplify-demanded-vector-elts-readfirstlane-src branch from ca0b3a4 to e32caff Compare February 28, 2025 05:57

arsenm merged commit d410f09 into main Feb 28, 2025
6 of 10 checks passed

arsenm deleted the users/arsenm/amdgpu/simplify-demanded-vector-elts-readfirstlane-src branch February 28, 2025 06:01

cheezeburglar pushed a commit to cheezeburglar/llvm-project that referenced this pull request Feb 28, 2025

AMDGPU: Simplify demanded vector elts of readfirstlane sources (llvm#…

60224c3

…128646) Stub implementation of simplifyDemandedVectorEltsIntrinsic for readfirstlane.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

AMDGPU: Simplify demanded vector elts of readfirstlane sources #128646

AMDGPU: Simplify demanded vector elts of readfirstlane sources #128646

Uh oh!

arsenm commented Feb 25, 2025

Uh oh!

arsenm commented Feb 25, 2025 •

edited

Loading

Uh oh!

llvmbot commented Feb 25, 2025 •

edited

Loading

Uh oh!

pravinjagtap left a comment

Uh oh!

arsenm commented Feb 28, 2025 •

edited

Loading

Uh oh!

Uh oh!

Uh oh!

AMDGPU: Simplify demanded vector elts of readfirstlane sources #128646

AMDGPU: Simplify demanded vector elts of readfirstlane sources #128646

Uh oh!

Conversation

arsenm commented Feb 25, 2025

Uh oh!

arsenm commented Feb 25, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

llvmbot commented Feb 25, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

pravinjagtap left a comment

Choose a reason for hiding this comment

Uh oh!

arsenm commented Feb 28, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Merge activity

Uh oh!

Uh oh!

Uh oh!

arsenm commented Feb 25, 2025 •

edited

Loading

llvmbot commented Feb 25, 2025 •

edited

Loading

arsenm commented Feb 28, 2025 •

edited

Loading