AMDGPU: Shrink used number of registers for mfma scale based on format #117047

arsenm · 2024-11-20T20:55:59Z

Currently the builtins assume you are using an 8-bit format that requires
an 8 element vector. We can shrink the number of registers if the format
requires 4 or 6.

arsenm · 2024-11-20T20:56:21Z

This stack of pull requests is managed by Graphite. Learn more about stacking.

llvm#117047) Currently the builtins assume you are using an 8-bit format that requires an 8 element vector. We can shrink the number of registers if the format requires 4 or 6.

This was referenced Nov 20, 2024

AMDGPU: Optimize mfma_scale intrinsics with 0 inputs #116724

Merged

AMDGPU: Add v_mfma_i32_16x16x64_i8 for gfx950 #116728

Merged

AMDGPU: Add basic verification for mfma scale intrinsics #117048

Merged

arsenm requested review from jayfoad, kosarev, pravinjagtap, rampitec, scchan, shiltian and Sisyph November 20, 2024 20:56

arsenm marked this pull request as ready for review November 20, 2024 20:56

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

AMDGPU: Shrink used number of registers for mfma scale based on format #117047

AMDGPU: Shrink used number of registers for mfma scale based on format #117047

Uh oh!

arsenm commented Nov 20, 2024

Uh oh!

arsenm commented Nov 20, 2024 •

edited

Loading

Uh oh!

Uh oh!

AMDGPU: Shrink used number of registers for mfma scale based on format #117047

AMDGPU: Shrink used number of registers for mfma scale based on format #117047

Uh oh!

Conversation

arsenm commented Nov 20, 2024

Uh oh!

arsenm commented Nov 20, 2024 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

Uh oh!

arsenm commented Nov 20, 2024 •

edited

Loading