fix LLMAttribution for old pytorch/python versions #1353

DianjingLiu · 2024-09-19T08:35:56Z

Summary:
When setting use_cached_outputs=False, the LLMAttribution failed to run on some old versions of pytorch/python.

Error message

======================================================================
ERROR: test_llm_attr_hf_compatibility_0 (tests.attr.test_llm_attr_hf_compatibility.TestLLMAttrHFCompatibility_1_cpu)
----------------------------------------------------------------------
Traceback (most recent call last):
  File "/home/liudj/local/anaconda3/envs/captum_py38/lib/python3.8/site-packages/parameterized/parameterized.py", line 620, in standalone_func
    return func(*(a + p.args), **p.kwargs, **kw)
  File "/data/users/liudj/captum/tests/attr/test_llm_attr_hf_compatibility.py", line 80, in test_llm_attr_hf_compatibility
    res = llm_attr.attribute(
  File "/data/users/liudj/captum/captum/attr/_core/llm_attr.py", line 461, in attribute
    cur_attr = self.attr_method.attribute(
  File "/data/users/liudj/captum/captum/log/__init__.py", line 52, in wrapper
    return func(*args, **kwargs)
  File "/data/users/liudj/captum/captum/attr/_core/feature_ablation.py", line 292, in attribute
    initial_eval: Union[Tensor, Future[Tensor]] = _run_forward(
  File "/data/users/liudj/captum/captum/_utils/common.py", line 599, in _run_forward
    output = forward_func(
  File "/data/users/liudj/captum/captum/attr/_core/llm_attr.py", line 335, in _forward_func
    outputs = self.model.forward(model_inp, **model_kwargs)
  File "/home/liudj/local/anaconda3/envs/captum_py38/lib/python3.8/site-packages/transformers/models/llama/modeling_llama.py", line 1189, in forward
    outputs = self.model(
  File "/home/liudj/local/anaconda3/envs/captum_py38/lib/python3.8/site-packages/torch/nn/modules/module.py", line 1102, in _call_impl
    return forward_call(*input, **kwargs)
  File "/home/liudj/local/anaconda3/envs/captum_py38/lib/python3.8/site-packages/transformers/models/llama/modeling_llama.py", line 1001, in forward
    layer_outputs = decoder_layer(
  File "/home/liudj/local/anaconda3/envs/captum_py38/lib/python3.8/site-packages/torch/nn/modules/module.py", line 1102, in _call_impl
    return forward_call(*input, **kwargs)
  File "/home/liudj/local/anaconda3/envs/captum_py38/lib/python3.8/site-packages/transformers/models/llama/modeling_llama.py", line 734, in forward
    hidden_states, self_attn_weights, present_key_value = self.self_attn(
  File "/home/liudj/local/anaconda3/envs/captum_py38/lib/python3.8/site-packages/torch/nn/modules/module.py", line 1102, in _call_impl
    return forward_call(*input, **kwargs)
  File "/home/liudj/local/anaconda3/envs/captum_py38/lib/python3.8/site-packages/transformers/models/llama/modeling_llama.py", line 428, in forward
    attn_weights = attn_weights + causal_mask
RuntimeError: The size of tensor a (8) must match the size of tensor b (7) at non-singleton dimension 3

Root cause

The attention_mask was not updated to adapt to the growth of input size. Error message see test plan.

Impacted versions

Python 3.8-3.10, PyTorch 1.10-1.12, transformers 4.44.2
Python 3.8-3.11, PyTorch 1.13-2.1.0, transformers 4.44.2

{F1876426564}

Differential Revision: D63016032

facebook-github-bot · 2024-09-19T08:36:24Z

This pull request was exported from Phabricator. Differential Revision: D63016032

facebook-github-bot · 2024-09-19T08:40:17Z

This pull request was exported from Phabricator. Differential Revision: D63016032

Summary: Pull Request resolved: pytorch#1353 When setting `use_cached_outputs=False`, the `LLMAttribution` failed to run on some old versions of pytorch/python. ## Error message ``` ====================================================================== ERROR: test_llm_attr_hf_compatibility_0 (tests.attr.test_llm_attr_hf_compatibility.TestLLMAttrHFCompatibility_1_cpu) ---------------------------------------------------------------------- Traceback (most recent call last): File "/home/liudj/local/anaconda3/envs/captum_py38/lib/python3.8/site-packages/parameterized/parameterized.py", line 620, in standalone_func return func(*(a + p.args), **p.kwargs, **kw) File "/data/users/liudj/captum/tests/attr/test_llm_attr_hf_compatibility.py", line 80, in test_llm_attr_hf_compatibility res = llm_attr.attribute( File "/data/users/liudj/captum/captum/attr/_core/llm_attr.py", line 461, in attribute cur_attr = self.attr_method.attribute( File "/data/users/liudj/captum/captum/log/__init__.py", line 52, in wrapper return func(*args, **kwargs) File "/data/users/liudj/captum/captum/attr/_core/feature_ablation.py", line 292, in attribute initial_eval: Union[Tensor, Future[Tensor]] = _run_forward( File "/data/users/liudj/captum/captum/_utils/common.py", line 599, in _run_forward output = forward_func( File "/data/users/liudj/captum/captum/attr/_core/llm_attr.py", line 335, in _forward_func outputs = self.model.forward(model_inp, **model_kwargs) File "/home/liudj/local/anaconda3/envs/captum_py38/lib/python3.8/site-packages/transformers/models/llama/modeling_llama.py", line 1189, in forward outputs = self.model( File "/home/liudj/local/anaconda3/envs/captum_py38/lib/python3.8/site-packages/torch/nn/modules/module.py", line 1102, in _call_impl return forward_call(*input, **kwargs) File "/home/liudj/local/anaconda3/envs/captum_py38/lib/python3.8/site-packages/transformers/models/llama/modeling_llama.py", line 1001, in forward layer_outputs = decoder_layer( File "/home/liudj/local/anaconda3/envs/captum_py38/lib/python3.8/site-packages/torch/nn/modules/module.py", line 1102, in _call_impl return forward_call(*input, **kwargs) File "/home/liudj/local/anaconda3/envs/captum_py38/lib/python3.8/site-packages/transformers/models/llama/modeling_llama.py", line 734, in forward hidden_states, self_attn_weights, present_key_value = self.self_attn( File "/home/liudj/local/anaconda3/envs/captum_py38/lib/python3.8/site-packages/torch/nn/modules/module.py", line 1102, in _call_impl return forward_call(*input, **kwargs) File "/home/liudj/local/anaconda3/envs/captum_py38/lib/python3.8/site-packages/transformers/models/llama/modeling_llama.py", line 428, in forward attn_weights = attn_weights + causal_mask RuntimeError: The size of tensor a (8) must match the size of tensor b (7) at non-singleton dimension 3 ``` ## Root cause The `attention_mask` was not updated to adapt to the growth of input size. Error message see test plan. ## Impacted versions - Python 3.8-3.10, PyTorch 1.10-1.12, transformers 4.44.2 - Python 3.8-3.11, PyTorch 1.13-2.1.0, transformers 4.44.2 {F1876426564} Differential Revision: D63016032

facebook-github-bot · 2024-09-19T17:25:49Z

This pull request was exported from Phabricator. Differential Revision: D63016032

Summary: Pull Request resolved: pytorch#1353 When setting `use_cached_outputs=False`, the `LLMAttribution` failed to run on some old versions of pytorch/python. ## Error message ``` ====================================================================== ERROR: test_llm_attr_hf_compatibility_0 (tests.attr.test_llm_attr_hf_compatibility.TestLLMAttrHFCompatibility_1_cpu) ---------------------------------------------------------------------- Traceback (most recent call last): File "/home/liudj/local/anaconda3/envs/captum_py38/lib/python3.8/site-packages/parameterized/parameterized.py", line 620, in standalone_func return func(*(a + p.args), **p.kwargs, **kw) File "/data/users/liudj/captum/tests/attr/test_llm_attr_hf_compatibility.py", line 80, in test_llm_attr_hf_compatibility res = llm_attr.attribute( File "/data/users/liudj/captum/captum/attr/_core/llm_attr.py", line 461, in attribute cur_attr = self.attr_method.attribute( File "/data/users/liudj/captum/captum/log/__init__.py", line 52, in wrapper return func(*args, **kwargs) File "/data/users/liudj/captum/captum/attr/_core/feature_ablation.py", line 292, in attribute initial_eval: Union[Tensor, Future[Tensor]] = _run_forward( File "/data/users/liudj/captum/captum/_utils/common.py", line 599, in _run_forward output = forward_func( File "/data/users/liudj/captum/captum/attr/_core/llm_attr.py", line 335, in _forward_func outputs = self.model.forward(model_inp, **model_kwargs) File "/home/liudj/local/anaconda3/envs/captum_py38/lib/python3.8/site-packages/transformers/models/llama/modeling_llama.py", line 1189, in forward outputs = self.model( File "/home/liudj/local/anaconda3/envs/captum_py38/lib/python3.8/site-packages/torch/nn/modules/module.py", line 1102, in _call_impl return forward_call(*input, **kwargs) File "/home/liudj/local/anaconda3/envs/captum_py38/lib/python3.8/site-packages/transformers/models/llama/modeling_llama.py", line 1001, in forward layer_outputs = decoder_layer( File "/home/liudj/local/anaconda3/envs/captum_py38/lib/python3.8/site-packages/torch/nn/modules/module.py", line 1102, in _call_impl return forward_call(*input, **kwargs) File "/home/liudj/local/anaconda3/envs/captum_py38/lib/python3.8/site-packages/transformers/models/llama/modeling_llama.py", line 734, in forward hidden_states, self_attn_weights, present_key_value = self.self_attn( File "/home/liudj/local/anaconda3/envs/captum_py38/lib/python3.8/site-packages/torch/nn/modules/module.py", line 1102, in _call_impl return forward_call(*input, **kwargs) File "/home/liudj/local/anaconda3/envs/captum_py38/lib/python3.8/site-packages/transformers/models/llama/modeling_llama.py", line 428, in forward attn_weights = attn_weights + causal_mask RuntimeError: The size of tensor a (8) must match the size of tensor b (7) at non-singleton dimension 3 ``` ## Root cause The `attention_mask` was not updated to adapt to the growth of input size. Error message see test plan. ## Impacted versions - Python 3.8-3.10, PyTorch 1.10-1.12, transformers 4.44.2 - Python 3.8-3.11, PyTorch 1.13-2.1.0, transformers 4.44.2 {F1876426564} Reviewed By: vivekmig Differential Revision: D63016032

facebook-github-bot · 2024-09-19T17:30:15Z

This pull request was exported from Phabricator. Differential Revision: D63016032

facebook-github-bot · 2024-09-19T21:01:49Z

This pull request has been merged in fc910e5.

facebook-github-bot added cla signed fb-exported labels Sep 19, 2024

DianjingLiu force-pushed the export-D63016032 branch from 6823dfd to 5b5d99c Compare September 19, 2024 08:40

DianjingLiu force-pushed the export-D63016032 branch from 5b5d99c to 00dab20 Compare September 19, 2024 17:25

DianjingLiu force-pushed the export-D63016032 branch from 00dab20 to 3c16990 Compare September 19, 2024 17:30

facebook-github-bot closed this in fc910e5 Sep 19, 2024

facebook-github-bot added the Merged label Sep 19, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

fix LLMAttribution for old pytorch/python versions #1353

fix LLMAttribution for old pytorch/python versions #1353

Uh oh!

DianjingLiu commented Sep 19, 2024

Uh oh!

facebook-github-bot commented Sep 19, 2024

Uh oh!

facebook-github-bot commented Sep 19, 2024

Uh oh!

facebook-github-bot commented Sep 19, 2024

Uh oh!

facebook-github-bot commented Sep 19, 2024

Uh oh!

facebook-github-bot commented Sep 19, 2024

Uh oh!

Uh oh!

fix LLMAttribution for old pytorch/python versions #1353

fix LLMAttribution for old pytorch/python versions #1353

Uh oh!

Conversation

DianjingLiu commented Sep 19, 2024

Error message

Root cause

Impacted versions

Uh oh!

facebook-github-bot commented Sep 19, 2024

Uh oh!

facebook-github-bot commented Sep 19, 2024

Uh oh!

facebook-github-bot commented Sep 19, 2024

Uh oh!

facebook-github-bot commented Sep 19, 2024

Uh oh!

facebook-github-bot commented Sep 19, 2024

Uh oh!

Uh oh!