[WIP] Load text_model.embeddings.position_ids outsude state_dict #3829

StAlKeR7779 · 2023-07-19T01:21:47Z

What type of PR is this? (check all applicable)

Description

In transformers 4.31.0 text_model.embeddings.position_ids no longer part of state_dict.
Fix untested as can't run right now but should be correct. Also need to check how transformers 4.30.2 works with this fix.

Related Tickets & Documents

huggingface/transformers@8e5d161#diff-7f53db5caa73a4cbeb0dca3b396e3d52f30f025b8c48d4daf51eb7abb6e2b949R191
https://pytorch.org/docs/stable/generated/torch.nn.Module.html#torch.nn.Module.register_buffer

QA Instructions, Screenshots, Recordings

  File "C:\Users\artis\Documents\invokeai\.venv\lib\site-packages\invokeai\backend\model_management\convert_ckpt_to_diffusers.py", line 844, in convert_ldm_clip_checkpoint
    text_model.load_state_dict(text_model_dict)
  File "C:\Users\artis\Documents\invokeai\.venv\lib\site-packages\torch\nn\modules\module.py", line 2041, in load_state_dict
    raise RuntimeError('Error(s) in loading state_dict for {}:\n\t{}'.format(
RuntimeError: Error(s) in loading state_dict for CLIPTextModel:
        Unexpected key(s) in state_dict: "text_model.embeddings.position_ids".

lstein · 2023-07-19T02:04:47Z

The patch seems to work with 4.31.0. However there is a reproducible error in the logs during the conversion process:

Task exception was never retrieved
future: <Task finished name='Task-1053' coro=<AsyncServer._emit_internal() done, defined at /home/lstein/invokeai-main/.venv/lib/python3.10/site-packages/socketio/asyncio_server.py:427> exception=TypeError('Object of type PosixPath is not JSON serializable')>
Traceback (most recent call last):
  File "/home/lstein/invokeai-main/.venv/lib/python3.10/site-packages/socketio/asyncio_server.py", line 437, in _emit_internal
    await self._send_packet(sid, self.packet_class(
  File "/home/lstein/invokeai-main/.venv/lib/python3.10/site-packages/socketio/asyncio_server.py", line 442, in _send_packet
    encoded_packet = pkt.encode()
  File "/home/lstein/invokeai-main/.venv/lib/python3.10/site-packages/socketio/packet.py", line 64, in encode
    encoded_packet += self.json.dumps(data, separators=(',', ':'))
  File "/usr/lib/python3.10/json/__init__.py", line 238, in dumps
    **kw).encode(obj)
  File "/usr/lib/python3.10/json/encoder.py", line 199, in encode
    chunks = self.iterencode(o, _one_shot=True)
  File "/usr/lib/python3.10/json/encoder.py", line 257, in iterencode
    return _iterencode(o, 0)
  File "/usr/lib/python3.10/json/encoder.py", line 179, in default
    raise TypeError(f'Object of type {o.__class__.__name__} '
TypeError: Object of type PosixPath is not JSON serializable

My guess is that this is related to a bad model manager event. I will investigate.

lstein · 2023-07-19T02:04:58Z

As expected, the patch does not work when used with transformers 4.30.2:

  File "/home/lstein/Projects/InvokeAI-main/invokeai/app/services/processor.py", line 70, in __process
    outputs = invocation.invoke(
  File "/home/lstein/invokeai-main/.venv/lib/python3.10/site-packages/torch/utils/_contextlib.py", line 115, in decorate_context
    return func(*args, **kwargs)
  File "/home/lstein/Projects/InvokeAI-main/invokeai/app/invocations/compel.py", line 88, in invoke
    tokenizer_info = context.services.model_manager.get_model(
  File "/home/lstein/Projects/InvokeAI-main/invokeai/app/services/model_manager_service.py", line 359, in get_model
    model_info = self.mgr.get_model(
  File "/home/lstein/Projects/InvokeAI-main/invokeai/backend/model_management/model_manager.py", line 472, in get_model
    model_path = model_class.convert_if_required(
  File "/home/lstein/Projects/InvokeAI-main/invokeai/backend/model_management/models/stable_diffusion.py", line 120, in convert_if_required
    return _convert_ckpt_and_cache(
  File "/home/lstein/Projects/InvokeAI-main/invokeai/backend/model_management/models/stable_diffusion.py", line 293, in _convert_ckpt_and_cache
    convert_ckpt_to_diffusers(
  File "/home/lstein/Projects/InvokeAI-main/invokeai/backend/model_management/convert_ckpt_to_diffusers.py", line 1149, in convert_ckpt_to_diffusers
    pipe = load_pipeline_from_original_stable_diffusion_ckpt(checkpoint_path, **kwargs)
  File "/home/lstein/Projects/InvokeAI-main/invokeai/backend/model_management/convert_ckpt_to_diffusers.py", line 1109, in load_pipeline_from_original_stable_diffusion_ckpt
    text_model = convert_ldm_clip_checkpoint(checkpoint)
  File "/home/lstein/Projects/InvokeAI-main/invokeai/backend/model_management/convert_ckpt_to_diffusers.py", line 845, in convert_ldm_clip_checkpoint
    text_model.load_state_dict(text_model_dict)
  File "/home/lstein/invokeai-main/.venv/lib/python3.10/site-packages/torch/nn/modules/module.py", line 2041, in load_state_dict
    raise RuntimeError('Error(s) in loading state_dict for {}:\n\t{}'.format(
RuntimeError: Error(s) in loading state_dict for CLIPTextModel:
	Missing key(s) in state_dict: "text_model.embeddings.position_ids".

I've put in a try: block which tries fetching the state dict first without the key and then with the key added back in. I think this is marginally better than checking the module version number, since the transformers team might put the key back into the next version.

lstein

Tested with both 4.31.0 and 4.30.2 and seems to be working as expected.

Load text_model.embeddings.position_ids outsude state_dict

0aa7193

StAlKeR7779 requested review from GreggHelt2, blessedcoolant, brandonrising, damian0815 and lstein as code owners July 19, 2023 01:21

blessedcoolant approved these changes Jul 19, 2023

View reviewed changes

fix Object of type PosixPath is not JSON serializable error

f29bafd

lstein requested review from Kyle0654 and psychedelicious as code owners July 19, 2023 02:10

make convert work with both 4.30.2 and 4.31.0

a690cca

lstein approved these changes Jul 19, 2023

View reviewed changes

Support both pre and post 4.31.0 transformers

2e7fc05

lstein enabled auto-merge July 19, 2023 13:35

Merge branch 'main' into fix/transformers_4_31_0

9c3a556

lstein disabled auto-merge July 19, 2023 13:36

lstein enabled auto-merge July 19, 2023 13:37

lstein disabled auto-merge July 19, 2023 13:38

allow upgrade to transformers~=4.31.0

f932047

lstein enabled auto-merge July 19, 2023 13:46

lstein merged commit aca5c6d into main Jul 19, 2023

lstein deleted the fix/transformers_4_31_0 branch July 19, 2023 13:58

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

[WIP] Load text_model.embeddings.position_ids outsude state_dict #3829

[WIP] Load text_model.embeddings.position_ids outsude state_dict #3829

Uh oh!

StAlKeR7779 commented Jul 19, 2023

Uh oh!

lstein commented Jul 19, 2023

Uh oh!

lstein commented Jul 19, 2023 •

edited

Loading

Uh oh!

lstein left a comment

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

4 participants

[WIP] Load text_model.embeddings.position_ids outsude state_dict #3829

[WIP] Load text_model.embeddings.position_ids outsude state_dict #3829

Uh oh!

Conversation

StAlKeR7779 commented Jul 19, 2023

What type of PR is this? (check all applicable)

Description

Related Tickets & Documents

QA Instructions, Screenshots, Recordings

Uh oh!

lstein commented Jul 19, 2023

Uh oh!

lstein commented Jul 19, 2023 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

lstein left a comment

Choose a reason for hiding this comment

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

4 participants

lstein commented Jul 19, 2023 •

edited

Loading