Do not use defaultdict

tdakhran · tdakhran · commit fe3b8129c256 · 2025-10-07T17:20:09.000+02:00
diff --git a/convert_hf_to_gguf.py b/convert_hf_to_gguf.py
@@ -11,7 +11,6 @@
 import os
 import re
 import sys
-from collections import defaultdict
 from enum import IntEnum
 from pathlib import Path
 from hashlib import sha256
@@ -8859,7 +8858,7 @@ def set_gguf_parameters(self):
         self.gguf_writer.add_shortconv_l_cache(self.hparams["conv_L_cache"])
 
     # cache for experts weights for merging
-    _experts_cache: dict[int, dict[str, Tensor]] | None = defaultdict(lambda: defaultdict(dict))
+    _experts_cache: dict[int, dict[str, Tensor]] = {}
 
     def modify_tensors(self, data_torch: Tensor, name: str, bid: int | None) -> Iterable[tuple[str, Tensor]]:
         # conv op requires 2d tensor
@@ -8871,6 +8870,8 @@ def modify_tensors(self, data_torch: Tensor, name: str, bid: int | None) -> Iter
             n_experts = self.hparams["num_experts"]
             assert bid is not None
 
+            if bid not in self._experts_cache:
+                self._experts_cache[bid] = {}
             self._experts_cache[bid][name] = data_torch
             expert_weights = ["w1", "w2", "w3"]