fix: fix the usage of the code model

Joan Martinez · Joan Martinez · commit 9a65c7a2732b · 2024-05-31T15:21:49.000+02:00
diff --git a/convert-hf-to-gguf.py b/convert-hf-to-gguf.py
@@ -2442,10 +2442,10 @@ def get_tensors(self):
             if 'gated_layer' in name:
                 d1 = data[:self.intermediate_size, :]
                 name1 = name.replace('gated_layers', 'gated_layers_w')
-                name1 = name.replace('up_gated_layer', 'gated_layers_w')
+                name1 = name.replace('up_gated_layer', 'gated_layers_v')
                 d2 = data[self.intermediate_size:, :]
                 name2 = name.replace('gated_layers', 'gated_layers_v')
-                name2 = name.replace('up_gated_layer', 'gated_layers_v')
+                name2 = name.replace('up_gated_layer', 'gated_layers_w')
                 yield name1, d1
                 yield name2, d2
                 continue
diff --git a/llama.cpp b/llama.cpp
@@ -5498,7 +5498,7 @@ static bool llm_load_tensors(
 
                             layer.ffn_down_b = ml.create_tensor(ctx_layer, tn(LLM_TENSOR_FFN_DOWN, "bias", i),   {n_embd});
                         } else {
-                            layer.ffn_gate   = ml.create_tensor(ctx_split, tn(LLM_TENSOR_FFN_GATE, "weight", i), {n_embd,   n_ff});
+                            layer.ffn_gate = ml.create_tensor(ctx_split, tn(LLM_TENSOR_FFN_GATE, "weight", i), {n_embd, n_ff});
                         }
 
                         layer.layer_out_norm   = ml.create_tensor(ctx_layer, tn(LLM_TENSOR_LAYER_OUT_NORM, "weight", i), {n_embd});
@@ -8506,6 +8506,8 @@ struct llm_build_context {
             cur = llm_build_norm(ctx0, cur, hparams, model.layers[il].attn_out_norm, model.layers[il].attn_out_norm_b, LLM_NORM, cb, il);
 
             if (model.layers[il].attn_norm_2 != nullptr) {
+                            // re-add the layer input
+                cur = ggml_add(ctx0, cur, inpL);
                 cur = llm_build_norm(ctx0, cur, hparams, model.layers[il].attn_norm_2, model.layers[il].attn_norm_2_b, LLM_NORM, cb, il);
             }
 

Original file line number	Diff line number	Diff line change
`@@ -5498,7 +5498,7 @@ static bool llm_load_tensors(`
`5498`	`5498`
`5499`	`5499`	`layer.ffn_down_b = ml.create_tensor(ctx_layer, tn(LLM_TENSOR_FFN_DOWN, "bias", i), {n_embd});`
`5500`	`5500`	`} else {`
`5501`		`- layer.ffn_gate = ml.create_tensor(ctx_split, tn(LLM_TENSOR_FFN_GATE, "weight", i), {n_embd, n_ff});`
	`5501`	`+ layer.ffn_gate = ml.create_tensor(ctx_split, tn(LLM_TENSOR_FFN_GATE, "weight", i), {n_embd, n_ff});`
`5502`	`5502`	`}`
`5503`	`5503`
`5504`	`5504`	`layer.layer_out_norm = ml.create_tensor(ctx_layer, tn(LLM_TENSOR_LAYER_OUT_NORM, "weight", i), {n_embd});`
`@@ -8506,6 +8506,8 @@ struct llm_build_context {`
`8506`	`8506`	`cur = llm_build_norm(ctx0, cur, hparams, model.layers[il].attn_out_norm, model.layers[il].attn_out_norm_b, LLM_NORM, cb, il);`
`8507`	`8507`
`8508`	`8508`	`if (model.layers[il].attn_norm_2 != nullptr) {`
	`8509`	`+ // re-add the layer input`
	`8510`	`+ cur = ggml_add(ctx0, cur, inpL);`
`8509`	`8511`	`cur = llm_build_norm(ctx0, cur, hparams, model.layers[il].attn_norm_2, model.layers[il].attn_norm_2_b, LLM_NORM, cb, il);`
`8510`	`8512`	`}`
`8511`	`8513`