lookup-merge

JohannesGaessler · JohannesGaessler · commit 2c70d7952911 · 2024-02-18T15:42:25.000+01:00
diff --git a/Makefile b/Makefile
@@ -746,6 +746,8 @@ lookup: examples/lookup/lookup.cpp ggml.o llama.o $(COMMON_DEPS) $(OBJS)
 	$(CXX) $(CXXFLAGS) $(filter-out %.h $<,$^) $(call GET_OBJ_FILE, $<) -o $@ $(LDFLAGS)
 	$(CXX) $(CXXFLAGS) -c examples/lookup/lookup-create.cpp -o $(call GET_OBJ_FILE, examples/lookup/lookup-create.cpp)
 	$(CXX) $(CXXFLAGS) $(filter-out %.h $<,$^) $(call GET_OBJ_FILE, examples/lookup/lookup-create.cpp) -o lookup-create $(LDFLAGS)
+	$(CXX) $(CXXFLAGS) -c examples/lookup/lookup-merge.cpp -o $(call GET_OBJ_FILE, examples/lookup/lookup-merge.cpp)
+	$(CXX) $(CXXFLAGS) $(filter-out %.h $<,$^) $(call GET_OBJ_FILE, examples/lookup/lookup-merge.cpp) -o lookup-merge $(LDFLAGS)
 	$(CXX) $(CXXFLAGS) -c examples/lookup/lookup-stats.cpp -o $(call GET_OBJ_FILE, examples/lookup/lookup-stats.cpp)
 	$(CXX) $(CXXFLAGS) $(filter-out %.h $<,$^) $(call GET_OBJ_FILE, examples/lookup/lookup-stats.cpp) -o lookup-stats $(LDFLAGS)
 
diff --git a/examples/lookup/lookup-create.cpp b/examples/lookup/lookup-create.cpp
@@ -1,5 +1,4 @@
 #include "common.h"
-#include "common/common.h"
 #include "ggml.h"
 #include "llama.h"
 
diff --git a/examples/lookup/lookup-merge.cpp b/examples/lookup/lookup-merge.cpp
@@ -0,0 +1,69 @@
+#include "common.h"
+#include "common/common.h"
+#include "ggml.h"
+#include "llama.h"
+
+#include <cstdint>
+#include <cstdio>
+#include <fstream>
+#include <iostream>
+#include <string>
+#include <unordered_map>
+#include <vector>
+
+static void print_usage() {
+    fprintf(stderr, "Merges multiple lookup cache files into a single one.\n");
+    fprintf(stderr, "Usage: lookup-merge [--help] lookup_part_1.bin lookup_part_2.bin ... lookup_merged.bin\n");
+}
+
+int main(int argc, char ** argv){
+    if (argc < 3) {
+        print_usage();
+        exit(1);
+    }
+
+    std::vector<std::string> args;
+    args.resize(argc-1);
+    for (int i = 0; i < argc-1; ++i) {
+        args[i] = argv[i+1];
+        if (args[i] == "-h" || args[i] == "--help") {
+            print_usage();
+            exit(0);
+        }
+    }
+
+    std::vector<llama_ngram_cache> ngram_cache_merged;
+    ngram_cache_merged.push_back(llama_ngram_cache_load(args[0]));
+
+    for (size_t i = 1; i < args.size()-1; ++i) {
+        fprintf(stderr, "lookup-merge: loading file %s\n", args[i].c_str());
+        llama_ngram_cache ngram_cache = llama_ngram_cache_load(args[i]);
+
+        for (std::pair<uint64_t, llama_ngram_cache_part> ngram_part : ngram_cache) {
+            const uint64_t         ngram = ngram_part.first;
+            llama_ngram_cache_part  part = ngram_part.second;
+
+            llama_ngram_cache::iterator part_merged_it = ngram_cache_merged[0].find(ngram);
+            if (part_merged_it == ngram_cache_merged[0].end()) {
+                ngram_cache_merged[0].emplace(ngram, part);
+                continue;
+            }
+
+            for (std::pair<llama_token, int32_t> token_count : part) {
+                const llama_token token = token_count.first;
+                const int32_t     count = token_count.second;
+
+                llama_ngram_cache_part::iterator token_count_merged_it = part_merged_it->second.find(token);
+                if (token_count_merged_it == part_merged_it->second.end()) {
+                    part_merged_it->second.emplace(token, count);
+                    continue;
+                } else {
+                    token_count_merged_it->second += count;
+                }
+            }
+        }
+    }
+
+    fprintf(stderr, "lookup-merge: saving file %s\n", args.back().c_str());
+    llama_ngram_cache_save(ngram_cache_merged, args.back());
+}

Original file line number	Diff line number	Diff line change
`@@ -1,5 +1,4 @@`
`1`	`1`	`#include "common.h"`
`2`		`-#include "common/common.h"`
`3`	`2`	`#include "ggml.h"`
`4`	`3`	`#include "llama.h"`
`5`	`4`