Helper scripts for ProMoE

Train predict model

We already provided example trained predict models in moe-predict-models folder.

You can also train your own predict models by following the instructions below.

# collect logits using llama.cpp. 
# you may need to let llama.cpp to offload some layers to CPU for memory constrained GPUs, using `--gpu-layers` option.
SPARSE_CACHE_ENABLE_TRACE=0 /code/moe/llama.cpp/build/bin/llama-parallel  \
    -m /code/huggingface-gguf/DeepSeek-V2-Lite-Chat/f16/main.gguf \
    -ngl 80 -ub 2048 -nocb -ns 10000 -n 512  -c 2048 \
    -f /code/sparse-llm-cache-scripts/dataset/chatgpt-prompts/prompt_list.txt \
    --moe-cache 0 --expert_buft 0 -fa --delay-escape \
    --trace-logits 1 --trace-num-entries 100000 \
    --trace-dump-path /code/moe/moe-traces/logits-traces/DeepSeek-V2-Lite-Chat-chatgpt-prompts

# train predict model from above traces
python3 train_predict_model.py \
    --logits_path /code/moe/moe-traces/logits-traces/DeepSeek-V2-Lite-Chat-chatgpt-prompts \
    --predict_model_path /code/sparse-llm-cache-scripts/moe-predict-models/models--deepseek-ai--DeepSeek-V2-Lite-Chat \
    --predict_output gate \
    --print_loss \
    --threshold 0.0005 \
    --window 4 \
    --lr 0.0005 \
    --input_norm_method std

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
dataset		dataset
huggingface-modules/modules/transformers_modules/deepseek-ai		huggingface-modules/modules/transformers_modules/deepseek-ai
moe-predict-models/models--deepseek-ai--DeepSeek-V2-Lite-Chat-example		moe-predict-models/models--deepseek-ai--DeepSeek-V2-Lite-Chat-example
train-predict-model		train-predict-model
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Helper scripts for ProMoE

Train predict model

About

Uh oh!

Releases

Packages

Languages

promoe-opensource/sparse-llm-cache-scripts

Folders and files

Latest commit

History

Repository files navigation

Helper scripts for ProMoE

Train predict model

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages