add-kimi-audio-snippet (#1429)

Deep-unlearning · Deep-Unlearning · Wauplin · web-flow · commit 281287b6cb42 · 2025-05-20T17:52:08.000+02:00
Waiting these two PR to be merged: https://huggingface.co/moonshotai/Kimi-Audio-7B/discussions/2 https://huggingface.co/moonshotai/Kimi-Audio-7B-Instruct/discussions/13 --------- Co-authored-by: Deep-Unlearning <steven@macbook-pro-de-steven.taildb5d.ts.net> Co-authored-by: Lucain <lucain@huggingface.co> Co-authored-by: vb <vaibhavs10@gmail.com>
diff --git a/packages/tasks/src/model-libraries-snippets.ts b/packages/tasks/src/model-libraries-snippets.ts
@@ -593,6 +593,39 @@ export const keras_hub = (model: ModelData): string[] => {
 	return snippets;
 };
 
+export const kimi_audio = (model: ModelData): string[] => [
+	`# Example usage for KimiAudio
+# pip install git+https://github.com/MoonshotAI/Kimi-Audio.git
+
+from kimia_infer.api.kimia import KimiAudio
+
+model = KimiAudio(model_path="${model.id}", load_detokenizer=True)
+
+sampling_params = {
+    "audio_temperature": 0.8,
+    "audio_top_k": 10,
+    "text_temperature": 0.0,
+    "text_top_k": 5,
+}
+
+# For ASR
+asr_audio = "asr_example.wav"
+messages_asr = [
+    {"role": "user", "message_type": "text", "content": "Please transcribe the following audio:"},
+    {"role": "user", "message_type": "audio", "content": asr_audio}
+]
+_, text = model.generate(messages_asr, **sampling_params, output_type="text")
+print(text)
+
+# For Q&A
+qa_audio = "qa_example.wav"
+messages_conv = [{"role": "user", "message_type": "audio", "content": qa_audio}]
+wav, text = model.generate(messages_conv, **sampling_params, output_type="both")
+sf.write("output_audio.wav", wav.cpu().view(-1).numpy(), 24000)
+print(text)
+`,
+];
+
 export const lightning_ir = (model: ModelData): string[] => {
 	if (model.tags.includes("bi-encoder")) {
 		return [
diff --git a/packages/tasks/src/model-libraries.ts b/packages/tasks/src/model-libraries.ts
@@ -473,6 +473,13 @@ export const MODEL_LIBRARIES_UI_ELEMENTS = {
 		snippets: snippets.keras_hub,
 		filter: true,
 	},
+	"kimi-audio": {
+		prettyLabel: "KimiAudio",
+		repoName: "KimiAudio",
+		repoUrl: "https://github.com/MoonshotAI/Kimi-Audio",
+		snippets: snippets.kimi_audio,
+		filter: false,
+	},
 	k2: {
 		prettyLabel: "K2",
 		repoName: "k2",