ASR LLM

来自百合仙子's Wiki
跳转到导航 跳转到搜索
识别歌曲《爱人说话》[1]
模型 耗时 内存 错误数
ggml-org/Qwen3-ASR-1.7B-GGUF 3:40.91s 3836 MiB 4
ggml-org/Qwen3-ASR-0.6B-GGUF 2:21.17s 2374 MiB 9
mradermacher/Qwen3-ASR-0.6B-i1-GGUF:Q4_K_M[2] 1:41.22s 2269 MiB 7

脚注

  1. 在i7 7700HQ上运行。命令:time llama-mtmd-cli -hf ggml-org/Qwen3-ASR-1.7B-GGUF --offline --audio a.wav -c 10240 -p "Transcribe this audio exactly."
  2. 使用的mmproj依旧为Q8_0量化