acshame
09:49 · 2025年4月26日 · 周六
kimi现在开始玩开源了,这几个月也动作频出,刚刚发布了一个开源的voice模型,支持tts,stt,speech2speech等多种任务,encoder用的直接是whisper,然后多个模态融合,有机会可以测试一下,模型不大7b
http://t.cn/A6dM292B
https://mapp.api.weibo.cn/fx/c28ca207cf2b528076b6eea5e373a997.html
Home
Powered by
BroadcastChannel
&
Sepia