kimi现在开始玩开源了,这几个月也动作频出,刚刚发布了一个开源的voice模型,支持tts,stt,speech2speech等多种任务,encoder用的直接是whisper,然后多个模态融合,有机会可以测试一下,模型不大7b http://t.cn/A6dM292B ​​​https://mapp.api.weibo.cn/fx/c28ca207cf2b528076b6eea5e373a997.html
 
 
Back to Top