Skip to main content

kimi现在开始玩开源了,这几个月也动作频出,刚刚发布了一个开源的voice模型,支持tts,stt,speech2speech等多种任务,encoder用的直接是whisper,然后多个模态融合,有机会可以测试一下,模型不大7b