Gemini刚更新了最新的0506版本,训练数据截止到25年一月份,真勤快啊,然后我又可以提前用,vertex不用也能提前用[喵喵] ​​​https://mapp.api.weibo.cn/fx/1cc45586380c9c5a8bb77cff61eb8499.html
https://x.com/frostming90/status/1919429625790284067?s=46&t=rA_7EMcK9LnAsVTcD4VODA

在深夜看到这条消息,此时我为这位陌生人和他女儿泪流满面。
英伟达开源了一个超强的语音识别模型:Parakeet TDT 0.6B V2,登顶 OpenASR 榜单。

它能够在 1 秒内实现高质量转录 60 分钟的音频,而且参数仅仅 0.6B,轻松击败了所有主流闭源模型。

模型下载:huggingface.co/nvidia/parakeet-tdt-0.6b-v2
排行榜单: ​​​https://mapp.api.weibo.cn/fx/7f84273be93c84eda435da7c27434606.html
【Parakeet TDT 0.6B V2 (En):Nvidia开源的超强语音识别模型,能在1秒内转录60分钟音频,效率惊人!亮点:1. 6亿参数,性能强大;2. 采用CC-BY-4.0许可,商业使用友好;3. 轻松超越主流闭源巨头】
'Nvidia just open sourced Parakeet TDT 0.6B - the BEST Speech Recognition model on Open ASR Le ​​​https://mapp.api.weibo.cn/fx/5a26184797c067ec3361aca1ea07074f.html
Back to Top