英伟达开源了一个超强的语音识别模型:Parakeet TDT 0.6B V2,登顶 OpenASR 榜单。

它能够在 1 秒内实现高质量转录 60 分钟的音频,而且参数仅仅 0.6B,轻松击败了所有主流闭源模型。

模型下载:huggingface.co/nvidia/parakeet-tdt-0.6b-v2
排行榜单: ​​​https://mapp.api.weibo.cn/fx/7f84273be93c84eda435da7c27434606.html
 
 
Back to Top