刚刚,NVIDIA在 Hugging Face 放出了最新的 Audio Flamingo 3 ,完全开源、免费下载、可商用。
这个模型到底有多厉害?它能同时“听懂”人声、环境音和音乐,还能像语言模型一样做推理分析。官方测试直接刷新了 20+ 项音频理解任务的全球基准,领先幅度不是一点点。
最爽的是它的开源策略:开发者可以直接调用,不用担心 API 限额和费用,对做语音识别、声音理解、智能助手、音乐检索的团队来说,这一波能直接节省很大一笔研发成本。

刚刚,NVIDIA在 Hugging Face 放出了最新的 Audio Flamingo 3 ,完全开源、免费下载、可商用。
这个模型到底有多厉害?它能同时“听懂”人声、环境音和音乐,还能像语言模型一样做推理分析。官方测试直接刷新了 20+ 项音频理解任务的全球基准,领先幅度不是一点点。
最爽的是它的开源策略:开发者可以直接调用,不用担心 API 限额和费用,对做语音识别、声音理解、智能助手、音乐检索的团队来说,这一波能直接节省很大一笔研发成本。

作者最新文章
热门分类
科技TOP
科技最新文章