
8月22日,Meta官网宣布推出一体化的多模式和多语言人工智能翻译模型SeamlessM4T,支持语音识别、语音转文本、语音转语音、文本转文本、文本转语音翻译,可执行近 100 种语言的语音与文本翻译。基于该人工智能的生成式语言翻译服务可以实现客户和提供商之间的无缝沟通,打破语言障碍并将生意覆盖范围扩大到不同的市场。
8月22日,Meta官网宣布推出一体化的多模式和多语言人工智能翻译模型SeamlessM4T,支持语音识别、语音转文本、语音转语音、文本转文本、文本转语音翻译,可执行近 100 种语言的语音与文本翻译。基于该人工智能的生成式语言翻译服务可以实现客户和提供商之间的无缝沟通,打破语言障碍并将生意覆盖范围扩大到不同的市场。
Meta官网消息显示,SeamlessM4T 的优势之一是其单一系统方法,可通过减少翻译过程中的错误和延迟来提高效率和质量。且SeamlessM4T 根据研究许可公开发布,研究人员和开发人员也能够利用模型的功能。
连同语音和文本翻译 AI 模型SeamlessM4T一起发布的还有SeamlessAlign 的元数据——一个开放的多模式翻译数据集,其中包括 270,000 小时的挖掘语音和文本对齐。该数据集将作为该领域未来研究和开发的资源。
据了解,SeamlessM4T 建立在 Meta 先前在语言翻译技术方面的进步之上。2022年该公司发布了 一种支持 200 种语言的文本到文本机器翻译模型No Language Left Behind (NLLB),后作为翻译提供商之一并入维基百科。SeamlessM4T 便是在NLLB的模型基础上升级而来。
Meta 还展示了通用语音翻译器,这是第一个针对闽南语的直接语音到语音翻译系统。今年早些时候,Meta 推出了 Massively Multilingual Speech,提供涵盖 1,100 多种语言的语音识别、语言识别和语音合成技术。另有消息称Meta 正在致力于利用人工智能创建通用语言翻译并改善与语音助手的口语交互。
Meta表示,整体上SeamlessM4T 融合了此前Meta所有AI及语音识别、合成等项目的见解和经验,旨在为用户提供最先进的多语言和多模式翻译体验。
(来源:Meta)
【原创申明】为了更好保护支持原创内容和对忠实读者负责,本网站跨境阿米SHOW(网站地址:www.amishow.com)及公众号跨境阿米SHOW(微信号:amishow321)刊载的包括文字、图片、音频、视频等所有内容,除签署正式付费转载协议伙伴外,禁止任何形式的复制、转载、修改或者以其他方式使用本网站或本公众号的内容。本网站或本公众号部分引用资料只代表原作者意见,不代表本网站www.amishow.com或者本公众号『跨境阿米SHOW』任何立场,如发现本站文字存在版权疑问,请联系我们「微信号:amishow01」「邮箱copyright@amishow.com」处理。
发表评论
请先登录后参与评论
{{ item.user_info.display_name }}