到目前为止,创建最复杂的人工智能语音模型可以模仿人的原声
到目前为止,到目的人Meta已经开发出了最复杂的止创人工智能语音模型。图片来源:英国《每日邮报》网站。建最 科技日报记者 刘霞。复杂 据英国《每日邮报》23日报道,工智脸书母公司元宇宙平台公司(Meta)据说它已经开发出了“最强大的音模原声语音生成人工智能Voicebox”,它可以模仿包括死者在内的模仿任何人的声音。然而,到目的人Meta宣布不会公开其人工智能模型,止创因为它担心这种先进技术会被滥用。建最 Meta深度学习人工智能研究人员在介绍Voicebox时指出,复杂Voicebox采用了“流匹配”方法,工智其性能优于最先进的音模原声生成语音系统。结果表明,模仿Voicebox生成的到目的人人工音频更容易理解,单词错误率为1.9%,低于竞争对手的5.9%。此外,Voicebox生成的音频与真人更相似,速度快了近20倍。 Voicebox在跨语言翻译中的表现优于备受好评的多语言文本语音AI YourTS,平均单词错误率从10.9%降低到5.2%,音频相似度从0.335提高到0.481。 Meta阐述了Voicebox的各种用途,称它可以用来帮助视障人士听到朋友和亲戚的信息,或者允许非母语人士用自己的声音翻译自己的话。Voicebox目前可以说英语、法语、西班牙语、德语、波兰语和葡萄牙语六种语言。 然而,Meta强调,由于潜在的滥用风险,他们不会披露Voicebox模型及其代码。虽然他们认为向人工智能社区开放和共享研究对促进人工智能的发展至关重要,但在开放和责任之间取得正确的平衡也至关重要。 总编辑圈点。 ChatGPT已经诞生半年多了,人们已经深深感受到了人工智能语言模型的力量。对于各种各样的问题,它可以像流一样回答,令人惊叹。想象一下,如果人工智能在回答人类问题时,不仅内容形式与真人相似,而且声音也很难区分真假,用户可能会感到更强烈的影响。后者是语音生成人工智能的目标。然而,正如文章所说,这些强大的技术确实可能被滥用。在人工智能技术不断升级迭代的同时,相关监管和伦理约束也应及时“上路”。
- 最近发表
- 随机阅读
-
- 快来看看你家何时“入春”
- “种子企业+繁育基地+农户”模式让这里收获“中国大豆之乡”称号
- 我国首座无纵筋钢混组合塔封顶
- 8月19日起 央行将陆续发行三江源国家公园、大熊猫国家公园纪念币
- 涪陵气田龙年春节安全产气超1.6亿立方米
- 第十五届中国包头·稀土产业论坛开幕
- 40万吨新型磷酸铁项目落地山东滨州
- 武汉地铁5号线起点延长线进入空载试运行阶段
- 科学新发现|人类还有鳃吗?
- 武汉地铁5号线起点延长线进入空载试运行阶段
- 火星拥有适于生命出现的环境条件
- 山西长治国家高新区:按下招商“快进键” 跑出项目“加速度”
- 计划增加72架次 琼海博鳌机场继续加大航班增量保障游客返程
- 对恒河猴开展的临床前研究表明,单次注射基因疗法能清除艾滋病病毒
- 东轻·沈飞劳模创新工作室共建联盟启动
- 腾讯高管解读Q2财报:AI能推动各业务大幅增长 自有基础模型方面进展不错
- 脚气克星!我科研团队开发基于黄光+超声的真菌快速清理技术
- 黑龙江省创新发展大会举行
- 科学新发现丨宇宙大“问号”或是两星系合并产物
- 吴天一院士被授予“十大医学泰斗”
- 搜索
-