语音合成技术的进步

5.2K 0 0

摘要: 语音引擎是一种新的文本到语音AI模型，用于创建合成声音。Openai表示，广泛的释放将太冒险了。

语音合成技术的进步

自从1978年的Speak & Spell玩具以其先进的电子语音读词功能让人们惊叹以来，语音合成技术已经取得了长足进步。现在，借助深度学习人工智能模型，软件不仅可以创建逼真的声音，还可以使用少量音频样本逼真地模仿现有声音。

本周，OpenAI宣布推出Voice Engine，这是一款文本转语音人工智能模型，可以基于15秒的录音片段创建合成声音。在其网站上提供了Voice Engine的音频示例。

OpenAI表示，其语音技术的好处包括通过自然音色提供阅读辅助，通过保留本地口音翻译内容以实现全球覆盖，为不会言语的人提供个性化语音选项，以及帮助患者在言语受损后恢复自己的声音。

然而，这也意味着只需15秒的录音，任何人都可以有效地克隆声音，这对潜在的滥用行为具有明显的影响。即使OpenAI从未广泛发布其Voice Engine，克隆声音的能力已经通过电话诈骗和选举竞选电话自动拨号等方式在社会中造成了麻烦。

OpenAI意识到如果广泛发布该技术可能会引发问题，因此最初尝试通过一套规则来解决这些问题。去年以来，它一直在与一组特选合作伙伴公司测试该技术。

文章版权归作者所有，未经允许请勿转载。

6.7K

6.4K

7.5K

6.1K

8.6K

4.7K

暂无评论

暂无评论...