联系我们

语音识别

游戏开发商希望语音AI带来新的创造机会

mm

已发表

 on

声音合成技术,特别是语音合成,近年来变得更加复杂。尽管文本转语音技术已经存在了数十年,但该技术听起来却更加自然。最新的算法可能只需要花费几个小时的音频,就可以合成高度逼真的音频样本。随着技术的进步,开放了更多的应用程序,包括创意媒体的可能性。最近,  据VentureBeat报道,视频游戏公司已开始研究使用AI语音生成来为视频游戏产生对话。

一家公司 Leviathan Games,已开始在他们目前正在开发的游戏中实现语音AI。 Leviathan Games的所有者Wyeth Ridgway解释说,语音AI可以以戏剧性的方式改变游戏设计。 Ridgway解释说,语音AI在游戏设计中的使用是一种新兴趋势,并将其与3D动画软件在过去十年中的发展趋势进行了比较,皮克斯等公司创建了旨在促进动画和建模的专有软件。

生成语音的传统方法是通过动态地将预先录制的声音文件附加在一起,然后将句子与先前存在的单词和短语拼接在一起。这种语音生成方法需要记录数百小时的对话和手动标记声音片段。这也听起来有些不自然,因为词尾变化和重点倾向于在单词之间转移。相比之下,最先进的语音AI听起来自然得多,并且以不同的方式运行。

语音AI基于深度神经网络。 WaveNet 是最早能够产生令人信服,听起来自然的音频样本的AI之一。由于声音样本是从头开始生成的,因此只要有足够的训练数据,就无需预先录制数百小时的对话。优化的GAN和 LSTM 仅在几个小时的带标签音频上进行训练后,模型即可生成音频。结果可能会令人信服,例如Google的Duplex实验 打电话给美发沙龙预约。

随着这些技术变得越来越强大,标准化并且可以通过云计算轻松访问,’可能会有更多游戏开发商转向语音AI,以减少生产时间和成本。一些公司已经在创建游戏开发者可以使用的模型。 复制工作室 专门研究AI语音技术,可以在链接上听到由其技术生成的一些音频样本 这里 这里 .

游戏开发人员不太可能会选择在AI上放弃使用配音演员。实际上,语音AI可以为语音演员带来更多机会。当前,由于与创建语音对话相关的时间投资和成本,许多游戏开发公司经常跳过进行语音对话。如果脚本有更改或游戏导演想要其他类型的表演,通常需要带回语音演员进行更多录制会话。可以使用语音AI进行实验/原型对话,以了解在需要专业语音演员录制脚本之前需要进行哪种脚本更改和修订。这可能会导致更多的公司有资源投资进行有声对话。

甚至可以在特定配音演员的声音上训练AI语音模型,并且只要为演员的语音使用付费,就可以使用AI生成琐碎的对话剪辑。 据VentureBeat报道,像Simon J. Smith这样的配音演员,对语音AI模型的使用日益增加及其开辟新的配音机会的潜力感到乐观。

除了使用语音AI制作脚本原型或为次要角色创建语音线之外,游戏开发人员还可以使用语音AI为玩家提供更多自定义选项,以供角色扮演视频游戏使用。当前,即使允许玩家为化身选择声音的游戏通常也只有少数选择。通过使用语音AI,选项在功能上可能是无限的。

专门从事以下工作的Blogger和程序员 Machine Learning Deep Learning 话题。 Daniel希望帮助他人将AI的力量用于社会公益。