生成式 AI 在过去几年中席卷了全球,带来了令人难以置信的突破,软件能够生成令人惊叹的视觉图像、文本甚至语音。然而,音频、音乐的发展却没那么迅猛,据说是因为 AI 难以理解声音的多样性 —— 旋律、节奏、流派和创造力的概念对于计算机模型来说很难复制,这阻碍了 AI 音频生成的发展。
2023 年标志着一个突破,逼真的语音克隆软件如 ElevenLabs 登上了舞台,带来了易于使用的软件,以令人难以置信的准确度生成语音、声音和演讲。到 2024 年,优秀的音效生成器已经能够让每个人都能用上逼真、专业质量的音效。如果你是内容创作者、播客主播或 YouTuber,音效可以为你的内容增加专业感和精致感,使用 AI 来生成音效,一方面可以高度自由定制、几乎没有限制,只需提供文字描述即可,另一方面它没有版权!做 YouTube 视频最讨厌的事情就是做完了,上传的时候发现里面用到的某段音效有版权,导致整个视频无法盈利。
下面介绍目前市面上三个比较好的 AI 音效生成器工具。
ElevenLabs
ElevenLabs 最初是文本转语音生成器,如今已经成为顶级的音频 AI 工具,生成出质量极高的输出,能深刻理解声音、音频、音乐和语音的细微差别。除了精确的语音克隆和生成,ElevenLabs 还扩展了其服务,推出了精确的音效生成工具,用户界面简单易用,让用户可以轻松将文本提示转换为生成的声音。只需创建一个描述你想要的效果的文本提示,如关门声、风声、篝火声、早晨的闹钟、剧院里的掌声和欢呼声、女性恐怖的尖叫、远处的爆炸声、警笛声等等,然后点击生成,ElevenLabs 即可魔法般生成 4 个音效供你选择。
缺点是不支持中文 —— 我用中文测试,比如「女性恐怖的尖叫」,虽然也会生成,但是效果完全牛头不对马嘴;用「scared woman screaming」就没有问题了。此外,它虽然可以免费使用,但如果想获得商业许可,是要付费的(具体怎么收费我还没搞明白,他们也是刚上线这一功能不久)。
如果生成的音效不理想,你可以根据需要调整文本提示并重新生成声音。一旦你对结果满意,可以将 AI 生成的音效下载为 WAV 文件,并按需使用,无论是 YouTube 视频、播客、电影录音,甚至是 TikTok 视频。ElevenLabs 在生成优秀的文本提示音效方面表现出色,用户界面简单易用,任何人都可以使用。而且提供免费试用和低月订阅选项,使 ElevenLabs 成为最佳 AI 音效生成平台。
MyEdit.Online
MyEdit 最初是一个 AI 图片编辑工具,比如去除特定物体、去除背景、扩充图片、换脸、AI 头像、以及直接生成图片等。如今它也推出了音效生成工具,界面跟 ChatGPT 有点像。我在测试中发现,生成一些自然界或抽象的声音,比如鸟儿歌唱,马桶抽水,吹风机,油炸的声音,效果还不错,但如果是让它生成人说话、唱歌的音效,就要差很多。另外,貌似它是能听懂(看懂)中文的。不过,它的免费试用版本,只能每天生成 3 个音效,实在是太吝啬了!超过之后就会提示你付费升级,每月 10 美元,或者年付的话 48 美元(每月 4 美元)。
AudioCraft(Meta/Facebook 旗下产品)
Meta 在 2023 年 8 月宣布推出 AudioCraft,一个免费的生成式 AI 工具,用于音乐生成和音效生成。AudioCraft 具有三个独立的模型,每个模型都有特定的功能:
- MusicGen:使用 Meta 拥有或特许的音乐,MusicGen 将文本提示转换为音乐作品。只需输入几行文本,MusicGen 即可生成完整的作曲。
- AudioGen:基于大量公开可用的音效训练,AudioGen 能够根据文本描述生成逼真的声音,如风声或敲木门声。
- EnCodec:这一模型代表了解码技术的最新进展,具有新的先进功能,可以在减少伪影的情况下生成各种 Hz 的高质量音乐。
这三个 AI 模型共同为创作者提供了新的音乐创作工具,增强视频的音轨和音效,并从文本中创建新的音频作品。AudioCraft 的问题在于,它是针对 AI 和技术专家设计,安装、运行和使用的门槛都很高,没有 ElevenLabs 那样用户友好的界面。如果您只是一名普通的生活 YouTuber,您可能完全无法搞懂如何使用 AudioCraft。
虽然 Meta 已经加入了生成式 AI 的行列,但该软件似乎还没有为普通用户做好准备。对于那些希望适应 AudioCraft 并将其自定义的开发人员和开发人员来说,这当然是一个很好的选择,但它是一个复杂的工具,业余视频创作者、实验者和忙碌的视频编辑可能会发现它笨拙而复杂。
Plugger.ai
Plugger.ai 是一个易于在线使用的音效生成器。Plugger.ai 的工作和外观类似于 ChatGPT,可以生成文本输出、AI 生成的图像和音效。虽然界面看起来简单明了,但在线上几乎没有关于 Plugger 输出质量的评论和示例。其 Lite 套餐每月 19 美元的订阅费用,包括每月 100 个 「任务」(生成一个图像、文本输出或一个音频文件算作一个任务),相对于其他工具来说并不便宜。
对于更高质量的输出和更低的月费,最佳选择仍然是 ElevenLabs。
最后总结
AI 音效生成技术还处于起步阶段。AI 工具一直以来都难以复制音乐、音效和背景噪音的多样性和细微差别,现在,像 ElevenLabs 这样的行业领导者正在生成可靠质量的输出,供专业使用。最新的软件显示了这一进展。
从高保真度的 ElevenLabs 到先进功能的 AudioCraft,每个软件都提供了独特的功能,适合各种用途。无论你是寻求电影制作支持的专业音效工程师,还是希望提升视频质量并建立观众群的内容创作者,这些 AI 工具将彻底改变你的视频创作方式,提供独特的音效和出色的逼真度。
体验这项突破性的技术,立即试用 ElevenLabs 的免费版。
Disclosure: We are an Amazon Associate. Some links on this website are affiliate links, which means we may earn a commission or receive a referral fee when you sign up or make a purchase through those links.
相关文章
Discover more from 美国攻略
Subscribe to get the latest posts sent to your email.