Bark 是一个免费的开源文本到音频转换器 AI 模型,可让您生成语音、音乐和声音效果。它甚至支持您可以尝试的语音克隆。目前,您只能试用 Hugging Face 上托管的版本,然后分析其输出。如果您发现它有用,那么您可以获取其源代码,然后将其托管在您喜欢的任何地方。Bark 可能是目前唯一可以从文本生成音频的 AI 模型。就连谷歌不久前也宣布了一款类似的人工智能模型,但尚未推出。因此,如果您专门使用 AI 进行音频生成,那么您一定会喜欢 Bark。它支持带有附加上下文和音符的上下文提示,以便它知道您想做什么。您还可以让它生成其他人的声音。如果您愿意,您还可以在此 Twitter 帖子中了解有关 Bark 的更多信息。人工智能允许您创建逼真的声音、音乐和声音。但大多数文本到音频的人工智能工具每月费用约为 12 美元。这是一个免费的人工智能工具,可以开始仅通过文本创建逼真的声音:??— 巴西 ??(@heyBarsee)4月 30, 2023用于生成语音和音乐的免费文本到音频 AI 模型:Bark正如我已经提到的它是开源的,您可以在此处快速获取其源代码或简单地查看它。目前,它支持 13 种语言,但在以后的更新中即将支持更多语言。此模型中支持的一些众所周知的语言包括:英语 (en) ?德语 (de) ?西班牙语 (es) ?法语 (fr) ?印地语(嗨)?意大利语(它)?日语 (ja) ?韩语 (ko) ?波兰语 (pl) ?葡萄牙语 (pt) ?俄语 (ru) ?土耳其语 (tr) ?简体中文 (zh) ?现在,这是您可以尝试的 Hugging Face 上托管的模型的链接。它的生成速度可能很慢,但它会起作用。这是一种概念验证,但如果您想充分发挥其潜力,那么您可以获取源代码并在按照安装说明(需要繁重的硬件要求)后运行它。Hugging Face界面如下所示。在框中输入提示,或者您也可以运行那里已经给出的示例提示。只需从列表中选择一个扬声器,然后继续。单击生成,然后它将在几秒钟内生成输出语音。同样,您可以生成音乐或音效。由于语音生成也是相同的过程,因此,您可以通过添加注释来简单地区分语音生成和音乐生成。请参阅下面的示例以及如何在其中插入音符。?丛林里,浩浩荡荡的丛林里,今夜狮子吠?在正常的文本输入中,您可以插入一些符号来添加额外的效果,例如大笑、清嗓子等。以下是一些受支持的非语音声音的列表,您可以选择将其包含在最终语音中。它们每天都会更新,您也可以在 Bark 的 Discord 服务器中推荐您自己的。[笑声][笑][叹息][音乐][喘气][清嗓子]——或者?...?对于犹豫举个例子:你好,我叫苏诺。而且,呃——我喜欢披萨。[笑]但我还有其他兴趣,比如玩井字游戏。请参阅语音生成中非语音组件的位置。通过这种方式,您可以利用这种免费且功能强大的文本到音频生成模型。将文本转换为语音、克隆声音、生成音乐和音效。这个过程很简单,Hugging Face 界面使其更易于使用。此外,如果您有正确的硬件要求,您可以将其托管在自己的服务器或 PC 上。结束语:如果您正在寻找一款免费使用的人工智能工具,可以根据描述生成音乐、语音和音效,那么 Bark 是实现这一目标的第一工具。有了这个,您可以为您的视频、播客甚至有声读物生成画外音。我喜欢它是多语言的,并提供各种配置选项来产生完美的输出。










