进入音乐行业的主要障碍是制作成本。即使艺术家筹集了资金,寻找音乐制作人和工作室来满足他们的需求也是极具挑战性的。如果您只需按一下按
进入音乐行业的主要障碍是制作成本。即使艺术家筹集了资金,寻找音乐制作人和工作室来满足他们的需求也是极具挑战性的。如果您只需按一下按钮,就可以告诉您的计算机制作您为您设想的节拍会怎样?借助 Google 的 MusicLM 模型,从文本生成音乐可能成为现实。
上周,谷歌发布了一篇学术论文,讨论了其 MusicLM 生成 AI 模型,该模型根据用户文本提示制作音乐。该模型可以制作从 10 秒音频剪辑到完整歌曲的任何内容,使用您提供的尽可能多的具体细节。它还可以将现有歌曲制作成不同的声音。
根据该论文,AI 模型的提示可以包括详细的命令,例如“带有令人难忘的萨克斯管独奏和独奏歌手的迷人爵士乐”或“具有低音和强劲底鼓的柏林 90 年代技术”。要查看其所有不同提示和功能的示例,您可以单击此处。
根据该论文,为了创作音乐,该系统在 280,000 小时的未标记音乐数据集上进行了训练,该数据集教会 MusicLM 以 25 kHz 的频率生成长而连贯的音乐。
这不是谷歌或业界首次尝试人工智能歌曲系统。ChatGPT和DALL-E背后的人工智能研究公司OpenAI有自己的版本 JukeBox,尚未向公众发布。Riffusion 是一种使用声音图像制作音乐的神经网络,现已向公众开放。根据 Google 的说法,他们的系统比以前的任何系统都要好。
“我们的实验通过定量指标和人工评估表明,MusicLM 在质量和对字幕的遵守方面都优于以前的系统,如 Mubert 和 Riffusion,”谷歌说。
那么我们什么时候才能使用这个“比现有任何东西都好”的人工智能模型呢?不幸的是,答案是不会很快。
在论文中,谷歌认识到这些类型的模型可能会造成创意内容被盗用的风险,以及培训中存在的固有偏见可能会影响培训中代表性不足的文化,并导致文化挪用。出于所有这些原因,谷歌表示目前没有发布模型的计划。
最近,我们看到了 AI 模型带来了谷歌所描述的风险。随着 AI 生成的艺术模型(例如Lensa 的 AI Time Machine)的发布,艺术家们一直在谈论他们的艺术被 AI 艺术模型盗用而没有信用或补偿。
与此同时,据报道,对 ChatGPT 等人工智能工具的突然兴趣促使谷歌考虑更快地推出基于人工智能的产品。
声明本站所有作品图文均由用户自行上传分享,仅供网友学习交流。若您的权利被侵害,请联系我们