当前位置:首页>科技 >内容

谷歌深入研究新音频视频和图像的生成人工智能

2024-05-16 09:19:24科技自然的汉堡

很快,您只需一个简单的语音或文本提示即可创建完美的视频、图像或歌曲。Google I O 开发者大会在今天以及未来几周和几个月内向用户推出

很快,您只需一个简单的语音或文本提示即可创建完美的视频、图像或歌曲。

谷歌深入研究新音频视频和图像的生成人工智能

Google I/O 开发者大会在今天以及未来几周和几个月内向用户推出了大量新功能。其中包括如何使用生成式人工智能创建视频、图像和音乐的更新。

Google 团队一直致力于改进生成式 AI,在他们取得的进步中(包括图片搜索中的 AI之类的东西,非常酷),他们使用名为 Veo 的代理添加了一些新的视频创建功能,新的Imagen 3 的文本到图像更新,以及 Google Music AI Sandbox 中的一些新功能。

首先是 Veo,这是一种新的生成式 AI 代理,可以帮助您使用文本、图像或语音提示创建 1080p 视频。 Veo 将匹配可以制作的视频以匹配所使用的照片的风格,并且可以从一些新工具中提取来构建您想象的视频。例如,Veo 现在可以理解“延时”、“跟踪镜头”或“空中镜头”等术语,以更好地创建您想要的帧。

“通过 Veo,我们改进了模型如何学习理解视频中的内容、渲染高清图像、模拟我们世界的物理现象等方面的技术。这些学习将推动我们人工智能研究的进步,并使我们能够构建更有用的产品可以帮助人们以新的方式进行互动和交流。”产品管理副总裁 Eli Collins 和高级研究总监 Douglas Eck 在 Google 宣布新功能的帖子中说道。

Imagen 3是谷歌在会议期间宣布的最新图像模块。谷歌表示,它“更好地理解自然语言、提示背后的意图,并融合了较长提示中的小细节。”结果是您可以获得比以前的模型更好、更真实、细节更多的图像。 Imagen 3 还应该比以前的版本更好地处理文本艺术,让您创建个性化消息和其他文本装饰。

最后,谷歌花了一些时间专注于其音乐人工智能沙盒,它允许音乐家使用人工智能创作音乐。新添加的内容包括乐器添加和更多表达创意风格的方式。 Google 已与 Wyclef Jean、Marc Rebillit 和 Justin Tranter 等音乐家合作,继续开发 Music AI Sandbox,并扩展 Gemini AI 创作音乐的能力。

所有这些功能都处于测试的某个阶段。 Veo 和 Imagen 3 可通过 VideoFX 向特定创作者开放(如果您还不是 VideoFX,则必须进入候补名单),而 Music AI Sandbox 仍仅限于 Google 要求参与的艺术家。

声明本站所有作品图文均由用户自行上传分享,仅供网友学习交流。若您的权利被侵害,请联系我们

Top