谷歌的生成式人工智能工具正在获得该公司在GoogleI O 大会上预告的一些增强功能。从本周开始,该公司将推出其 Imagen 图像生成器的下一
谷歌的生成式人工智能工具正在获得该公司在GoogleI/O 大会上预告的一些增强功能。从本周开始,该公司将推出其 Imagen 图像生成器的下一代版本,该版本重新引入了生成人工智能人物的能力(在今年早些时候引发了一场令人尴尬的争议之后)。谷歌的 Gemini 聊天机器人还添加了 Gems,这是该公司对具有自定义指令的机器人的看法,类似于ChatGPT 的自定义 GPT。
Google 的 Imagen 3 是其图像生成器的升级版,现已登陆 Gemini。该公司表示,下一代 AI 模型“为图像质量树立了新标准”,并配备了防护栏,以避免过度纠正多样性,就像今年早些时候在网上疯传的那些奇怪的历史 AI 图像一样。
Gemini 产品经理 Dave Citron 在新闻稿中写道:“在各种基准测试中,Imagen 3 的表现都优于其他可用的图像生成模型。”如果您不喜欢该工具第一次生成的结果,可以使用附加提示来指导图像生成。
Citron 表示,Imagen 3 的表现“优于”竞争对手。它还包含 Google 的SynthID 工具来给图片加水印,从而明确表明这些图片是人工智能制作的,而非真品。
Citron 表示,付费用户将在未来几天内恢复生成人物的功能,而几个月前谷歌已经取消了该功能。他表示,新的防护措施将阻止生成“照片般逼真、可识别的人物”——这与伊隆·马斯克的 Grok 生成的有问题的深度伪造相去甚远。儿童和(与其他图像生成器一样)任何血腥、暴力或场景也不可进入。产品经理表示,Gemini 的图像不会是完美的,但他承诺公司将继续听取用户的反馈并进行相应改进。
从本周开始,Imagen 3 模型将向所有用户开放,但重新引入以人物为特色的图像将首先从付费用户开始。讲英语的 Gemini Advanced、Business 和 Enterprise 用户可以期待“未来几天”恢复人类图像生成。
Gems最初在 Google I/O 2024 上进行了预览,是 Google 的定制聊天机器人,带有用户创建的指令。它本质上是 Gemini 对OpenAI 的 GPT的回应,后者是 Google 的竞争对手去年年底推出的。Gems 将在未来几天开始推出。
Citron 写道:“借助 Gems,你可以组建一支专家团队,帮助你思考一个具有挑战性的项目,为即将举行的活动集思广益,或为社交媒体帖子撰写完美的标题。”“你的 Gem 还可以记住一组详细的说明,帮助你节省繁琐、重复或困难任务的时间。”
除了定制的空白宝石外,Gemini 还将提供预制宝石,以“帮助您入门”并激发新想法。预制宝石包括:
学习教练——帮助您理解复杂的主题
头脑风暴——激发新想法
职业指南——引导你完成技能升级、决策和目标
写作编辑——对语法、语气和结构提供建设性的反馈
编码伙伴——提升开发人员的编码技能并激发新项目
Gems 即日起在桌面和移动设备上推出。不过,它们只适用于 Gemini Advanced、Business 和 Enterprise 订阅者,因此您需要付费计划才能试用
声明本站所有作品图文均由用户自行上传分享,仅供网友学习交流。若您的权利被侵害,请联系我们