※この記事はアフィリエイト広告を含みます
[AI小道消息] 谷歌超快图像生成模型「Nano Banana 2」发布!
📰 新闻概要
- 谷歌DeepMind发布了最新图像生成模型「Nano Banana 2(Gemini 3.1 Flash Image)」。该模型同时具备了「Pro」模型的智能和「Flash」模型的高速性。
- 被摄对象的一致性(Subject consistency)显著提高。在一个工作流程中最多可以保持5个人物和14个物体的外观生成。
- 基于与谷歌搜索的实时信息联动,支持创建准确的信息图,并提供从512px到4K的专业级分辨率输出。
💡 重要要点
- 搜索联动带来的准确描绘: 通过反映网页搜索信息,更加精准地渲染特定主题,提高图解和数据可视化的准确性。
- 高级文本生成: 实现图像内准确的文本嵌入,以及多语言翻译和本地化。
- 安全性与透明性: 为了识别AI生成的内容,整合了SynthID技术和C2PA内容认证信息(Content Credentials)。
🦈 鲨鱼的眼(策展人视角)
这个模型的真正魅力在于「速度」与「一致性」的完美结合!过去在生成多个图像时固定角色外观是一项繁琐的任务,但Nano Banana 2可以同时保持最多5个角色的相似性。这将从根本上改变故事板创作和故事制作的工作流程。而且,通过将搜索结果反馈到图像中,可以生成不会「随便撒谎」的准确信息图,这在实际工作中极具实用性!
🚀 未来展望
谷歌搜索、Gemini、广告,以及谷歌搜索中的图像生成等,所有谷歌生态系统都将整合该模型。用户在日常搜索和创意工作中,将能够「无需等待」生成和编辑4K品质图像,AI图像生成的普及化将进一步加速。
💬 鲨鱼视角的一句话
超快且聪明的模型,简直像一条逃不掉猎物的鲨鱼!鲨鱼鲨鱼!🦈🔥
📚 术语解说
-
Subject consistency(被摄对象一致性): 在多幅图像中,保持同一角色或物体的外观(特征)不变的技术。
-
SynthID: 谷歌DeepMind开发的技术,将不可见的识别信息嵌入AI生成的图像中。
-
C2PA: 证明内容创作者和编辑历史的开放标准规范,帮助判断其是否为AI生成物。