谷歌发布“纳米香蕉”:AI图像编辑领域的颠覆性突破
作者:佚名
时间:2025-08-27 09:22:04
- 新动态
谷歌于2025年8月26日推出Gemini 2.5 Flash图像模型(代号"纳米香蕉"),将先进图像编辑与生成功能整合至Gemini生态系统。目前该功能已登陆Gemini应用,并通过Gemini API、AI Studio和Vertex AI平台向开发者开放。 - 核心功能
- 自然语言图像编辑:模糊背景、去除污渍、调整人物姿势甚至删除对象?只需文字指令即可实现。
- 多图像融合与一致性:无缝合成多张图像——将产品置入新场景、保持角色/品牌元素跨帧统一,或基于"世界知识"重新演绎设计图。
- 对话式迭代编辑:支持与AI进行多轮交互式修改,逐步优化图像效果。
该模型融合了Gemini 2.5的多模态输入、高级推理能力和图像生成技术,来源:X
- 定价策略
谷歌云平台定价为每百万输出token 30美元,单张1024×1024图像消耗约1,290 token,折合每张图像成本0.039美元。 - 分发渠道与数字水印
谷歌与OpenRouter、fal.ai达成合作,触达数百万开发者。所有输出图像(无论可见与否)均携带SynthID数字水印和元数据标签,标注AI生成属性。 - 市场格局
OpenAI在2025年3月率先为GPT-4o添加图像生成功能,推动ChatGPT周活突破7亿。截至2025年8月,谷歌Gemini以4亿月活用户应战。 - 行业生态整合
- 纳米香蕉不仅限于谷歌生态——已深度集成至Adobe Firefly、Firefly Boards和Adobe Express,9月1日正式开放。用户可享20次免费试用,付费用户获得无限生成权限。
- 该模型已接入Poe(Quora)、WPP、Freepik、Leonardo.ai和Figma等创意工作流,业界盛赞其一致性、实时响应和创作自由度。
- 潜在风险
随着图像工具能力提升,深度伪造和虚假信息风险加剧。尽管采用水印技术,滥用隐患依然存在。
若认为DALL·E或Midjourney代表AI图像工具巅峰,纳米香蕉将颠覆认知——这款文本驱动、多图像处理、内置水印的视觉瑞士军刀,彰显谷歌重塑创意工作流的野心,而非简单追赶竞争对手。