Gemini Omni 与 Gemini 3.5 的 11 个实战展示

2026-05-30 01:30·16天前·Zahra Thompson

精选理由

Google 官方放出的这组视频演示，直接展示了 Gemini Omni 和 3.5 的实际表现，比参数和 benchmark 更直观，做多模态应用的可以逐帧研究。

AI 摘要

Google 在 2026 年 Google I/O 大会上发布了新一代多模态模型 Gemini Omni 与 Gemini 3.5，并同步提供了 11 个视频，集中演示了这两款模型在实际场景中的能力。

AI 翻译 · 中文

9 个 Gemini Omni 与 Gemini 3.5 实际应用演示

2026 年 5 月 29 日

借助 Gemini Omni，Gemini 的推理能力与创造能力融为一体；而 Gemini 3.5 则旨在帮助你执行复杂的智能体工作流。

您的浏览器不支持音频元素。

在 2026 年 Google I/O 大会上，我们发布了最新模型：Gemini Omni 与 Gemini 3.5 模型家族。

Gemini Omni 是我们的新模型，能够从任意输入生成任何内容，首先从视频开始。使用 Omni，你可以将图像、音频、视频和文本作为输入组合在一起，并基于 Gemini 对现实世界的知识生成高质量视频。你还可以通过对话轻松编辑视频。

接下来是 Gemini 3.5，这是我们最新的模型家族，将前沿智能与行动能力相结合。这代表着在构建更强大、更智能的 AI 智能体方面的一次重大飞跃。我们以发布 3.5 Flash 作为该系列的起点。它为智能体和编程提供了前沿性能，擅长处理复杂的、长期的任务，从而带来实际效用。

为了让您更清晰地了解 Gemini Omni 和 Gemini 3.5 Flash，以下是 9 个演示，展示它们能帮助您完成哪些工作。

Gemini Omni

通过对话编辑视频。Omni 的一项独特能力是，它提供了一种更简单的视频编辑方式——使用自然语言。每条指令都以前一条为基础。你的角色保持一致，物理效果保持合理，场景会记住之前发生的内容。这意味着你可以改变身边的世界。修改特定部分，或者彻底改变一切。你的视频将成为起点，创造出你永远无法亲自拍摄的内容。

提示词：用泡泡制作雕塑。

重新构想动作。拍摄一段视频，只需告诉 Omni 改变正在发生的事情。编辑动作、添加新角色或物体，或者将某个瞬间变成意想不到的东西。

提示词：调暗房间的灯光。在浮动的玻璃球内放入一个黑白棋盘格房间，玻璃球悬浮在手掌上方并跟踪手掌运动，球内包含同一只手托着球体的递归表示，形成房间的无限递归。摄像机慢慢靠近球体，形成一个循环视频。

通过多轮对话完善视频。更改环境、角度、风格甚至具体细节，同时始终不丢失原始场景的脉络。滚动轮播，查看编辑如何层层叠加。

提示词：一位小提琴手演奏一首歌曲的视频。

提示词：将小提琴手带到图像环境中

提示词：让小提琴变得不可见

提示词：将摄像机角度切换至小提琴手的肩部上方。

**Gemini 3.5 Flash**

大规模承担智能体任务。3.5 Flash 在多个维度上提供了可与大型旗舰模型匹敌的智能水平，同时保持了 Flash 系列一贯的速度。这种速度与性能的平衡使 3.5 Flash 成为处理长周期智能体任务的理想选择。在此，借助 Antigravity 驱动，3.5 Flash 执行多步骤工作流，基于动态条件自动重命名和分类非结构化资产。

**由 Antigravity 驱动的 3.5 Flash**

与更新后的 Antigravity 框架结合时，3.5 Flash 成为一个强大的引擎，可部署协作性子智能体，以大规模解决最苛刻用例中的问题。在监督下，它能够可靠地执行多步骤工作流和编码任务，同时保持前沿性能。

使用 3.5 Flash 创建更丰富、更具交互性的 Web UI 和图形。3.5 Flash 建立在 Gemini 3 强大的多模态基础之上。观看 3.5 Flash 如何在 AI Studio 上仅用 60 秒就为结账流程生成不同的 UX 方案。

**AI Studio 上的 3.5 Flash**

尝试个人 AI 智能体和新的智能体验。3.5 Flash 现已成为全球范围内 Gemini 应用和搜索中 AI 模式的默认模型。其智能体能力正在驱动新功能，将前沿智能带入您的日常生活。

3.5 Flash 增强的智能体编码能力正在为搜索带来更智能的体验，例如我们新的信息智能体。这些智能体全天候在后台运行，智能地跨信息进行推理，在恰当时刻找到您所需的确切内容。它们会发送一份全面的更新报告，并附上相关网页链接供您深入探索，以便您采取行动。信息智能体将于今年夏季首先面向 Google AI Pro 和 Ultra 订阅用户推出。

一个信息智能体会持续向用户更新：他们喜爱的运动员中是否有人宣布了联名运动鞋或签名款新品发布。

现在，我们将 Google Antigravity 的强大能力与 Gemini 3.5 Flash 的智能体编码能力直接引入搜索，让搜索能够即时为你构建理想答案，并以最适合你问题的格式呈现。这样，你就能获得自定义的生成式 UI，包括可视化工具体和模拟功能，精准满足你的需求。这些生成式 UI 功能将于今年夏天向所有搜索用户免费提供。

搜索利用 3.5 Flash 构建了一个互动式可视化界面，用于解释 Gyroid 图案。

对于你正在进行的任务，比如规划婚礼或制定新的健身计划，搜索还会为你构建定制体验——例如仪表盘、追踪器或迷你应用——你可以随时回来继续使用。未来几个月内，你将能够在搜索中直接使用 Antigravity 创建自己的定制体验，首先面向美国的 Google AI Pro 和 Ultra 订阅用户开放。

搜索构建了一个自定义健身追踪器。

此外还有全新的 Gemini Spark，这是你的个人 AI 智能体，运行在 Gemini 3.5 上，并使用 Antigravity 框架。它全天候运行，帮助你驾驭数字生活，在你指导下代你采取行动。它与你日常依赖的 Workspace 工具深度集成，例如 Gmail、Docs、Slides 等。Gemini Spark 现已面向美国所有 Google AI Ultra 订阅用户提供。

Gemini Spark 创建一份无坚果零食清单，然后将其添加到 Instacart。

Gemini Omni Flash 正在通过 Gemini 应用和 Google Flow 向全球所有 Google AI Plus、Pro 和 Ultra 订阅用户推出。同时，它也免费向 YouTube Shorts 和 YouTube Create App 的用户推出。未来几周，我们还将通过 API 向开发者和企业客户推出。

Gemini 3.5 Flash 现已通过 Google Antigravity、Google AI Studio 和 Android Studio 中的 Gemini API、Gemini 企业智能体平台以及 Gemini Enterprise 全面可用。它还在搜索的 AI 模式中向所有用户开放，目前正在向全球 Gemini 应用用户逐步推出。

完成。只需再一步。

检查你的收件箱以确认订阅。

你已订阅我们的通讯。

你也可以用其他邮箱地址订阅。

Google多模态模型发布视频

Google Blog：AI（RSS）

精选74