我们在 I/O 2026 发布的 100 件事
I/O 今年还是全场景轰炸,Gemini Omni 加一堆新产品,花十分钟扫一眼,未来半年 AI 要替你做哪块活就清楚了。
在 Google I/O 2026 开发者大会上,公司共发布了 100 项内容,重点介绍了 Gemini Omni、Google Antigravity 和 Universal Cart 等新产品的核心亮点。
我们在 I/O 2026 上公布的 100 件事
2026 年 5 月 20 日
我们一直很忙!以下是 I/O 2026 上最重磅的公告、发布和演示的概览。
本周在 Google I/O 2026 上,我们发布了新的模型、智能体和工具,帮助你构建、搜索、创作、发现、购物以及完成更多事情。你可以深入了解我们的 I/O 公告——包括 Google CEO Sundar Pichai 在台上演讲的编辑文字记录。如果想看个直截了当的摘要(算是 TL;DR),请往下滚动,查看我们整理的本次活动的 100 个亮点。
用我们最先进的模型进行创建与构建
Gemini 3.5
1. 我们发布了 Gemini 3.5 Flash:这是我们最新系列模型中的第一款,它将前沿智能与行动能力相结合。
2. Gemini 3.5 Flash 即日起可通过我们的智能体优先开发平台 Google Antigravity、Google AI Studio 中的 Gemini API 以及 Android Studio 正式使用。
3. Gemini 3.5 Flash 提供了可与大型旗舰模型相媲美的智能水平,同时保持了 Flash 系列应有的速度。它在具有挑战性的编码和智能体基准测试中超越了 Gemini 3.1 Pro,例如 Terminal-Bench 2.1(76.2%)、GDPval-AA(1656 Elo)和 MCP Atlas(83.6%)。
4. 3.5 Flash 位居 Artificial Analysis 指数右上象限,以卓越的速度提供前沿级别的智能——证明你不再需要在质量和延迟之间做取舍。
5. Gemini 3.5 Flash 非常适合处理长周期智能体任务。过去需要开发者花几天时间、审计员花几周时间的工作,现在借助 3.5 Flash 可以在极短时间内完成,成本通常不到其他前沿模型的一半。它可以快速规划、构建和迭代来解决实际问题,无论是开发新应用、维护代码库还是协助准备财务文档。基于 Gemini 3 强大的多模态基础,3.5 Flash 能生成更丰富、更具交互性的网页用户界面和图形。
6. 我们也在全力推进 Gemini 3.5 Pro 的开发。它已在内部使用,我们期待下个月推出。
Gemini Omni
7. Gemini Omni 是我们新推出的模型,可以从任何输入创建任何内容——从视频开始。它结合了 Gemini 的智能与我们最佳的生成式媒体模型,实现了世界理解、多模态能力和编辑能力的新高度。我们目前从视频输出开始,但随着时间的推移,Gemini Omni 将能够从任何输入生成任何输出。
8. Gemini Omni 将直观的物理理解与 Gemini 在历史、科学和文化方面的知识相结合,弥合了从照片级逼真到有意义叙事之间的差距。它对重力、动能和流体动力学等力的理解得到了改进,使您能够创建更逼真的场景。
9. 使用 Omni 创建的视频包含我们不可察觉的 SynthID 数字水印。您可以通过 Gemini 应用、Chrome 中的 Gemini 以及搜索轻松验证内容。
10. 您可以引用任何内容。Gemini Omni 将任何引用——图像、文本、视频或音频——转化为单一、连贯的输出。虽然开始时音频仅支持语音引用,但我们很快就会推出其他类型的音频输入。
Gemini Omni 在 Gemini 应用、Google Flow 和 YouTube 中
11. Gemini Omni Flash 现已通过 Gemini 应用和 Google Flow 向全球所有 Google AI Plus、Pro 和 Ultra 订阅者推出。今天也免费向用户(18 岁以上)在 YouTube Shorts Remix 和 YouTube Create 应用中提供。
12. 创建、混音和编辑视频比以往任何时候都更容易。Gemini 应用中的 Gemini Omni 提供了一种流畅、对话式的方式来创建和编辑视频——例如通过简单的提示词应用电影级缩放或更改背景。
13. 您可以从相册上传任何照片或视频,单击即可应用内置模板,无需昂贵的设备或技术术语即可体验神奇。您甚至可以通过创建外观和声音都像您的自定义 AI 头像,让自己置身于场景之中。
14. 对于使用 Google Flow 的创意人员,Omni Flash 允许您将现实世界的灵感与生成的内容融合,并以对话方式迭代。Gemini Omni Flash 还改进了角色一致性,这意味着每个场景中的身份和声音都得以保留。
15. 而且,您可以在 YouTube Shorts Remix 中免费尝试新的 Gemini Omni 模型,它有一个令人兴奋的新升级,让您可以直接步入您最喜欢的 Shorts。只需选择一个符合条件的 Short,提示您想要更改的内容——比如添加您自己或任何视觉参考——即可获得包含您编辑内容的全新版本。
搜索、购物和发现您正在寻找的内容
AI Search
16. AI 模式是我们最强大的 AI 搜索功能,月活跃用户已超过 10 亿。今天,我们正在全球范围内升级这一体验,以 Gemini 3.5 Flash 作为新的默认模型。我们看到了惊人的增长势头,自推出以来,AI 模式的查询量每个季度都翻了一倍以上。上个季度,我们的搜索查询量达到了历史最高水平。
17. 今天,我们推出了 25 年来搜索框的最大升级——一个全新的、智能的搜索框,现已完全借助 AI 重新构想。你可以使用文本、图片、文件、视频以及 Chrome 浏览器标签页进行搜索,并且搜索功能会综合所有这些信息进行推理。你将继续获得来自搜索的多种结果,就像今天一样。
18. 我们还让继续与搜索对话变得更容易,将 AI 概述和 AI 模式整合到一个无缝的 AI 搜索体验中。你可以从你的问题流畅地过渡到带有 AI 概述的搜索结果页面,再到 AI 模式中的后续追问,所有内容都附有可以进一步了解的链接。全新的无缝 AI 搜索体验即日起在全球桌面端和移动端上线。
信息智能体
19. 我们正在进入搜索智能体的时代——你可以在搜索中轻松创建、定制和管理多个 AI 智能体,用于处理你的各项任务。我们首先从信息智能体开始,它们可以 24/7 全天候在后台运行,这样你就能随时了解你所关心的任何话题、任务或项目的最新动态。
20. 你的智能体会智能地浏览网络上的所有内容,例如博客、新闻网站和社交帖子,再加上我们最新鲜的数据(如金融、购物和体育的实时信息),来监控与你具体问题相关的变化。你的智能体会向你发送一份智能的、综合的更新,并且支持采取行动。你可以在搜索中同时启动多个信息智能体,从而在那些对你重要的事情上获取更新并取得进展。
21. 今年夏天,你将能够使用信息智能体为你工作,该功能将首先向 Google AI Pro 和 Ultra 订阅用户开放。
搜索中的生成式 UI 与反重力
22. 借助 Google 反重力的力量以及 Gemini 3.5 Flash 的智能体编码能力,搜索可以即时为你构建与你问题完全匹配的理想格式,完全定制,动态生成。
23. 你可以获得自定义生成式用户界面——搜索功能会实时设计定制布局、组装组件(例如交互式可视化图表、表格、图形或模拟),帮助你更好地理解复杂主题。搭载 Antigravity 的生成式界面将于今年夏天面向所有用户免费在搜索中推出。
24. 有些项目不是一次性提问——它们是需要持续跟进的任务,比如策划婚礼或管理搬家事宜。针对这些场景,搜索可以更进一步——帮你构建完整的自定义体验,比如你可以反复回来使用的仪表盘或追踪器。你可以把它们看作针对特定任务的迷你应用。
25. 未来几个月内,你将能够在搜索中直接使用 Antigravity 构建类似迷你应用的自定义体验,这一功能将首先向订阅用户开放。
个人智能
26. 我们正在将 AI 模式下的个人智能扩展到近 200 个国家和地区、覆盖 98 种语言的更多用户——无需订阅。
27. 在搜索的 AI 模式下,你可以安全地连接 Gmail 和 Google 相册等应用,不久还将支持 Google 日历。个人智能的设计以透明、选择和控制为核心。你始终拥有控制权——你可以自行决定是否以及何时连接 Gmail 和 Google 相册等应用。
通用购物车
28. 我们推出了通用购物车:一款真正智能的购物车,也是你在 Google 上购物的新枢纽。你在浏览搜索、与 Gemini 聊天、观看 YouTube 甚至阅读 Gmail 时,都可以向购物车中添加商品。一旦你添加了产品,购物车就会在后台自动为你服务。它会查找优惠和降价信息,提供价格历史洞察,并在商品补货时提醒你。通用购物车基于我们的 Gemini 模型运行,因此随着模型不断改进,你的购物车也会变得更加智能。
29. 它还会利用智能推理来预判你的需求,并在问题出现之前帮助你解决。它会主动标记任何产品不兼容的情况,并建议替代方案。由于购物车构建在 Google 钱包之上,它能够识别你的支付方式权益、会员信息和商家优惠,从而智能地帮助你选择支付方式。
30. 通用商务协议(UCP)让你的购物车结账流程变得极为顺畅。对于许多你喜爱的品牌,你只需在 Google 上轻点几下即可通过 Google Pay 完成结账,或者将商品直接转移到零售商的网站上进行购买。
我们今年夏天将在搜索和 Gemini 应用中推出 Universal Cart,随后会覆盖 YouTube 和 Gmail。
借助 Gemini 应用,让您的一天更高效
Gemini Spark
Gemini Spark 是您的全天候个人 AI 智能体,可帮助您驾驭数字生活、代您执行操作,并始终受您指挥。它能在您的手机或笔记本电脑后台运行,即使设备处于关机状态也能工作。
Spark 基于 Gemini 3.5 运行,并构建在 Google Antigravity 平台之上。它在您的指挥下自主运行。您可以选择开启它,并且它在代您执行重大操作前,会设计为先与您确认。
Gemini Spark 目前处于产品发展初期,我们在本次首发中优先考虑安全性——因此我们首先向可信测试者推出,并计划于下周将 Beta 版本提供给美国地区的 Google AI Ultra 订阅用户。
展望未来,我们为 Google Spark 制定了丰富的功能路线图,将在整个夏季陆续发布。例如:您将能够直接向 Spark 发送短信或电子邮件、创建自定义子智能体,甚至可以在指定预算和商户的前提下授权支付。
Daily Brief
Daily Brief 是我们全新的开箱即用智能体,它会根据您的目标整理并优先安排您的一天,提供个性化摘要,并建议后续步骤。
借助 Daily Brief,Gemini 会在夜间为您工作,收集您第二天所需的信息。它会分析您的收件箱、日历和任务,找出对您最重要的事项。它简洁而富有洞察力,能串联起您生活中的各个关联点。它具备可操作性,能预测您的需求并建议下一步行动。而且它会随着时间推移不断学习,记住您的偏好、日期和时间。
Daily Brief 今日起开始向 Gemini 应用中所有 18 岁以上的 Google AI 订阅用户推出,首先从美国开始。要使用 Daily Brief,Google AI 订阅用户必须已选择关联其 Google 应用。
Neural Expressive
我们从零开始彻底重新设计了 Gemini 体验。从您打开应用或访问网站的那一刻起,就会看到一种我们称之为 Neural Expressive 的全新设计语言,它包含流畅的动画、鲜艳的色彩、全新的排版以及贯穿始终的触觉反馈。
我们对所有内容进行了简化和精炼,统一了工具菜单,让您能更轻松地发现和生成精美的图像、视频和音乐,并内置了可即时混音的模板。
41. 当你发出提示词的那一刻,Neural Expressive 便真正活了起来。你不再会看到一堵文字墙。相反,Gemini 会实时为你精心展开它的回复。当你滚动浏览时,可能会看到交互式图像——你可以放大并以全新的层次探索信息;也可能看到时间线供你快速扫描,或者嵌入式视觉元素。
42. 我们还彻底改造了 Gemini Live 体验——它现在会立即以内联形式打开。Gemini Live 还采用了一种新模型,更智能、更快速,并且对背景噪音的干扰更少。
43. 很快,你甚至可以选择一种你喜欢的地区方言。我们将在未来几周内陆续推出这些功能。
**用智能体提升你的构建能力**
**Google Antigravity**
44. Google Antigravity 是我们的智能体优先开发平台,让任何人都能成为构建者。今天,Antigravity 正在大规模扩展其智能体能力、界面、集成和产品功能套件。
45. Google Antigravity 2.0 是一款全新的独立桌面应用程序,作为智能体交互的中央枢纽。你可以编排多个智能体并行执行任务,例如让一个智能体编写网站代码,同时另一个智能体生成品牌资产。
46. Antigravity CLI 专为偏好留在终端中的用户设计。它是一个轻量级、高速度的产品界面,让你无需图形用户界面即可即时创建新智能体。
47. Antigravity SDK 让你能够以编程方式访问与 Google 产品相同的智能体框架,该框架已针对我们的 Gemini 模型进行了协同优化。此 SDK 允许你自定义智能体行为,并将其托管在你自己的基础设施上。
48. 我们还在推出针对 Gemini 音频模型的原生语音支持,以及多种界面和平台的集成,例如 Android、Firebase 和 Google AI Studio。
49. 全新的 Antigravity 毫不掩饰地以智能体优先,专注于核心的智能体对话、智能体生成的产物以及多智能体编排。Antigravity 智能体框架——让 Gemini 能够执行现实世界任务的隐形框架——已经变得更加强大,拥有新的核心原语,如子智能体、钩子和异步任务管理。这一切的基础是 Gemini 模型,其中 Gemini 3.5 Flash 已与 Antigravity 智能体框架进行了协同优化。
50. 过去需要多天投入的工程任务,现在被压缩成几小时甚至几分钟。这得益于新的子智能体协作能力。我们以 Antigravity 早期研究预览版的形式,将这一功能带给你。
51. 我们正统一以 Antigravity 作为你进行智能体优先开发所需的唯一平台。我们汲取了你使用 Gemini CLI 时的经验,并将这些洞察融入了 Antigravity CLI。我们鼓励用户迁移至 Antigravity CLI,并已发布一份指南,帮助你移植自定义技能。现在,你将获得与 Antigravity 2.0 相同的底层框架,并在你的所有使用面上获得统一的智能体体验。
52. 对于企业用户,我们允许 Google Antigravity 直接连接到你的 Google Cloud 项目,适用你所期望的企业级条款。对于现有的 Gemini Enterprise 客户,你们将在未来几个月内看到 Antigravity 逐步推出。
Google AI Studio
53. 即将推出的全新 Google AI Studio 应用,让你在外出时捕捉创意,并在你到达办公桌前就准备好一个可用的原型。
54. 现在,你可以从你在 AI Studio 中构建的应用里直接访问 Google Workspace。借助这一集成,你可以在 Sheets 数据之上构建仪表盘,创建整理用户 Drive 的工具,或者开发能与团队日常工作所用的文档和数据交互的应用。这一切都无需离开 AI Studio。
55. 从今天起,你可以在构建标签页中直接构建原生 Android 应用。只需选择“构建 Android 应用”并开始输入提示词即可。
56. 我们还在 AI Studio 中引入了对 Google Play 控制台的支持,让开发者可以直接将应用发布到测试轨道。你可以在浏览器中运行的 Android 模拟器上预览你的应用,或者通过 Android 调试桥(ADB)将应用安装到 Android 测试设备上。此外,你可以在 AI Studio 中连接你的 Google Play 开发者账号,一键将你的 Android 应用发布到 Google Play 的内部测试轨道。
57. 刚开始使用 AI Studio 的构建者,现在可以免费在 Google Cloud 上部署他们的前两个应用,无需信用卡。
58. 如果你希望进行本地开发以加快迭代速度,现在可以直接导出到 Google Antigravity。你的对话历史记录、项目文件和密钥都将一并迁移,因此你可以从上次停下的地方无缝继续,引入更广泛的团队,并开始扩展你的开发工作流程。
在 AI Studio 内部,你现在拥有更多自定义选项来设计应用的外观和体验。AI Studio Build 智能体可以利用 Nano Banana 即时自动生成自定义图片。这有助于你构建定制化界面或模拟专门用例,而无需外部占位素材。我们新的编辑工具让你可以直接在预览窗口中进行标注。你可以在应用上绘制、调整组件并生成新的视觉效果,从而在开发过程中直接迭代。
托管智能体
我们将在 Gemini API 中推出托管智能体。通过托管智能体,对 Antigravity 智能体的一次 API 调用就能调起一个远程 Linux 环境,智能体可以在其中进行推理、规划并使用工具框架调用工具;在隔离沙箱中执行代码和管理文件;以及浏览网页以获取和处理实时数据。托管智能体由新的 Antigravity 智能体驱动,该智能体基于 Gemini 3.5 Flash 构建,并可通过 Interactions API 及 Google AI Studio 使用。
你可以通过自己的指令和技能来扩展 Antigravity 智能体。无需编写复杂的编排代码,你只需在 `AGENTS.md` 和 `SKILL.md` 等 Markdown 文件中定义所有内容,并将其注册为命名智能体。
我们宣布举办 Build with Gemini XPRIZE 黑客松——这是一项总奖池达 200 万美元的全球新赛事,也是历史上奖金最高的黑客松。我们邀请开发者使用 Gemini 构建解决世界最紧迫挑战的真实应用。
WebMCP 与 Chrome 开发者工具
我们首次展示 WebMCP——一个提议中的开放 Web 标准,它允许你将 JavaScript 函数、HTML 表单等结构化工具暴露给基于浏览器的智能体。
现代 Web 指南现已进入早期预览阶段,它是一组经专家评审的常青技能,可引导你的 AI 编码工具在多种常见用例中构建可访问性更高、性能更强、安全性更佳的现代 Web 体验。
通过面向智能体的 Chrome 开发者工具扩展你的工作流——该工具为你的 AI 智能体提供实时验证、调试和优化代码所需的可见性,现已可用于 Google Antigravity 及其他 20 多个编码智能体。
订阅
66. 我们推出了一项全新的 100 美元 AI Ultra 订阅计划,专为开发者、技术负责人、知识工作者和高级创作者量身定制。该计划在 Gemini 应用和 Antigravity 中的使用限额是 AI Pro 计划的 5 倍,此外还包含 20TB 云存储以及更多功能,旨在加速你的开发周期,并将前沿智能融入你的工作流。
67. Google AI Pro 付费订阅现在以免费形式附赠 YouTube Premium Lite 个人版计划。这每月额外增加了 8.99 美元的价值,让你可以无广告、离线及后台观看大多数 YouTube 和 YouTube Kids 视频,获得更优质的娱乐体验。
在工作上更高效,提升创造力
AI Inbox
68. 今年早些时候,我们在 Gmail 中推出了 AI Inbox 这一新视图,它能智能地呈现最重要的内容。它帮助你优先处理待办事项,并提供重要事项的最新动态。目前该功能已面向 Google AI Ultra 订阅用户开放,并开始向美国境内的所有 Google AI Plus 和 Pro 订阅用户推送。
69. AI Inbox 现在能基于上下文信息生成个性化的草稿回复,让你在几秒钟内完成审阅和回复。
70. 从现在开始,在 AI Inbox 中,如果一项任务需要审阅 Google 文档、表格或幻灯片,相关链接会直接显示在你的待办事项旁边。
71. 我们宣布了在 AI Inbox 中简化任务管理的更多方式。通过将单个任务标记为已完成、忽略无用的建议,或者一键将某个主题下的所有邮件标记为已读,你可以保持视图整洁。
72. 从今年夏季开始,Google AI Pro 和 Ultra 订阅用户将可以通过 Gmail Live 与你的收件箱对话——无需翻查邮件线索,直接提出具体查询。
Google Pics
73. 我们推出了 Google Pics,这是一款全新的图像创作与编辑工具,基于我们最新的 Nano Banana 模型构建,可以帮助你创建几乎任何内容——从派对传单到信息图,并提供你所需的创意控制。无论你是从空白画布开始设计,还是编辑现有照片,Pics 都能帮你省去复杂图像生成的麻烦。这款新工具包含以下功能:对象分割(以便你精确选择并编辑特定元素)、文字编辑与翻译,以及与 Workspace 的集成。
74. Google Pics 今日面向一小批受信任的测试者上线。今年夏季,它将面向 Google AI Pro 和 Ultra 订阅用户全球发布,并向 Google Workspace 企业客户提供预览版。
Docs Live 与 Talk to Keep
75. Docs Live 是一项新功能,可让你通过语音创建和编辑文档。只需说话,Docs Live 就会处理繁重的工作——整理你的思路、构建文档结构,并在获得你的许可后,从你的 Gmail、Drive、Chat 以及网络抓取相关细节。Google AI Pro 和 Ultra 订阅用户将从今年夏季起能够与 Docs 对话。
76. 你很快就能通过 Keep 进行“脑力倾泻”。Keep 不仅能理解你零散的表述,还会在后台自动运作,以你说话的速度将你的思路流转化为有条理的笔记和清单。该功能将于今年夏季面向 Google AI Pro 和 Ultra 订阅用户推出,并向 Google Workspace 企业客户提供预览版。
Google Flow
77. 在去年的 I/O 大会上,我们介绍了 Google Flow。此后,我们将 Flow 扩展为一个 AI 创意工作室,新增了视频和图像生成与编辑能力,并已在全球超过 140 个国家上线。Gemini Omni Flash 现已面向全球 Google AI 订阅用户在 Google Flow 中可用。
78. 对于使用 Google Flow 的创意人员,Gemini Omni Flash 可让你将现实世界的灵感与生成内容融合,并通过对话式方式进行迭代。Gemini Omni Flash 还改进了角色一致性,意味着每个场景中的身份和声音都能得到保留。
79. 我们还推出了 Google Flow Agent。在此之前,Flow 一次只能执行一条提示词。现在,你的智能体可以承担多步骤任务。你在 Google Flow 中的智能体是你的创意伙伴,能够根据你的输入规划和推理复杂任务,并始终在你的控制之下。
80. 基于 Gemini 模型构建,Google Flow Agent 凭借专业知识和对你项目的深入理解,协助早期头脑风暴、创作与编辑。例如,该智能体可作为特定场景中角色对话的试音板,甚至能提供情节建议。当项目进展深入时,你的智能体可一次性生成多个变体以提供更多选择,甚至支持批量编辑,使你的调整同步反映到所有素材中。一旦你获得素材,智能体可将它们整理为合集,甚至能直观地重命名文件。Google Flow Agent 现已面向全球所有 Google Flow 用户开放。
81. 我们还推出了 Google Flow Tools。现在你可以在 Google Flow 中通过 vibe code 方式创建任何你能想到的创意工具 —— 这些工具由你根据独特的创作流程自定义构建,例如设计视频特效、手绘动画或文本分层。
82. 你可以使用自然语言在 Google Flow 中创建定制工具和工作流程。无论你需要特定的图片编辑器、视频尺寸调整工具还是自定义着色器,现在都可以轻松开发,无需编程经验。如果你创作了他人可能喜欢的工具,可以轻松分享给其他 Flow 用户,他们可以将其混搭融入自己的项目。全球所有 Google Flow 用户可使用现有 Tools,而 Google AI 订阅用户还可以创建和混搭这些工具。
83. 借助 Google Flow Music,你还可以使用 Gemini Omni 以对话方式与智能体协作,指导创作可分享的音乐视频。新的细化功能让你能以更高精度编辑歌曲的特定部分。例如,你可以将某段歌词改为不同语言、更改风格、调整乐器,或微调你能想象的任何其他内容。
84. Pomelli 正在新增构建品牌内容和设计网站的新方式。
85. 借助实时设计与引导功能,使用 Stitch 进行设计现在更加自然和直观地协作。现在你可以通过文字描述需求,或直接说出需求,Stitch 会与你一同构建和重新编排你的想法。你还可以导入现有代码库和设计文件,确保构建内容符合品牌形象。
86. 我们推出了 Gemini for Science,这是一套全新的科学工具和实验集合,旨在在研究过程的每个阶段扩展科学探索的规模和精确度。它包含了 Google Labs 上的三个全新实验性工具,可以简化日常科学任务——无论是跟踪最新发表的论文、将研究目标转化为可用的代码,还是生成新的假设。这些工具包括:
87. 假设生成(Hypothesis Generation),基于 Co-Scientist 构建,模拟科学方法。它通过与研究人员合作来定义研究挑战,然后利用多智能体“创意锦标赛”生成、辩论并评估假设。为确保绝对严谨,各项主张都会经过深度核实,并附有可点击的引用来源作为支撑。
88. 计算发现(Computational Discovery),一个智能体研究引擎,基于 AlphaEvolve 和经验研究助手(ERA)构建,能够并行生成并评分数千种代码变体。这使得科学家能够测试新颖的建模方法——例如在太阳预报或流行病学等复杂领域——而这些方法若手动探索可能需要数月时间。
89. 文献洞察(Literature Insights),基于 NotebookLM 构建,能够搜索科学文献并将结果组织成带有自定义可搜索属性的表格,便于进行并列分析。研究人员可以通过聊天功能挖掘基于其定制语料库的细微差别,并创建高保真制品,如报告、幻灯片、信息图以及音频和视频概述。
90. 从 5 月 19 日起,我们将逐步开放这三款实验性工具的使用权限。用户可以访问 labs.google/science 登记兴趣。
91. 作为 Gemini for Science 的一部分,我们还推出了科学技能(Science Skills),这是一个专门的技能包,整合了来自 UniProt、AlphaFold 数据库、AlphaGenome API 和 InterPro 等 30 多个主要生命科学数据库和工具的洞察。在 Google Antigravity 等智能体优先的平台上使用这些技能,研究人员可以在几分钟(而非几小时)内完成结构生物信息学和基因组分析等复杂且通常需要手动操作的工作流程。Science Skills 将于 5 月 19 日在 GitHub 上对所有 Google Antigravity 用户开放。
92. 我们还与 ICML、STOC 和 NeurIPS 等顶尖科学会议合作创建了专门的试点项目,为智能体化同行评审和科学验证开发开创性工具,例如我们实验性的 Paper Assistant Tool(PAT)和 ScholarPeer。
改变你学习和探索的方式
向 YouTube 提问
93. 我们正在通过全新的对话式搜索体验“Ask YouTube”重新构想用户搜索和发现感兴趣内容的方式。借助 Ask YouTube,你可以提出更复杂的搜索查询,例如想要获得如何教孩子骑自行车的建议。Ask YouTube 会从 YouTube 整个内容目录中汇编最相关的视频(包括长视频和 Shorts 短视频),并提供互动式、结构化的回答。
94. Ask YouTube 将于本月在桌面端以实验形式向美国境内部分英文搜索用户开放。
**Android XR**
95. Android XR 的下一个重要里程碑是智能眼镜。智能眼镜将有两种类型:能在耳边提供语音帮助的音频眼镜,以及能在你需要时即刻显示所需信息的显示眼镜。
96. 我们与 Gentle Monster、Warby Parker 和三星合作推出的首批音频眼镜将于今年秋季上市,并将兼容 Android 和 iOS 设备。
**SynthID**
97. 三年前,我们推出了 SynthID,这是我们行业领先的水印技术,能够将不可感知的信号嵌入 AI 生成的内容中。我们的目标是让用户更轻松地了解在线遇到的内容。因此,我们最近在 Gemini 应用中为图像、视频和音频添加了 SynthID 验证功能。该功能已在全球范围内被使用 5000 万次,今天我们正在将其扩展至搜索功能,并在未来几周内扩展至 Chrome 浏览器。
98. 你可以通过使用 Lens、AI 模式、Circle to Search 等搜索功能以及 Chrome 浏览器中的 Gemini 来了解图像的来源。只需询问“这是 AI 制作的吗?”或“这是 AI 生成的吗?”
99. 我们还增加了对 C2PA 内容凭证的验证,以便轻松检查内容是否来自相机的未经修改的原片,或者是否已被修改以及使用了哪些工具。该功能今日起在 Gemini 应用中逐步推出,并将在未来几个月内登陆搜索和 Chrome 浏览器。
100. 由于数字媒体会在多个平台间流转,因此行业范围内的合作以及采用稳健、可互操作的工具至关重要。随着 OpenAI、Kakao 和 ElevenLabs 等公司将 SynthID 技术推广至更多 AI 生成内容中,网络上将有更多内容很快携带这些不可感知的水印。
完成。只需再走一步。
请检查收件箱以确认订阅。
您已订阅我们的资讯。
您也可以使用不同的电子邮件地址订阅。