AIHOT

全部动态一手 · 2393 条

5月20日周三

5月19日周二

5月20日

05:25

Google Developers Blog（RSS）

Google I/O 2026：从辅助工具到独立智能体的战略转型

在2026年开发者大会上，Google宣布其AI战略核心从辅助工具转向开发独立智能体。大会重点发布了Gemini 3.5系列模型，并对“反重力”智能体优先平台进行了重大更新。面向移动开发者，推出了Android CLI工具、评估排行榜及能将多种框架代码快速迁移至原生Kotlin的智能体。Web开发领域也迎来变革，包括专为智能体设计的Chrome DevTools、HTML-in-Canvas API，以及旨在让浏览器内AI智能体执行复杂任务的开放标准WebMCP提案。

智能体Google模型发布编码

关联讨论 4 条

05:25

Google Developers Blog（RSS）

精选57

创新一周年：庆祝Google Cloud x NVIDIA开发者社区达到10万会员

Google Cloud与NVIDIA开发者社区迎来成立一周年，会员规模突破10万。社区为开发者提供先进AI基础设施与资源支持，包括LLM优化、GPU加速数据分析等专项学习路径及专家网络研讨会。第二年计划将进一步扩展，推出实践实验室、工程活动及聚焦代理式AI增长的专项内容。

智能体Google行业动态

推荐理由：Google Cloud 和 NVIDIA 的开发者社区一年攒了 10 万人，不算大新闻，但官方放出的 agentic AI 课程和动手实验室对做 Agent 的工程师挺实在，可以关注一下。

04:41

xAI：News（网页）

精选60

在OpenClaw中使用Grok

5月22日，xAI宣布，其用户现可在开源个人助理OpenClaw中直接使用Grok模型。所有持有SuperGrok或X Premium订阅的用户均可使用该功能。OpenClaw是一个开源的、本地优先的智能助手，可在多种硬件上运行并保持跨会话记忆，同时能接入WhatsApp、Telegram等多款主流通讯平台。用户通过简单安装和登录，即可在自有设备上运行OpenClaw，并通过其界面或关联的聊天工具与Grok交互。此举进一步扩展了Grok的应用场景，未来还将推出更多开源代理与集成支持。

智能体产品更新开源生态

关联讨论 3 条

推荐理由：Grok 开始融入开源 agent 生态了，OpenClaw 的本地优先加多平台连接让这集成对开发者挺实用，有 Grok 订阅的可以直接试试。

04:25

Google Developers Blog（RSS）

使用LiteRT-LM在设备上实现闪电般的快速生成式AI

Google AI Edge推出LiteRT-LM引擎，为跨平台移动和边缘设备提供高度优化的基础设施，支持Gemma 4模型在设备端运行。通过内存高效动态加载和多令牌预测技术，实现高达2.2倍的速度提升，并集成思维模式、约束解码等高级工具。同时，该引擎正扩展至Apple生态，新增原生Swift API和WebGPU加速的JavaScript API，支持高性能浏览器端推理。

Google产品更新多模态端侧

04:25

Google Developers Blog（RSS）

精选65

更智能的 Google AI Edge Gallery：MCP 集成、通知和会话连续性

Google AI Edge Gallery 应用在安卓平台上扩展了设备端 AI 能力，通过引入对开源模型上下文协议（MCP）的实验性支持，使得 Gemma 4 模型能够协调处理跨 Google Workspace 和 Google Maps 等外部数据源的复杂任务。此次更新添加了“定时通知”技能，用于实现日常事务的自动化管理，并新增了持久化聊天记录功能，允许用户近乎即时地恢复长会话上下文。该平台依托开源工具包，积极鼓励社区开发者通过其 GitHub 仓库构建并分享专注实用的工作流、提示配置与工具集成。

GoogleMCP/工具产品更新端侧

推荐理由：MCP 终于跑在 Android 设备上了，虽然是实验性支持，但 Gemma 4 能直连 Workspace 和 Maps，做自动化的开发者可以上手试试。

03:25

Google Developers Blog（RSS）

精选69

Google Tensor ML SDK 测试版发布

Google Tensor ML SDK 进入测试版，支持开发者直接在 Pixel 10 设备的 TPU 上构建和部署高性能机器学习模型。该 SDK 集成边缘部署框架 LiteRT，提供统一工作流，可高效转换、编译并运行 PyTorch 或 TFLite 模型，并具备稳定回退机制。此外，新推出的模型库包含超过 100 个经典及生成式 AI 模型（如 Gemma 3），支持低延迟、注重隐私的语音识别、计算机视觉与文本生成等功能。

Google产品更新端侧

推荐理由：Google 把 TPU 塞进了 Pixel 10，现在开发者能直接在手机上跑 Gemma 3 了，这是移动端 AI 从「能用」到「好用」的关键一步，做 app 的值得关注。

03:03

Hugging Face：Blog（RSS）

OlmoEarth v1.1：更高效的地球观测模型家族

OlmoEarth v1.1 是新一代地球观测模型家族，将计算成本降低最多 3 倍，同时保持与 v1 相近的性能。通过将 Sentinel‑2 不同分辨率（10m、20m、60m）的 token 合并为单个 token，大幅缩短输入序列长度，从而减少预训练、微调和推理所需算力。提供 Base、Tiny、Nano 三种尺寸，权重与训练代码已开源。该模型已在红树林变化追踪、森林退化成因分类、国家级作物图绘制等任务中得到验证。

Hugging Face开源/仓库数据/训练模型发布

02:25

Google Developers Blog（RSS）

精选58

重要更新：Gemini CLI将迁移至Antigravity CLI

Google正在整合其AI终端工具，将面向社区的Gemini CLI迁移至全新平台Antigravity CLI。这款新工具采用Go语言开发，作为代理优先的平台，支持复杂的多代理工作流，并提供更快的执行速度、异步处理能力以及与Antigravity 2.0桌面应用同步的统一架构。企业客户可维持现有访问权限，但个人及免费用户必须在2026年6月18日Gemini CLI停止服务前，完成向新平台的迁移。

智能体Google产品更新

推荐理由：Google 终端工具从 Gemini CLI 全面转向 Antigravity CLI，强调 agent 优先和多 agent 工作流，6 月 18 日后 Gemini CLI 停服，个人用户得赶紧迁移。

02:18

Google Blog：AI（RSS）

精选74

Google AI 订阅服务全新内容，源自 I/O 2026 大会

Google 在 I/O 2026 大会上宣布更新其 AI 订阅服务，推出了全新的 100 美元“AI Ultra”计划。同时，面向 Google AI Plus、Pro 和 Ultra 三个层级的现有订阅者，服务均增加了新的功能和权益。此次更新标志着 Google 在 AI 付费订阅领域推出了更高端的选项并强化了现有套餐的价值。

Google产品更新

推荐理由：Google 在 I/O 上推出 $100 的 AI Ultra 计划，这是大厂把 AI 订阅当成‘基础套餐’来卖的信号，虽然细节还不算多，但想知道 Google AI 付费版最新整合的可以进去看一眼。

02:18

Google Blog：AI（RSS）

精选70

AI搜索的新时代

谷歌宣布了其搜索引擎与AI技术融合的最新进展，标志着AI搜索进入新阶段。此次更新旨在将搜索引擎的广度与AI的深度理解能力相结合，目标是提供更智能、更直观的搜索体验，推动搜索技术的下一代演进。

Google产品更新搜索

推荐理由：Google搜索宣称开启AI新纪元，但这次官宣只放了张图没给干货，搜索入口的任何变动都牵动流量，值得跟踪但别急着判断。

02:18

Google Blog：AI（RSS）

精选83

Gemini 3.5：前沿智能与行动能力相结合

Google 在 I/O 大会上正式发布了最新的 Gemini 3.5 模型系列。该系列模型将前沿的人工智能能力与执行操作的功能相结合，旨在提供更强的综合性能。作为 Google 最新推出的模型，它代表了其在大模型技术上的最新进展。

智能体Google多模态推理

关联讨论 15 条

推荐理由：Google 在 I/O 上甩出 Gemini 3.5，这次不只拼多模态，更强调‘行动’，是所有做 Agent 的团队必须对标的新基座。

02:18

Google Blog：AI（RSS）

精选89

I/O 2026：欢迎来到自主的 Gemini 时代

Google 在 I/O 2026 大会上宣布 Gemini 进入自主代理时代，新功能使其能够自动执行复杂任务，显著提升用户工作效率。大会展示了 Gemini 如何通过代理操作简化工作流程，实现自动化处理，例如自动管理邮件、安排日程或生成报告，帮助用户从重复性工作中解放出来，专注于创造性任务。这一更新基于先进机器学习模型，强调准确性与效率，标志着 AI 助手向更智能、更自主的方向发展。

智能体Google模型发布

推荐理由：谷歌 I/O 大会上 Sundar Pichai 亲自宣布 agentic Gemini 时代到来，这是把 Gemini 从对话助手升级成真正能自主执行任务的 agent，所有做 AI 应用的接下来都得重新看一遍技术选型。

02:18

Google Blog：AI（RSS）

精选75

Google Workspace 推出全新创建方式与高效工作功能

Google 在最新更新中为 Gmail、Docs 和 Keep 增添了新的语音功能，并推出了一款名为 Google Pics 的全新设计工具。同时，其 AI Inbox 功能也得到了升级与优化。这些更新旨在进一步提升用户在工作场景中的协作效率与创作体验，通过集成更智能的工具和交互方式，帮助用户更便捷地完成多项任务。

Google产品更新多模态语音

关联讨论 1 条

推荐理由：Google Workspace 直接植入了语音操作和设计工具 Pics，这波更新对办公效率很实在，做产品和运营的可以关注一下实际落地效果。

02:18

Google Blog：AI（RSS）

精选71

AI Mode 如何改变美国人的搜索方式

AI Mode 上线一周年，美国用户搜索行为呈现关键转变。数据显示，用户正从传统的关键词输入模式逐渐转向自然语言查询，这一变化反映了AI搜索技术的普及和用户交互方式的优化。自然语言查询的使用率显著提升，体现了AI搜索在日常信息获取中的影响力增强，预示着未来搜索体验的革新方向。

Google搜索现象/趋势

推荐理由：AI Mode 上线一周年，Google 第一次拿出用户行为数据，从关键词到自然语言的转向比想象中快，做搜索和 SEO 的可以重新理解用户意图了。

02:06

Google Research：Blog（网页）

精选65

经验研究助手（ERA）：从Nature发表到催化计算发现

Google Research开发的经验研究助手（ERA）现已在《Nature》期刊发表论文。这是一款基于Gemini的AI工具，旨在协助科学家编写专业级经验科学代码，其核心能力包括搜索文献、生成代码、探索方案并迭代优化，以加速耗时的计算实验过程。该工具已被用于构建“计算发现”原型，并已通过Google Labs的“可信赖测试者计划”向更广泛的科学家群体开放初步试用。

Google产品更新编码

推荐理由：谷歌把AI科学编码工具ERA发到了Nature，顺便在Google Labs推出了计算发现实验版，流行病预测和碳追踪的案例很扎实，科研圈的开发者和产品人可以关注下实际进展。

02:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选60

推进内容溯源，构建更安全、更透明的AI生态系统

OpenAI推出了新的AI内容溯源体系，旨在提升AI生成媒体的可信度。该体系集成了Content Credentials和SynthID两种技术标准，并配套推出了一个验证工具。此举的核心目标是帮助公众有效识别AI生成的内容，从而建立对AI媒体的信任，最终推动一个更安全、更透明的AI生态发展。

OpenAI产品更新安全/对齐

推荐理由：虽然内容溯源不是最性感的发布，但 Content Credentials 和 SynthID 的水印检测工具，是给未来所有 AI 生成内容打「身份证」的基础设施，做平台和合规的值得关注。

01:48

Google Blog：AI（RSS）

精选81

Google I/O 2026

在Google I/O 2026大会上，Google宣布了多项旨在让AI更普惠、更实用的更新。这些发布聚焦于提升人工智能的辅助能力，使其能够服务更广泛的用户群体。大会涵盖了AI在开发者工具、用户应用以及日常生活场景中的具体改进，强调通过技术优化实现更自然、更便捷的人机交互体验。

Google行业动态

关联讨论 4 条

推荐理由：Google I/O 2026 官方合集，一页看完今年谷歌所有的 AI 动作，从模型到产品都在这，嫌消息碎的收藏这篇就够了。

01:48

Google DeepMind：Blog（RSS）

精选64

介绍 Google Antigravity 2.0

Google Antigravity 2.0 是一款全新独立桌面应用，支持 macOS、Linux 和 Windows，无 IDE 绑定，由最新 Gemini 模型驱动，面向企业。核心为智能体，支持同步与异步交互。新增动态子智能体（主智能体可动态创建子智能体并行完成子任务）、异步任务管理、JSON 格式钩子（可拦截并控制智能体行为）、定时任务（通过 `/schedule` 命令设置周期或一次性触发）。引入“项目”概念替代“工作区”，可跨多个文件夹并独立设置权限与规则。新增斜杠命令：`/goal` 自动执行至完成、`/grill-me` 实施前反向确认、`/browser` 显式控制浏览器。语音输入改为实时转录。

智能体Google产品更新编码

关联讨论 2 条

推荐理由：Antigravity 2.0 脱离了 IDE 束缚，变成独立的 agent-first 应用，动态子代理和计划任务让自动化工作流不再需要手敲，开发者可以认真试一下。

01:48

Google DeepMind：Blog（RSS）

精选86

推出Gemini Omni多模态AI模型

谷歌推出原生多模态AI模型Gemini Omni，能够整合视频、图像、音频和文本等多种输入，生成高质量视频内容。其核心能力是通过自然语言对话进行视频编辑，并能保持角色一致性、物理规律与场景连贯性。首个模型Gemini Omni Flash已上线，未来将支持图像和音频输出。Gemini Omni结合了对物理世界的直觉理解与丰富的知识库，支持从写实到叙事的创意生成，并可通过多轮对话持续编辑视频，而不丢失原始场景上下文。

DeepMind多模态模型发布视频

关联讨论 10 条

推荐理由：这是 Gemini 首次将推理能力与视频生成结合，不是简单的文生视频，而是能通过对话迭代编辑、保持物理一致性，对视频创作者来说是个真正可用的工具。

01:48

Google DeepMind：Blog（RSS）

使用 Project Genie 和 Street View 模拟真实世界场景

谷歌宣布向全球的 Google AI Ultra 订阅者开放新的访问权限，并推出一项基于 Street View 数据驱动的全新功能。该功能能够模拟真实世界的地点与场景，标志着 AI 在结合地理信息与沉浸式体验方面迈出新步伐，为用户带来更具现实感的交互与探索可能性。

DeepMindGoogle产品更新图像生成

01:48

Google DeepMind：Blog（RSS）

精选68

加速遗传线索以逆转细胞衰老

生物学家利用Co-Scientist这一工具，成功发现能够使人类细胞年轻化的新型因子。该研究通过人工智能加速了遗传线索的探索过程，为逆转细胞衰老领域提供了新的关键因素。这一发现标志着利用技术手段干预生物老化进程取得了实质性进展。

DeepMindGoogle其他

推荐理由：DeepMind 的 Co-Scientist 找到了逆轉細胞老化的全新基因因子，這是 AI 真正在幫生物學家做發現的時刻，科學研究被加速了。

5月19日

23:18

Qwen：Blog Retrieval（API）

精选58

Qwen3.5-LiveTranslate：从声音到视觉，从词语到准确

Qwen3.5-LiveTranslate-Flash 是 Qwen 家族最新的同声传译模型，基于 Qwen3.5-Omni 架构，支持实时多模态翻译（音频、视频及视觉上下文）。语言覆盖大幅扩展：输入音频与输出文本从18种增至60种，输出音频从10种增至29种。采用 Readable Unit 技术，平均端到端每 token 延迟降至2.8秒，相比前代首 token 延迟降低3.45秒、每 token 延迟降低1.88秒。支持一句话启动的实时语音克隆和可动态配置的热词增强。在 FLEURS 和 CoVoST2 基准上翻译准确率超越主流商用大语音模型。

多模态模型发布语音

推荐理由：Qwen 把同声传译从听见进化到看懂，延迟压到 2.8 秒还带声纹克隆，跨国会议和直播场景终于有了一个实用度大幅提升的选择。

23:01

Hugging Face：Blog（RSS）

精选60

引入 Ettin Reranker 系列

Hugging Face 发布六个 Ettin Reranker 重排序模型（17m、32m、68m、150m、400m、1b），基于 Ettin ModernBERT 编码器，蒸馏 self-mxbai-rerank-large-v2 分数训练，在 MTEB(eng, v2) Retrieval 达各自规模 SOTA。模型以 Sentence Transformers CrossEncoder 接口提供，三行代码可调用。同时发布 train-sentence-transformers Agent Skill（v5.5.0），允许 AI 编码智能体在用户数据上微调模型。训练配方、数据集和脚本已全部开源。

Hugging Face检索增强开源/仓库搜索

推荐理由：从17M到1B的全尺寸reranker家族，每个量级都是SOTA，而且训练数据和代码全开放，做搜索和RAG的开发者可以无痛替换旧模型。

22:53

Cloudflare Blog

精选72

宣布Claude Managed Agents登陆Cloudflare

Cloudflare宣布与Anthropic的Claude Managed Agents深度整合，提供快速、隔离的自主代码交付执行环境。该集成使开发者能够在全球范围内扩展代理工作流，同时严格控制私有后端访问权限，并支持灵活自定义代理工具及运行时配置。

智能体Anthropic产品更新

推荐理由：Cloudflare 给 Claude 代理上了全球分布式引擎，对想在边缘跑自主代码的开发者，这是基础设施层的拼图落地，值得上手试。

20:57

Anthropic：Newsroom（网页）

精选62

毕马威与Anthropic建立全球联盟，全面整合Claude AI模型

毕马威宣布与Anthropic建立全球联盟，将Claude人工智能模型全面整合至其核心业务与数字平台。此举将向毕马威全球超过27.6万名员工开放Claude访问权限，并率先应用于税务与法律等领域的客户工具开发。双方还将合作开发面向私募股权投资组合公司及网络安全漏洞检测的新产品。毕马威强调此次合作基于其可信AI框架，旨在通过负责任、可治理的AI部署，加速企业数字化转型。

Anthropic行业动态部署/工程

推荐理由：KPMG 不是在做实验，而是直接把 Claude 嵌进 Digital Gateway 并推向 27.6 万员工，这是四大里 AI 落地最扎实的案例，企业服务领域的 AI 渗透正在从口号变成真动作。