AIHOT

全部动态一手 · 2393 条

全部一手资讯 X 论文

5月29日周五

5月28日周四

5月29日

00:33

Tomer Tunguz 博客（VC 分析）

精选61

AI智能体时代下的安全变革

Lemonade的CISO Jonathan Jaffe探讨了AI智能体时代的安全新挑战。他指出，AI对攻击者和防御者同样强大，但可被利用的漏洞窗口正在缩小，因为AI能更快地生成、审查和修补代码。为此，安全团队正向工程团队转型，例如Lemonade的安全部门均由工程师组成，并构建了包含智能体的内部AI平台。同时，每个智能体（单个终端上可能运行200到10000个）都需要被赋予身份，并在操作点由策略进行更复杂的管控，这超越了当前身份与访问管理系统的能力。

智能体MCP/工具大佬观点

推荐理由：Jaffe 给出的结论很提气，AI 对防御方的加成被市场严重低估了，尤其每个 Agent 必须拥有身份和策略控制这个预判，值得所有在做 Agent 架构的人看一遍。

00:28

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选65

OpenAI 的前沿治理框架

OpenAI 发布了“前沿治理框架”，阐述其 AI 安全、安全与风险管理实践如何与欧盟和加州新出台的法规要求对齐。该框架旨在规范其前沿模型的开发与部署流程。

OpenAI安全/对齐政策/监管

关联讨论 1 条

推荐理由：OpenAI 首次把内部安全实践打包成一个对外框架，是为了应对欧盟和加州监管。与其说是技术突破，不如说是合规信号，所有做前沿模型的公司都得开始交这份作业了。

00:06

Google Blog：AI（RSS）

Google I/O 2026 一文速览：12 大重要时刻

Google I/O 2026 发布会上披露了 12 个重要时刻，其中包括 Gemini Omni 和 Gemini 3.5 Flash 等产品的相关消息。

Google产品更新多模态推理

关联讨论 5 条

00:00

LMSYS：Blog（Chatbot Arena 团队）

精选61

LMSYS与Intel合作通过异构CPU+GPU EPD架构提升视觉语言模型服务性能

LMSYS团队（Intel与SGLang）通过Dynamo和SGLang框架，为视觉语言模型（VLM）启用了异构编码-预填充-解耦（EPD）架构。该方案将视觉编码任务从GPU卸载至CPU（如Intel Xeon 6747P），与GPU协同工作。在Qwen3-VL-8B-Instruct模型的测试中，采用4 CPU + 1 GPU作为编码器、4 GPU作为预填充解码器（能力比R=12）的配置，在ISL/OSL 128/256、1080p 8张图像的负载下，实现了P99 TTFT和请求吞吐量约1.2倍至1.3倍的提升，并将P99 TPOT降低了约1.3倍至30倍。

多模态推理教程/实践部署/工程

推荐理由：做VLM服务部署的可以认真看一下，用CPU头节点做异构EPD分离，几乎零成本换来了TTFT和TPOT的显著提升，有完整脚本和benchmark，能直接上手试。

5月28日

23:41

Google Developers Blog（RSS）

精选64

社区如何利用Tunix和TPU训练Gemma学会"思考"

Google在Kaggle举办的Tunix黑客马拉松，挑战开发者利用TPU和有限算力，将小型基础模型转变为通用推理引擎。获胜团队通过多阶段后训练流程实现了这一目标，该流程结合了监督微调（SFT）与GRPO、SimPO等先进对齐技术。比赛结果表明，社区能够借助开源资源成功训练出高能力的结构化推理模型。

Google开源生态教程/实践数据/训练

推荐理由：Google 官方比赛总结，证明用 Kaggle TPU 和开源工具就能把 Gemma 训练出不错推理能力，对想自己微调模型的小团队是个实用参考。

22:07

公众号：腾讯混元

Hy-Memory 发布：为 Openclaw 打造的记忆插件

腾讯混元推出 Hy-Memory，一款为 Openclaw 长期协作型 Agent 设计的记忆插件。它采用 6 层记忆框架、System1/System2 双系统及演化链技术，解决 Agent 长期使用中的记忆漂移与碎片化问题。在 LongMemEval 上得分 85.2，在偏好、时序推理、知识更新维度领先；PersonaMem 评测超越所有竞品。相比其他方案，记忆数量降低 70%+，单条信息密度高 45%+，token 消耗降低 35%，写入速度为 Graphiti 的 8 倍，支持本地嵌入式存储，安装仅需一行命令，提供 Lite/Pro/Ultra 三档。

智能体产品更新开源/仓库

22:04

公众号：小米 MiMo

Xiaomi MiMo Orbit 首批 Agent 生态共建合作伙伴公布

智能体开源生态行业动态

22:00

OpenRouter：Announcements（RSS）

OpenRouter 完成 1.13 亿美元 B 轮融资

OpenRouter 完成 1.13 亿美元 B 轮融资，由 CapitalG 领投，多家机构跟投，现有投资者 Andreessen Horowitz 和 Menlo Ventures 继续参与。

行业动态部署/工程

22:00

OpenRouter：Announcements（RSS）

精选63

OpenRouter 完成 1.13 亿美元 B 轮融资

OpenRouter 宣布获得 1.13 亿美元 B 轮融资，由 CapitalG 领投，NVentures、ServiceNow Ventures 等多家机构参投，现有投资者 Andreessen Horowitz 和 Menlo Ventures 继续跟投。

行业动态部署/工程

推荐理由：OpenRouter融了1.13亿美元，领投方CapitalG，跟投名单里几乎全是云计算巨头，这不是一家公司的钱，是基础设施层的一次战略布局，开发者选模型的路由成本可能因此改写。

21:12

Anthropic：Newsroom（网页）

精选63

Anthropic 开设米兰办公室，深化意大利企业合作与 AI 安全对话

Anthropic 在米兰开设其欧洲第六家办公室，旨在与意大利企业及开发者社区合作，负责任地构建和扩展 Claude，并参与关于 AI 的对话。本地团队已与多家金融、生命科学、能源及汽车行业的公司展开合作。案例包括与 JAKALA 合作将 Claude 部署至超 3,000 席位，释放约 70% 高级团队时间；Satispay 借此将 18 个月路线图压缩至 7 个月；Bending Spoons 的大部分代码变更已与 Claude Code 共同完成。Anthropic 承诺支持意大利企业、研究及文化，通过安全的 AI 转型促进发展。

Anthropic行业动态

推荐理由：Anthropic 把欧洲办公室开到第六个，这次还拉上了教皇背书，但更实在的是 Satispay 用 Claude 把 18 个月路线图砍到 7 个月的落地案例，对企业怎么做 AI 落地有参考价值。

21:11

Cloudflare Blog

我们如何构建Cloudflare的数据平台及其上的AI智能体

Cloudflare构建了名为Town Lake的统一分析平台，并基于此开发了内部AI智能体Skipper。

智能体教程/实践部署/工程

20:47

Mistral AI：News（网页）

精选77

发布 Search Toolkit

Mistral AI 发布了 Search Toolkit 的公共预览版。这是一个用于构建 AI 应用生产级搜索管道的可组合框架。该框架旨在解决团队在搭建搜索基础设施时，因数据摄取、检索和评估工具分散而耗费过多工程时间的问题。Search Toolkit 将这三者整合到单一框架与共享接口中，使团队能更专注于提升搜索质量。该工具开源，可部署在云端、本地或边缘环境，并支持企业搜索、RAG 等多种检索场景。

MCP/工具检索增强产品更新搜索

推荐理由：做 RAG 的团队都该看一眼，它把 ingestion、retrieval、evaluation 揉进一个开源框架，省下的大把集成时间够你调几次检索策略了。