AIHOT

全部动态一手 · 2393 条

全部一手资讯 X 论文

5月22日周五

5月21日周四

5月20日周三

5月22日

01:09

OpenAI：官网动态（RSS · 排除企业/客户案例）

AdventHealth携手OpenAI推进全人医疗

AdventHealth正在采用OpenAI的ChatGPT for Healthcare解决方案，旨在优化医疗工作流程，减轻医务人员行政负担，从而将更多时间还给患者护理。该合作利用人工智能技术处理文档、协调等非临床任务，以提升整体医疗效率与患者体验。

OpenAI行业动态

01:04

Cursor Blog

精选58

构建云端智能体的经验总结

云端智能体已从本地智能体的简单扩展，发展为具备独立环境、可并行无人值守处理长任务的系统。构建的核心经验在于：完整的开发环境是输出质量的关键，这需重建大量基础设施；可靠性方面，团队从自研架构迁移至Temporal平台，将可靠性提升至99.9%以上，该平台每日处理超5000万次操作，支撑超40%的代码拉取请求；同时，实现了智能体循环、机器状态与对话状态的解耦，以适应复杂的跨环境协作。

智能体教程/实践编码

推荐理由：Cursor 把这一年踩过的坑全摊开了，从环境构建到持久化执行，基本就是一份 agent 平台内部架构课，搭同类产品的团队值得逐段读。

00:33

Google Developers Blog（RSS）

精选69

发布 Kotlin版ADK与Android版ADK 0.1.0：在Android及其他平台构建AI Agent

Google发布了面向开发者的新工具包：Kotlin版ADK与Android版ADK 0.1.0。这两个工具包旨在帮助开发者构建AI Agent。其中，Kotlin版ADK将代理工作流引入后端项目开发；Android版ADK则专注于移动端应用，提供了构建AI代理所需的特定功能。此次发布为开发者提供了在Android生态及更广泛平台创建AI应用的官方工具基础。

智能体Google产品更新端侧

推荐理由：Google 把 Agent 开发框架搬上 Android，0.1 版本虽早，但移动端 AI 应用有了官方入口，做 Android 的该跟进了。

00:33

Google Developers Blog（RSS）

精选75

推出 Gemini for Home 赋能服务提供商与硬件合作伙伴

Google 通过推出全栈 Gemini AI 解决方案扩展其智能家居生态系统。该方案集成了先进的摄像头智能、自然语言查询功能和日常活动摘要能力。它为服务提供商和硬件制造商提供了现成的参考设计与API，使其无需大量研发投入即可构建主动式、品牌化的智能家居服务。该计划旨在超越基础设备控制，迈向能够理解情境并实时响应用户需求的AI原生智能家居。

Google产品更新多模态端侧

推荐理由：Google 把 Gemini 塞进智能家居，直接给硬件商和 ISP 提供交钥匙方案，这一步可能比 Nest 当年更有侵略性，做智能家居的得留意了。

00:07

美团 LongCat：HuggingFace 新模型

精选73

LongCat-Video-Avatar-1.5：升级版音频驱动数字人视频生成框架

美团LongCat团队发布了LongCat-Video-Avatar-1.5，一个专注于音频驱动数字人视频生成的开源框架。其核心升级在于采用Whisper-Large音频编码器，显著优化了唇部动态的流畅度与自然度。该版本实现了精准的唇形同步、全身时序稳定性以及长视频中的身份一致性，并能泛化应用于动漫、动物及多人交互等复杂场景。通过基于DMD2的步蒸馏技术，模型仅需8步即可高效推理。团队还构建了一个涵盖多场景、多语言的人工评估基准，通过大规模主观评分与专家分析，验证了其在多项关键维度上的优异性能。

Hugging Face图像生成多模态开源/仓库

关联讨论 1 条

推荐理由：美团把数字人模型升级到1.5版，换了Whisper做音频编码，唇形同步比之前自然不少，而且开源了训练代码，做电商直播和虚拟博主的朋友可以直接拿过来跟商业方案掰手腕。

00:00

Mistral AI：News（网页）

连接点滴：在 Studio 中使用内置与自定义 MCP 进行构建

Mistral AI 的 Studio 产品旨在帮助用户构建、测试并运行 AI 智能体与应用。其核心功能是通过可复用的连接器、直接的工具调用以及人机协同审批控制，将企业数据连接到 AI 应用中。该产品支持使用内置及自定义的 MCP。

MCP/工具产品更新

关联讨论 1 条

00:00

Mistral AI：News（网页）

Vibe中的远程智能体，由Mistral Medium 3.5驱动。介绍Mistral Medium 3.5、Vibe中的远程编程智能体，以及Le Chat中用于复杂任务的新Work模式。2026年5月22日，Mistral AI

Mistral AI发布了新模型Mistral Medium 3.5。该模型为Vibe产品中的远程编程智能体（remote coding agents）提供支持，这些智能体可在终端、IDE和后台运行。同时，Le Chat新增Work模式，专为处理复杂任务而设计。发布日期为2026年5月22日。

智能体模型发布编码

关联讨论 2 条

5月21日

21:57

公众号：百度智能云（文心）

百度伐谋2.0：398轮演化，让山东港口青岛港再提效

百度伐谋2.0经过了398轮演化迭代，在山东港口青岛港的作业效率上取得了进一步的提升。

行业动态

21:57

公众号：百度智能云（文心）

AI重构的2026年，普通人的边界在哪里？

文章来自百度智能云，探讨2026年AI技术对普通人能力与职业边界的影响。文中未提及具体模型、版本或benchmark数据，仅从宏观视角讨论AI重构带来的机遇与挑战。

搜索现象/趋势

20:05

公众号：昆仑万维（天工）

算力拉开行业差距！方汉深度解读 AI 产业变革、职场走向与企业转型之道

昆仑万维天工方汉指出，算力是拉开AI行业差距的核心因素。他从AI产业变革、职场走向与企业转型三个维度展开深度阐述，强调算力竞争将主导下一阶段发展格局。

大佬观点现象/趋势

18:04

腾讯混元：Research（API）

Hy-MT2：面向实际应用场景的高性能多语言翻译模型