AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
精选全部日报更多
全部动态一手 · 2393 条
全部一手资讯X论文
5月22日周五
5月21日周四
5月20日周三
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月22日
01:09
OpenAI:官网动态(RSS · 排除企业/客户案例)
43
AdventHealth携手OpenAI推进全人医疗

AdventHealth正在采用OpenAI的ChatGPT for Healthcare解决方案,旨在优化医疗工作流程,减轻医务人员行政负担,从而将更多时间还给患者护理。该合作利用人工智能技术处理文档、协调等非临床任务,以提升整体医疗效率与患者体验。

OpenAI行业动态
01:04
Cursor Blog
精选58
构建云端智能体的经验总结

云端智能体已从本地智能体的简单扩展,发展为具备独立环境、可并行无人值守处理长任务的系统。构建的核心经验在于:完整的开发环境是输出质量的关键,这需重建大量基础设施;可靠性方面,团队从自研架构迁移至Temporal平台,将可靠性提升至99.9%以上,该平台每日处理超5000万次操作,支撑超40%的代码拉取请求;同时,实现了智能体循环、机器状态与对话状态的解耦,以适应复杂的跨环境协作。

智能体教程/实践编码

推荐理由:Cursor 把这一年踩过的坑全摊开了,从环境构建到持久化执行,基本就是一份 agent 平台内部架构课,搭同类产品的团队值得逐段读。
00:33
Google Developers Blog(RSS)
精选69
发布 Kotlin版ADK与Android版ADK 0.1.0:在Android及其他平台构建AI Agent

Google发布了面向开发者的新工具包:Kotlin版ADK与Android版ADK 0.1.0。这两个工具包旨在帮助开发者构建AI Agent。其中,Kotlin版ADK将代理工作流引入后端项目开发;Android版ADK则专注于移动端应用,提供了构建AI代理所需的特定功能。此次发布为开发者提供了在Android生态及更广泛平台创建AI应用的官方工具基础。

智能体Google产品更新端侧

推荐理由:Google 把 Agent 开发框架搬上 Android,0.1 版本虽早,但移动端 AI 应用有了官方入口,做 Android 的该跟进了。
00:33
Google Developers Blog(RSS)
精选75
推出 Gemini for Home 赋能服务提供商与硬件合作伙伴

Google 通过推出全栈 Gemini AI 解决方案扩展其智能家居生态系统。该方案集成了先进的摄像头智能、自然语言查询功能和日常活动摘要能力。它为服务提供商和硬件制造商提供了现成的参考设计与API,使其无需大量研发投入即可构建主动式、品牌化的智能家居服务。该计划旨在超越基础设备控制,迈向能够理解情境并实时响应用户需求的AI原生智能家居。

Google产品更新多模态端侧

推荐理由:Google 把 Gemini 塞进智能家居,直接给硬件商和 ISP 提供交钥匙方案,这一步可能比 Nest 当年更有侵略性,做智能家居的得留意了。
00:07
美团 LongCat:HuggingFace 新模型
精选73
LongCat-Video-Avatar-1.5:升级版音频驱动数字人视频生成框架

美团LongCat团队发布了LongCat-Video-Avatar-1.5,一个专注于音频驱动数字人视频生成的开源框架。其核心升级在于采用Whisper-Large音频编码器,显著优化了唇部动态的流畅度与自然度。该版本实现了精准的唇形同步、全身时序稳定性以及长视频中的身份一致性,并能泛化应用于动漫、动物及多人交互等复杂场景。通过基于DMD2的步蒸馏技术,模型仅需8步即可高效推理。团队还构建了一个涵盖多场景、多语言的人工评估基准,通过大规模主观评分与专家分析,验证了其在多项关键维度上的优异性能。

Hugging Face图像生成多模态开源/仓库
关联讨论 1 条IT之家(RSS)
推荐理由:美团把数字人模型升级到1.5版,换了Whisper做音频编码,唇形同步比之前自然不少,而且开源了训练代码,做电商直播和虚拟博主的朋友可以直接拿过来跟商业方案掰手腕。
00:00
Mistral AI:News(网页)
55
连接点滴:在 Studio 中使用内置与自定义 MCP 进行构建

Mistral AI 的 Studio 产品旨在帮助用户构建、测试并运行 AI 智能体与应用。其核心功能是通过可复用的连接器、直接的工具调用以及人机协同审批控制,将企业数据连接到 AI 应用中。该产品支持使用内置及自定义的 MCP。

MCP/工具产品更新
关联讨论 1 条Mistral AI:News(网页)
00:00
Mistral AI:News(网页)
69
Vibe中的远程智能体,由Mistral Medium 3.5驱动。介绍Mistral Medium 3.5、Vibe中的远程编程智能体,以及Le Chat中用于复杂任务的新Work模式。2026年5月22日,Mistral AI

Mistral AI发布了新模型Mistral Medium 3.5。该模型为Vibe产品中的远程编程智能体(remote coding agents)提供支持,这些智能体可在终端、IDE和后台运行。同时,Le Chat新增Work模式,专为处理复杂任务而设计。发布日期为2026年5月22日。

智能体模型发布编码
关联讨论 2 条Mistral AI:News(网页)X:Mistral AI (@MistralAI)
5月21日
21:57
公众号:百度智能云(文心)
29
百度伐谋2.0:398轮演化,让山东港口青岛港再提效

百度伐谋2.0经过了398轮演化迭代,在山东港口青岛港的作业效率上取得了进一步的提升。

行业动态
21:57
公众号:百度智能云(文心)
26
AI重构的2026年,普通人的边界在哪里?

文章来自百度智能云,探讨2026年AI技术对普通人能力与职业边界的影响。文中未提及具体模型、版本或benchmark数据,仅从宏观视角讨论AI重构带来的机遇与挑战。

搜索现象/趋势
20:05
公众号:昆仑万维(天工)
43
算力拉开行业差距!方汉深度解读 AI 产业变革、职场走向与企业转型之道

昆仑万维天工方汉指出,算力是拉开AI行业差距的核心因素。他从AI产业变革、职场走向与企业转型三个维度展开深度阐述,强调算力竞争将主导下一阶段发展格局。

大佬观点现象/趋势
18:04
腾讯混元:Research(API)
Hy-MT2:面向实际应用场景的高性能多语言翻译模型
17:26
公众号:面壁智能(MiniCPM)
40
面壁智能 x OpenBMB 端侧大模型开源周,即将来袭!
开源生态端侧行业动态
16:43
公众号:腾讯混元
58
腾讯混元全新翻译模型Hy-MT2开源,小程序「腾讯Hy翻译」开放体验
开源生态模型发布
16:08
公众号:火山引擎
46
Agent Plan、Coding Plan上新:新增DeepSeek V4

火山引擎的Agent Plan和Coding Plan产品新增支持DeepSeek V4模型,用户可在相关计划中调用该模型进行开发与部署。

智能体DeepSeek产品更新编码
13:43
公众号:京东JoyAI
49
京东数字人核心能力升级

京东数字人近日完成核心能力升级,从“会播、会答”的数字主播进化为面向直播经营全链路的智能增长中枢,帮助商家以更低成本打造接近真人头部达播效果的直播间。已累计服务超7万商家,2026年一季度开播量同比激增10倍。该产品为京东自研AI,曾获2024年吴文俊奖,实现长时长、自由态、高频互动,推出采销东哥、总裁、明星及IP数字人。

产品更新视频语音
11:42
公众号:智谱(GLM)
36
郑栅洁主任主持召开民营企业座谈会,智谱等五家企业参会

国家发展改革委主任郑栅洁主持召开民营企业座谈会,智谱等五家企业负责人参会。会议围绕民营企业发展情况、面临的问题及意见建议进行交流。智谱作为人工智能领域民营企业代表参与座谈。

政策/监管行业动态
11:05
公众号:火山引擎
42
火山剧创1.0上线:重塑短剧工业化流程,制作周期缩短80%

火山剧创1.0正式发布,旨在重塑短剧工业化生产流程。该产品将短剧制作周期缩短80%,通过标准化、自动化工具链提升效率,降低门槛。火山引擎依托自身技术积累,为短剧行业提供从创意到成片的一站式解决方案。

产品更新视频
10:30
公众号:智谱(GLM)
44
下一代大模型推理网络架构:ZCube如何有效破解网络瓶颈?

智谱(GLM)提出ZCube,这是一种专为下一代大模型设计的推理网络架构,目标在于有效破解大规模模型推理时面临的网络瓶颈问题。

推理教程/实践部署/工程
10:16
Claude Code:GitHub Releases(RSS)
51
Claude Code v2.1.146 更新

本次更新主要调整了功能命名与交互逻辑,将 `/simplify` 命令更名为 `/code-review` 并支持分级,同时优化了自动模式与用户提问的交互。重点修复了多项影响稳定性与体验的 Bug,包括 Windows 系统上通过 winget 安装 PowerShell 后工具失效、终端全屏闪烁、后台会话权限重复请求、主题编辑器响应异常,以及 MCP 分页数据丢失等关键问题。此外,更新还改进了自动更新功能的网络容错能力,并提升了大文件差异渲染的性能。

Anthropic产品更新编码部署/工程
06:44
智谱:研究(网页内嵌数据)
精选69
ZCube:超大规模大模型推理的网络优化

针对超大规模大模型推理,ZCube网络架构通过取消Spine层、将Leaf交换机分组并全互联等创新设计,有效解决了推理网络的拥塞问题。该架构在集群实测中,实现了交换机与光模块资本支出减少33%、GPU平均推理吞吐提升15%,同时将首token延迟的P99值大幅降低40.6%,在降低成本的同时显著提升了推理性能。

推理论文/研究部署/工程
关联讨论 1 条X:智谱 Z.ai (@Zai_org)
推荐理由:千卡以上推理集群的团队该看一眼,智谱这个网络设计砍掉三分之一交换机成本,吞吐还涨15%,尾时延降四成,有实测数据不是白皮书。
06:27
Tomer Tunguz 博客(VC 分析)
精选67
不可持续的补贴

三大AI厂商定价策略出现显著分化:Google的AI价格年增两倍,但其旗舰模型Gemini 3.1 Pro(输入2美元、输出12美元)仍是市场最低价;OpenAI的GPT-5.5(5美元/30美元)经历短期补贴后再次涨价;Anthropic的Claude Opus 4.7(5美元/25美元)价格保持稳定,且对最强模型有所下调。这些变动标志着行业正从不惜成本的市场份额争夺,转向注重利润与现金流管理的商业理性,以应对持续高昂的资本支出压力。

AnthropicGoogleOpenAI大佬观点

推荐理由:Tunguz 把三家模型厂的定价画成曲线,涨价的真相一目了然——烧钱抢份额的阶段结束了,做 AI 产品的都该重新算算成本模型。
04:39
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选65
Ramp工程师如何用Codex加速代码审查

Ramp工程师团队通过集成Codex与GPT-5.5模型,实现了代码审查流程的显著提速。该工具能够在数分钟内为代码变更提供实质性反馈与改进建议,将传统需耗时数小时的审查周期大幅压缩,从而加快了产品迭代与上线的效率。

OpenAI教程/实践编码

推荐理由:Ramp 这个案例把 GPT-5.5 的代码审查能力展示得很具体,从几小时到几分钟的提升很有说服力,做 code review 自动化的可以直接参考他们的流程。
03:50
Google Blog:AI(RSS)
精选68
我们在 I/O 2026 发布的 100 件事

在 Google I/O 2026 开发者大会上,公司共发布了 100 项内容,重点介绍了 Gemini Omni、Google Antigravity 和 Universal Cart 等新产品的核心亮点。

Google产品更新多模态
关联讨论 4 条Google Blog:AI(RSS)Google Research:Blog(网页)X:Google AI for Developers (@googleaidevs)Ars Technica:AI(RSS)
推荐理由:I/O 今年还是全场景轰炸,Gemini Omni 加一堆新产品,花十分钟扫一眼,未来半年 AI 要替你做哪块活就清楚了。
03:07
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选83
OpenAI模型证伪了离散几何中的一个核心猜想

OpenAI开发的人工智能模型成功解决了数学界悬而未决逾80年的“单元距离问题”,并由此推翻了离散几何领域的一个核心猜想。这一突破被视作人工智能驱动数学研究的里程碑事件,标志着AI在基础科学理论探索中取得了实质性进展。该模型通过创新算法处理复杂的几何问题,展示了机器在自动化发现与验证数学猜想方面的巨大潜力。

OpenAI推理论文/研究
关联讨论 14 条X:Noam Brown (@polynoamial)X:AI Safety Memes (@AISafetyMemes)X:Emad Mostaque (@EMostaque)The Decoder:AI News(RSS)X:Greg Brockman (@gdb)X:OpenAI (@OpenAI)Hacker News 热门(buzzing.cc 中文翻译)X:Sam Altman (@sama)TechCrunch:AI(RSS)X:阿易 AI Notes (@AYi_AInotes)X:Kim (@kimmonismus)X:Rohan Paul (@rohanpaul_ai)IT之家(RSS)X:Oran Ge (@oran_ge)
推荐理由:OpenAI模型独自推翻了一个80年未解的离散几何猜想,这种级别的数学突破以前只属于人类顶级大脑,现在AI也做到了,做理论研究的可以看看它怎么做的。
01:19
Google Blog:AI(RSS)
46
新实验让Google Beam的团队会议体验更佳

Google推出一项针对混合办公场景的新实验功能。该功能通过改进视觉与音频技术,在Google Beam平台上实现参会者真实尺寸与声音的还原,显著提升了远程协作的沉浸感与包容性,旨在解决混合会议中常见的疏离问题。

Google产品更新
00:48
Claude:Blog(网页)
精选59
Anthropic销售负责人如何利用Claude Cowork管理4000个客户账户

Anthropic美国中端市场业务负责人Travis Bryant利用Claude Cowork自动化销售管理工作。该工具帮助他高效完成客户倾向性评分、每日客户简报准备及每周销售预测报告生成,每晚自动处理4000个账户数据,替代了以往跨部门团队需数百小时完成的工作。通过自动化日常任务调度,他每天节省约90分钟,并将数据整合为可交互的销售仪表板,使其能更专注于客户沟通与战略决策。

Anthropic教程/实践部署/工程
关联讨论 1 条Claude:Blog(网页)
推荐理由:Travis 把 4000 个账户的评分一夜跑通,比自动报表更值得关注,中小销售团队照抄就能省掉跨部门数百小时,这是 Claude Cowork 在企业场景最落地的实践之一。
5月20日
23:55
Gary Marcus:The Road to AI We Can Trust(RSS)
40
生成式AI是否会沦为科技行业的"越南战争"?公众抵制能否引领AI走向更优的发展路径?

当前生成式AI的狂飙突进正引发深度审视,其潜在风险与社会反弹可能将该技术拖入类似“越南战争”的漫长泥潭。公众的担忧与抵制运动,正从数据隐私、内容真实性到伦理冲击等多方面施加压力,迫使行业进行根本性反思。这些反作用力虽可能延缓发展,却也可能成为校准方向的关键力量,推动技术在安全、透明和负责任的基础上重新定义进步。我们正身处一个充满挑战与不确定性的“有趣时代”。

大佬观点现象/趋势
20:00
OpenRouter:Announcements(RSS)
50
一个机器人正朝你奔来:你希望它运行在Claude还是Grok上?

一场涵盖11个大语言模型的30轮大逃杀式评测,花费482美元推理成本,得出了一个应改变读者阅读模型基准方式的关键发现。

推理评测/基准
19:12
公众号:百度智能云(文心)
25
百度智能云618 AI狂欢季:云服务器低至19.9元/年,AI产品1元起

百度智能云618 AI狂欢季推出全年超低价活动。云服务器低至19.9元/年,OpenClaw轻量服务器9.9元/月,AI能力产品低至1元起,AI Coding低至40元/月。活动覆盖开发测试、模型应用、Agent部署与业务落地等全栈AI能力。充值最高赠送26888元代金券,企业认证100%中奖。

行业动态
19:09
公众号:火山引擎
24
在戛纳,和电影大师们聊了聊Seedance

火山引擎的Seedance在戛纳电影节上与多位电影大师进行了交流。

其他视频
18:30
公众号:昆仑万维(天工)
39
量子位2026AI榜单出炉 昆仑万维荣获两大重磅奖项

量子位2026AI榜单发布,昆仑万维荣获两大重磅奖项。

行业动态
16:45
OpenAI:官网动态(RSS · 排除企业/客户案例)
46
OpenAI"国家教育计划"的下一阶段

OpenAI正在推进其“国家教育计划”,通过与教育机构建立新合作、开展教师培训、提供AI工具,扩大人工智能在学校中的应用,以提升全球学习成果。该计划旨在系统性地将AI技术融入教学场景,增强教育资源的可及性与教学效率。

OpenAI行业动态
15:00
公众号:阶跃星辰(Step)
55
阶跃星辰与金蝶战略合作,大模型驱动企业服务从SaaS迈向Agent

阶跃星辰与金蝶达成战略合作,双方将利用大模型技术推动企业服务范式变革,核心方向是从传统SaaS模式向AI智能体(Agent)模式升级。

智能体行业动态
13:53
公众号:通义实验室(千问)
55
Qwen3.5-LiveTranslate 发布:开口即同传

通义实验室(千问)发布 Qwen3.5-LiveTranslate,实现“开口即同传”——用户说话的同时即可获得翻译结果,支持实时语音同声传译。目前尚未公布模型参数规模、benchmark 分数、上下文长度等具体技术细节。

多模态模型发布语音
11:38
OpenAI:官网动态(RSS · 排除企业/客户案例)
50
介绍 OpenAI for Singapore

OpenAI for Singapore 宣布启动一项多年期人工智能合作计划,重点扩展 AI 技术在新加坡的部署范围,加强本地人才队伍建设,并为企业及公共服务部门提供 AI 支持。该合作旨在通过资源整合,推动新加坡在 AI 领域的竞争力提升,加速技术创新和应用落地,覆盖商业与公共领域的数字化转型需求。

OpenAI行业动态
11:04
公众号:通义实验室(千问)
精选62
Qwen3.7-Max 重新定义 AI Agent 基座

通义实验室推出 Qwen3.7-Max,定位为重新定义 AI 智能体基座的模型,侧重提升智能体的基础能力与架构。

智能体模型发布

推荐理由:Qwen3.7-Max 是通义系列对 Agent 基座的一次关键升级,发布时间虽已过两周,但做 Agent 的开发者仍不能忽略,选型必看。
10:49
Qwen:Blog Retrieval(API)
精选68
Qwen3.7-Max:面向智能体时代的最新专有模型

通义千问发布 Qwen3.7-Max,专为智能体时代设计。它具备从原型到复杂多文件工程的编码智能体能力,通过 MCP 和多智能体编排实现办公自动化,能自主执行超 1000 步工具调用(如 35 小时全自主内核优化)。兼容 Claude Code、OpenClaw、Qwen Code 等多框架。在多项基准测试中超越 Opus-4.6 Max 等模型:Terminal Bench 2.0 (69.7)、SWE-Verified (80.4)、GPQA Diamond (92.4)、HLE (41.4) 等。现已通过阿里云 Model Studio 提供 API 调用。

智能体模型发布编码
关联讨论 10 条X:OpenRouter (@OpenRouter)Hacker News 热门(buzzing.cc 中文翻译)IT之家(RSS)X:阿里云 / Alibaba Cloud (@alibaba_cloud)X:通义千问 / Qwen (@Alibaba_Qwen)Qwen:Blog Retrieval(API)X:Kim (@kimmonismus)X:X.PIN (@thexpin)X:Rohan Paul (@rohanpaul_ai)X:opencode (@opencode)
推荐理由:Qwen3.7 把 Agent 能力拉到生产级,35 小时自主内核优化和跨框架泛化,不再是 demo 玩具,做 Agent 应用的可以认真评估了。
07:33
Anthropic:Newsroom(网页)
精选65
拓宽关于前沿AI的对话

Anthropic为构建负责任的先进AI,正与全球多元群体展开对话。首轮讨论汇集了超过15个宗教、哲学及跨文化传统的学者与伦理学者,旨在为Claude等模型的道德形成与价值观对齐提供多元视角。受“外部良知”概念启发,团队开发并测试了伦理承诺提醒工具,初步实验显示其能有效降低模型不对齐行为。公司计划未来将对话拓展至法律、心理学及公民社会等领域,以共同应对AI对社会结构的重塑。

Anthropic安全/对齐推理
关联讨论 1 条X:Anthropic (@AnthropicAI)
推荐理由:Anthropic在做一件少见的事——请神学家和哲学家帮忙塑造Claude的‘性格’,初步实验发现让模型在决策前暂停反思能降低偏差,做AI对齐的值得读一下。
06:10
Claude Code:GitHub Releases(RSS)
精选64
Claude Code v2.1.145版本更新

本次更新为Claude Code工具带来了多项功能增强与问题修复。新功能包括:新增JSON格式的会话列表命令以便脚本化操作,并在OTEL追踪中完善了Agent父子关系。插件浏览界面现可预览详细信息。在稳定性方面,修复了权限提示被绕过的安全问题、MCP参数校验错误、终端窗口调整后的显示冻结,以及非ASCII名称导致的API调用失败等问题。同时改进了Read工具的文件超限处理,并优化了任务列表排序和状态栏信息显示等交互细节,整体提升了工具的易用性与可靠性。

智能体Anthropic产品更新部署/工程
关联讨论 2 条Claude Code:GitHub Releases(RSS)X:Claude Devs (@ClaudeDevs)
推荐理由:Claude Code 这次版本把可编程性和可观测性提升了一大截,尤其 `claude agents --json` 和 OTEL 改进,做自动化脚本和监控的可以直接更新了。
05:45
Claude:Blog(网页)
精选73
Claude Code的HTML输出:非凡的有效性

Claude Code团队正从Markdown转向HTML作为主要输出格式。Markdown虽简洁,但在信息密度、阅读性、分享和交互方面存在局限。HTML能支持表格、CSS样式、SVG图表和JavaScript交互,提供更清晰的视觉结构和高信息密度。由于HTML文件可通过浏览器直接打开和分享,便于团队协作审阅。Claude Code利用其广泛的上下文获取能力生成实用的HTML制品,适用于项目规划、文档编写和验证等多种场景,显著提升了AI生成内容的可读性与实用性。

智能体Anthropic教程/实践编码

推荐理由:Claude Code 团队的人亲自告诉你为什么用 HTML 而不是 Markdown,从设计原型到可交互报告全在一个文件里搞定。附带的模板和提示词,开发者可以直接抄。
‹ 上一页
1…1011121314…50
下一页 ›