AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
精选全部日报更多
全部动态资讯 · 9066 条
全部一手资讯X论文
6月10日周三
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月10日
17:50
公众号:百度智能云(文心)
精选63
百度百舸联合复旦提出LU-KV框架,被ICML 2026录用

百度百舸团队与复旦大学合作提出Long-horizon Utility KV(LU-KV)框架,将头级KV Cache预算分配建模为面向长程边际效用的全局组合优化问题。LU-KV通过离线画像估计注意力头边际贡献曲线,结合凸包松弛与基于边际效用的贪心求解器,在较低开销下得到接近最优的预算配置,可适配SnapKV、KeyDiff等多类压缩方法。在LongBench和RULER基准上,80%压缩比下性能损失小,降低显存占用和推理延迟。相关论文被ICML 2026录用。

推理论文/研究

推荐理由:ICML接收的KV Cache压缩新方法,把缓存预算分配从看当前分数改成全局优化,能显著降低显存占用,做长上下文推理的值得细读。
17:50
公众号:百度智能云(文心)
26
利尔达与百度智能云合作,将AI能力集成至模组

物联网模组厂商利尔达(蜂窝模组出货量全球第四)与百度智能云合作,将后者的多模态实时互动、超拟人语音模型、长期记忆、情绪识别、Function Call设备控制、MCP生态扩展等AI能力通过轻量级SDK深度集成至模组中。联合方案实现端到端响应时长低于2秒,休眠功耗低至3µA,支持多语言出海,并将硬件研发周期从年压缩至周级别。百度智能云已服务逾千家AI硬件企业,覆盖国民级终端、全场景智能及AI原生硬件。

端侧行业动态语音
17:49
Bloomberg:Technology(RSS)
40
百度CFO透露OpenClaw创始人曾寻求合作以增强AI个人助理搜索能力

百度CFO Henry He在Bloomberg Invest Hong Kong的Odd Lots播客中谈及OpenClaw创始人Dario Amodei时透露,对方曾“请求百度与他合作”,以增强一款流行AI个人助理的搜索相关技能。He未提及具体模型或版本号,也未说明合作是否达成。

搜索行业动态
17:28
IT之家(RSS)
精选70
谷歌 DeepMind 经济学家伊马斯:尚未发现 AI 造成岗位流失的证据,跟风裁员恐适得其反

谷歌 DeepMind AGI 经济学负责人亚历克斯·伊马斯表示,目前没有看到白领岗位因 AI 大规模消失的证据。他强调,若企业因“不裁员就等于 AI 转型慢”的叙事而跟风裁员,可能适得其反。伊马斯认为,AI 更多是接手部分任务、提升生产力,让员工专注机器无法完成的工作,岗位冲击尚未真正出现。

DeepMindGoogle现象/趋势

推荐理由:来自AI核心阵营的经济学家说‘还没证据’,这本身就值得每个担心被AI替代的人看一眼,那种‘没裁员就是落后’的FOMO叙事可能更危险。
17:23
The Verge:订阅版科技(RSS)
68
欧盟委员会动用紧急权力强制WhatsApp免费托管对手AI助手

欧盟委员会动用紧急权力,迫使Meta旗下的WhatsApp免费托管竞争对手的AI助手。

Meta政策/监管行业动态
17:20
公众号:卡尔的AI沃茨
65
实测小米MiMo-V2.5-Pro UltraSpeed:万亿参数MoE推理模型输出速度达1000 token/s

小米MiMo-V2.5-Pro UltraSpeed模式在单8卡节点上实现万亿参数MoE推理模型输出速度1000 token/s,峰值达2140 token/s,是普通版的3倍,且此前已降价99%。接入Claude Code桌面端开启UltraCode模式后,可调度12个Agent在11分钟内完成项目升级报告并打包成Skill;3分钟内生成含灯光、剪影、星光特效的3D吉他英雄网页。技术层面通过FP4混合量化、提前草稿机制及计算/搬数据/通信流水线调度实现高速推理。

智能体教程/实践部署/工程
17:13
Hacker News 热门(buzzing.cc 中文翻译)
61
里奇·萨顿谈人工智能的创造力与发现

里奇·萨顿(Rich Sutton)在Twitter上讨论人工智能的创造力与发现。该帖子在Hacker News上获得100个HN Points。

大佬观点现象/趋势
17:13
Hacker News 热门(buzzing.cc 中文翻译)
44
用编程打造健康家庭:Gamow Labs 正式亮相

Gamow Labs 正式亮相,创始人通过 vibe coding 方式编程,旨在打造健康家庭。该项目在 Hacker News 上获得 100 个点赞。

产品更新编码
17:10
OpenAI:官网动态(RSS · 排除企业/客户案例)
21
从数据到决策:LSEG如何规模化可信AI

LSEG利用OpenAI在其全球业务中规模化部署可信AI,加速业务洞察获取,缩短发布周期,并赋能4000名员工。

OpenAI行业动态
16:56
HuggingFace Daily Papers(社区热门论文)
63
BrainSurgery:可重复且可靠的声明式权重操作工具,用于模型编辑与模型升级

BrainSurgery是一种针对神经网络checkpoint的“张量手术”工具,通过声明式YAML计划执行复杂的权重变换。它支持结构修改、数学变换、张量重塑,利用正则表达式和结构定位进行精准操作,并内置断言验证张量形状、数据类型和值,防止静默错误。工具覆盖从模型升级(upcycling)到LoRA提取等四个示例和三个案例研究,旨在提供可重复、可验证的模型编辑基础。

开源生态论文/研究部署/工程
16:56
HuggingFace Daily Papers(社区热门论文)
61
PsychoSafe:引导大语言模型生成心理学知情拒绝

PsychoSafe 是一种心理学导向的拒绝框架,将大语言模型的拒绝行为重构为结构化支持性沟通,基于循证干预策略。研究构建了包含8019条提示-响应对的语料库,覆盖五个高风险心理领域,采用提示工程和参数高效微调训练 Qwen 3.5 27B。在500条提示的验证集上,PsychoSafe 提示使拒绝质量较通用基线提升28.1%,其中外部资源转介提升46.8%、心理基础性提升34.8%,且不损害非拒绝任务性能。微调实现了近乎完美的拒绝与资源转介率,但降低了回复相关性。在 SORRY-Bench 和 XSTest 上表现强域内鲁棒性,但跨域泛化有限。

arXiv安全/对齐论文/研究
16:56
HuggingFace Daily Papers(社区热门论文)
精选70
快手开源 Kwai Keye-VL-2.0-30B-A3B:面向长视频理解与智能体智能的 MoE 多模态模型

快手开源 Kwai Keye-VL-2.0-30B-A3B,一个 MoE 多模态基础模型,激活仅 3B 参数,专为长视频理解和智能体智能设计。模型首次将 DeepSeek Sparse Attention (DSA) 适配到 GQA 多模态架构,实现无损 256K 上下文处理,并通过可扩展视频 I/O、异构 ViT-LM 并行及自定义 DSA 内核优化吞吐与计算开销。引入跨模态多教师在策略蒸馏(MOPD)结合 Context-RL 和 Video-RL,缓解多任务对齐中的灾难性遗忘,原生支持代码、工具、搜索场景下的多智能体协作与多模态自纠正。在 TimeLens、Video-MME-v2、LongVideoBench 等多个基准上达到同类规模 SOTA,模型权重已开源。

智能体多模态视频论文/研究

推荐理由:Keye-VL-2.0 把长视频理解推到 256K 上下文,还用了 DeepSeek 的稀疏注意力,这是目前我能找到的对长短视频最兼顾的多模态模型,做视频 agent 的该看看。
16:56
HuggingFace Daily Papers(社区热门论文)
67
稀疏自编码器解释与操控文本转语音语言模型

研究在CosyVoice3的语言模型骨干上训练BatchTopK稀疏自编码器,并引入模态感知自动解释管道,为每个特征标注其触发来源(文本前缀、1秒语音片段或两者)。恢复的特征涵盖音素、笑声、口音提示和说话者性别,可解释性强。通过SAE潜空间进行操控表明这些特征具有因果性:定向干预使笑声概率从0.02升至0.79,翻转感知的说话者性别,并在保留口语内容的同时控制语速。SAE特征既可作为可解释性对象,也可作为TTS合成的控制方向。

论文/研究语音
16:46
MarkTechPost(RSS)
62
Anthropic 发布 Claude Fable 5 和 Claude Mythos 5:同款基础模型,不同安全防护,新增 Mythos 级层次

Anthropic 正式推出 Claude Fable 5,附带分类器,全面开放使用;同时发布 Claude Mythos 5,仍保持受限访问,但通过 Project Glasswing 解除了网络安全防护。两款模型基于同一底层模型,区别在于安全机制配置,并新增了 Mythos-Class 层级。

Anthropic安全/对齐模型发布
16:28
IT之家(RSS)
37
Mozilla 为安卓版 Firefox 加入谷歌 Play Integrity API,社区质疑偏离开源初衷

Mozilla 在安卓版 Firefox 中新增谷歌 Play Integrity API 库,用于生成 token 并发送至其 MLPA 服务器,以限制服务器端 AI 工具(如 Smart Window)的访问频率并验证请求来自未经修改、通过 Google Play 安装、运行于认证设备上的 Firefox 副本。在未认证、已 Root 或刷自定义 ROM 的设备上,部分 AI 功能无法使用。此举引发开源社区质疑,认为 Firefox 偏离了其开源、尊重隐私、面向希望避开谷歌用户的初衷。

开源生态行业动态
16:28
IT之家(RSS)
20
郭锐解释智界 RX 命名:只有具备重构能力的产品才有资格成为"X"

华为余承东官宣鸿蒙智行首款跳出数字序列命名的新车智界 RX,将于秋天亮相。智界汽车董事长郭锐解释命名,“X”代表未知、突破与不被定义,只有真正具备重构能力的产品才有资格成为“X”。该车与华为全栈黑科技深度原生融合,预计搭载乾崑智驾、鸿蒙座舱、乾崑896线激光雷达等。预热视频显示采用轿跑运动风格、溜背设计,车顶带激光雷达凸起。

产品更新端侧
16:28
IT之家(RSS)
64
工信部:加强高端光电芯片和器件研发,开展光电混合组网试验

工信部日前印发《“人工智能+信息通信”创新发展实施意见(2026—2028年)》,提出到2028年形成30个以上高价值典型场景,城域算力1毫秒时延圈覆盖率不低于75%;到2030年实现人工智能与信息通信网络融合核心技术突破。意见要求加强高速光电芯片、全光交换器件、光电共封装器件等研发验证,开展光电混合组网试验,并推进广域无损网络、任务式调度、算网运维智能体等技术验证,以降低比特带宽成本。

政策/监管部署/工程
16:28
IT之家(RSS)
46
跃伴发布智能如厕机器人"小伴",28999元

跃伴在2026上海国际养老、辅具及康复医疗博览会上发布智能如厕机器人“小伴”,售价28999元。该产品将“人找马桶”升级为“马桶找人”,通过自建马桶数据库无需改动下水即可精准对位家中马桶或蹲厕,内置低噪粉碎结构防止堵塞。排污后360度涡旋自清洁,自动生成泡沫阻断异味,配合高密封污水箱自动关盖、冲水、关闭隔臭阀。搭载AI芯片及5路线激光、1个激光雷达等传感器,实现全流程无人干预的自主移动。配备大按键遥控与离线语音操控,扶手设有紧急呼叫按钮。

产品更新具身智能端侧
16:28
IT之家(RSS)
18
告别近40年磁条车票:JR东日本宣布2027年全面推行二维码乘车

JR东日本宣布,2027年春季起在短途常规线路停止使用磁条车票,全面推行二维码车票。新票尺寸调整为57.5mm×85mm,乘客扫描二维码通过检票机。IC交通卡和手机App不受影响,新干线和特急列车暂维持现状。同日启动“绿色窗口AI对应服务”验证实验,利用生成式AI辅助整理乘客出行信息,计划2030年代初期实现AI独立完成出票。合作方包括NEC、Gen-AX和软银。

行业动态
16:28
IT之家(RSS)
61
阿里千问上线国内首个全周期高考志愿填报Agent,免费提供咨询服务

阿里巴巴旗下千问上线国内首个全周期高考志愿填报Agent,基于千问高考志愿大模型和夸克8年高考数据打造,免费提供“志愿日历”“志愿报告”“志愿问答”三项核心能力。志愿日历将填报拆解为步骤,持续理解考生兴趣;志愿报告支持动态调整、主动建议及自我检查,加入就业前景、考公考编、AI趋势等数据;志愿问答可调用位次法等专业方法作答。针对老旧机型与弱网环境进行了优化。

智能体产品更新
16:28
IT之家(RSS)
精选72
摩尔线程开源 MusaCoder 代码大模型,9B/27B 参数基于国产 GPU 全链路训练

摩尔线程发布并开源 MusaCoder 代码大模型,含 9B 和 27B 两个参数规模,是业内首个基于国产 GPU 算力底座完成全链路训练与验证的开源模型。后训练流程在基于 MTT S5000 的夸娥智算集群上完成,支持从 PyTorch 标准算子自动生成高性能 CUDA/MUSA 原生 Kernel 代码。在 KernelBench 评测中,MusaCoder-27B-RL 以 Overall Pass@8 93.2%、Avg.@8 88.60% 超越 Claude Opus、DeepSeek-V4 Pro、GLM-5.1、Kimi K2.6 等主流 SOTA 代码模型。

开源生态模型发布编码

推荐理由:摩尔线程这个模型直接瞄准GPU底层算子,KernelBench分数压过了不少主流大模型,虽然场景窄,但在国产硬件自建软件生态的路上,迈出了挺关键一步。
16:28
IT之家(RSS)
42
小米 miclaw 率先实现 AI 上岛,澎湃 OS 4 被曝有新交互

博主 @缪特mt 发文称小米 miclaw 已实现 AI 上岛,展示效果并透露澎湃 OS 4 有新交互。@数码闲聊站 称某国产迭代 OS 将实现 AI 语音助手上岛,该功能在苹果 iOS 27 发布前已开发完成。苹果在 WWDC26 演示 Siri AI 于灵动岛弹气泡执行操作。miclaw 基于小米 MiMo 大模型,2026 年 3 月 6 日首启小范围封测,4 月 21 日扩展至 PC、Mac、有屏音箱等多终端。卢伟冰 5 月 16 日表示 miclaw 不会取代小爱同学,未来计划将其能力与“超级小爱”合体增强小爱。

产品更新语音
16:28
IT之家(RSS)
63
工信部:大力发展 AI 手机和电脑、智慧家庭、智能穿戴设备等产品

工信部印发《“人工智能+信息通信”创新发展实施意见(2026—2028年)》,提出打造网智融合新终端,加强具身智能与信息通信融合创新,推动具身智能与网联通信模组适配验证,大力发展人工智能手机和电脑、智慧家庭设备、智能穿戴设备。意见鼓励基础电信企业利用AI赋能传统业务,深化智慧个人助理、智慧管家、家庭看护等应用。面向卫生健康和教育等领域,开展智能健康监测、老人和儿童看护、智能课堂、智能学伴等应用,提供精准化与普惠化服务。

具身智能政策/监管
16:10
公众号:面壁智能(MiniCPM)
6.13 派对邀请丨端侧模型+精酿啤酒,这可能是上海最"对味"的AGI派对
16:10
公众号:面壁智能(MiniCPM)
倒计时2天|面壁智能亮相智源大会,共话中国大模型新未来
15:56
HuggingFace Daily Papers(社区热门论文)
47
U-TTT:通过测试时训练实现泛化的PET图像去噪

现有深度学习模型在分布偏移下进行PET图像去噪时性能严重下降,根源在于固定参数范式无法适应测试数据的剂量水平或扫描仪类型变化。本文提出U-TTT,一种集成测试时训练(TTT)层的U形模型,通过自监督在推理时动态调整参数以适应每个测试实例的特征。U-TTT包含空间TTT(S-TTT)层和频率TTT(F-TTT)层构成的双域自适应机制,分别校正空间结构退化并抑制全局噪声频谱、恢复高频细节。实验表明,U-TTT在未见剂量水平和扫描仪类型等挑战性分布偏移下达到SOTA去噪性能与泛化能力。

数据/训练论文/研究
15:56
HuggingFace Daily Papers(社区热门论文)
49
UniPET:面向多种剂量降低因子的通用PET图像去噪网络

现有基于深度学习的PET图像去噪方法通常假设低剂量图像的剂量降低因子(DRF)固定且已知,实际中DRF变化时性能大幅下降。UniPET将域泛化引入PET图像去噪,通过风格对齐网络(SAN)对齐并恢复不同DRF下的风格,同时提出区域感知学习策略(RALS),区分平坦区域与风格化区域并对后者进行对抗学习,防止过度平滑。实验表明,UniPET在特定DRF下性能与单DRF专用模型相当,在通用PET图像去噪任务上达到定量、感知和临床层面的最先进水平。

arXiv论文/研究
15:42
Hacker News 热门(buzzing.cc 中文翻译)
56
forestwalk.ai 页面出现"惊喜,支付1000美元"提示

一篇来自 forestwalk.ai 的帖子在 Hacker News 上获得 103 个点赞,标题为“Surprise, Pay 1000”(惊喜,支付1000美元),发布时间为 06:01。具体内容未展开,可能涉及某项 AI 服务或产品的付费信息。

现象/趋势编码
15:28
IT之家(RSS)
61
三星启动"人工智能转型",计划2026年内培训所有员工

三星宣布启动“人工智能转型”,将全面引入AI至所有子公司业务。本月内向所有子公司推出Google Gemini、OpenAI ChatGPT、Anthropic Claude等外部GenAI服务及配套安全系统。计划2026年内对所有员工进行AI培训;6月为CEO/总裁级高管举办两天“AI转型训练营”,其他高管参与2300人三天两夜培训。所有子公司将设立专门AI部门。

端侧行业动态
15:28
IT之家(RSS)
60
哈佛与Perplexity研究:AI智能体人机协作缩短87%任务时间、降低94%总成本

哈佛大学与Perplexity基于10000组真实数据对比研究发现,AI智能体(Perplexity Computer)与人工协作比传统搜索(Perplexity Search)加人工效率更高。智能体单次会话平均执行26分钟,搜索仅33秒,本地任务差距达75倍;智能体有效不满率1.3%,低于搜索的2.9%。“Search+人工”每任务需269分钟,“Computer+人工”仅36分钟,时间缩短87%。虽然智能体单任务模型成本约4-10美元(搜索约0.05美元),但人力边际成本从2.05美元降至0.16美元,总成本下降94%。短单步问题适合搜索,多步需工具调用任务适合智能体。

智能体论文/研究
15:28
IT之家(RSS)
61
Meta AI 客服漏洞导致超 2 万 Instagram 账号被盗

Meta AI 支持工具存在安全漏洞,黑客利用越狱提示词诱导系统生成 Instagram 密码重置链接并发送至攻击者控制的邮箱,从而盗号。漏洞位于账号恢复系统“High Touch Support (HTS)”,因代码路径未验证重置邮箱与账号持有人关联。今年 4 月中旬至 5 月底,受影响用户超 2 万(官方数据 20225 人)。Meta 于 5 月 31 日关闭该 AI 工具并注销所有可能受影响的链接。安全媒体称 Sephora 官方账号、美国太空军总军士长个人账号等已被篡改。

Meta安全/对齐
15:28
IT之家(RSS)
66
OpenAI 奥尔特曼搁置完全自动化愿景,AI 人机协作才是未来

OpenAI CEO 萨姆·奥尔特曼表示“完全自动化一切并不是我们想要的未来”。公司放弃此前于2025年10月提出的2028年3月前构建完全自主AI系统的计划,转而探索人机协同模式。OpenAI 在最新博文中称,到2028年3月部分研究工作将由AI系统与研究人员协同完成,完全自动化既令人沮丧又危险。人类的关键作用在于决定什么事情值得去做。奥尔特曼还提议成立国际组织,协调前沿AI工作并降低灾难性风险,必要时可放慢发展速度。

OpenAI安全/对齐行业动态
15:28
IT之家(RSS)
59
一句话 P 图发朋友圈?美图秀秀宣布首批接入微信 AI 生态

微信6月8日发布开发者接入微信AI生态指引,开放平台支持开发者授权接入。美图秀秀作为首批内测开发者完成初步适配,将围绕人像美容、拼图、证件照、智能消除、画质修复等核心场景接入微信AI Agent。京东、美团、滴滴、携程、同程、肯德基等也同步宣布作为首批内测团队接入微信AI生态。

MCP/工具图像生成行业动态
15:28
IT之家(RSS)
57
消息称字节跳动 AI 制药业务线启动拆分与独立融资进程,首次试水 AI4S 产业化

字节跳动 AI 制药业务线今日启动拆分与独立融资进程,拆分后字节仍控股新公司,核心团队、算法、技术平台及已有管线资产整体转入新主体,并继续从火山引擎获得算力支持。该团队成立于 2021 年,由刘凯负责,此前内部负责蛋白结构预测模型的相关团队已并入,继续推进基础模型研究。接近交易人士称,这是字节首次试水 AI4S 产业化,希望借助独立决策灵活性跑通中国 AI4S 产业路径。

现象/趋势行业动态
15:28
IT之家(RSS)
64
iOS 27 Siri AI 系统提示词泄露:超 1300 行核心指令曝光

随着 iOS 27 开发者预览版发布,Siri 反馈错误报告诊断文件中包含完整 LLM 指令文件 `siri_prompt.md`,超 1300 行、约 22000 token,已上传 GitHub。提示词定义 Siri 为苹果智能助手,要求先思考再决定是否调用工具,优先使用设备本地数据和搜索结构化信息,信息缺失或歧义时必须询问用户,不得编造。苹果未回应。Siri AI 将在 iOS 27、iPadOS 27、macOS 27、visionOS 27 测试版中开放测试,未来加入 watchOS 27。Apple Intelligence 支持 17 种语言,但 Siri AI 因监管要求不会在中国大陆推出。

产品更新语音
15:28
IT之家(RSS)
精选78
工信部印发《"人工智能+信息通信"创新发展实施意见》

工信部发文,要求加快建设400Gbps/800Gbps骨干传输网络,优化东中西部国家枢纽节点间通道;推进城域400Gbps及以上、全光交叉等高速光传输系统应用,构建城域毫秒级低时延入算能力。同时推动5G-A/6G、新一代光网络、“IPv6+”、工业互联网与AI融合发展,攻关空口智能化、网络高等级自智、智能体互联网等核心技术。鼓励基础电信企业用AI赋能传统业务,深化智慧个人助理、智慧管家、家庭看护、3D观影等新型应用。

政策/监管部署/工程

推荐理由:工信部这次把400G/800G骨干网和AI直接挂钩,意味着算力输送的「血管」要升级了,做AI基建和云服务的可以认真看下落地节奏。
15:28
IT之家(RSS)
59
荣耀 YOYO 与微信首个 A2A 合作上线:一句话发送微信消息、拨打微信语音/视频电话

荣耀 MagicOS 今日宣布荣耀 YOYO 与微信首个 A2A 合作上线,支持用户通过一句话指令发送微信消息、拨打微信语音或视频电话。该功能已在荣耀全量机型推送。使用条件:长按电源键唤醒 YOYO,发送语音“给 xx 发微信 / 打微信语音电话 / 打微信视频电话”,需将 YOYO 智能体版本更新至 90.10.30.063 及以上、微信版本更新至 8.0.72 及以上、系统版本升级至最新。

智能体产品更新端侧
15:14
TechCrunch:AI(RSS)
65
Meta与Reliance签署在印度的首个AI数据中心协议

Meta与印度信实集团(Reliance)签署在印度的首个AI数据中心协议。该设施容量为168兆瓦,将支持Meta全球AI计算需求,并具备未来扩展能力。

Meta行业动态部署/工程
15:10
公众号:千问APP(阿里)
69
千问上线国内首个全周期高考志愿填报Agent,免费服务全国考生

千问今日上线国内首个全周期高考志愿填报Agent,基于千问高考志愿大模型和夸克8年高考数据,免费为全国考生提供服务。该Agent具备“志愿日历”“志愿报告”“志愿问答”三项核心能力:志愿日历根据选科、估分等信息量身定制分步骤规划;志愿报告今年升级,可捕捉细节需求、实时调整并具备自我检查机制;志愿问答融合位次法定位等专家经验。同时开展“暖芒公益”计划,针对老旧机型与弱网环境进行优化。

智能体产品更新数据/训练
关联讨论 1 条公众号:千问APP(阿里)
14:56
HuggingFace Daily Papers(社区热门论文)
55
Role-Agent:通过双角色进化自举LLM智能体

Role-Agent框架让单个大语言模型同时充当智能体和环境,实现自举式共同进化。包含两个组件:World-In-Agent(WIA)让LLM作为智能体并在每次动作后预测下一状态,将预测与实际状态的对齐作为过程奖励,激励环境感知推理;Agent-In-World(AIW)则从失败轨迹中分析失败模式,并检索具有相似失败模式的任务,重塑训练数据分布进行针对性练习。在多个基准测试上,Role-Agent平均比强基线提升超过4%。

智能体arXiv论文/研究
‹ 上一页
1…1213141516…50
下一页 ›