AIHOT

全部动态资讯 · 9076 条

6月5日周五

6月5日

13:14

IT之家（RSS）

盘毂动力与中国科学院宁波材料所联合研发的高性能轴向磁通电机取得新突破，专用磁钢与电机适配度显著提升，磁能积、高温稳定性、力学强度等多项指标大幅提高。该电机自重减轻约50%，轴向尺寸缩减50%，有效功率密度达25.73kW/kg，最高转速突破18000转，将率先应用于新能源汽车、人形机器人、低空飞行器等关键领域，为我国轴向磁通电驱动产业链实现全流程自主创新和大规模市场应用提供关键支撑。

行业动态

13:14

IT之家（RSS）

xAI 开放预览版图转视频模型 grok-imagine-video-1.5-preview，单图生成最高 720p 电影感视频

xAI 通过 API 开放预览版图像转视频模型 grok-imagine-video-1.5-preview，可将一张静态图像扩展为流畅的电影感视频片段。用户提供起始图片并用自然语言描述运动方式后，模型可控制镜头移动、画面节奏、环境氛围与物理效果。该模型最高支持 720p 视频生成，适合概念验证、分镜测试和短内容生产，并能通过逐段动画化将多镜头串联为更长场景。

xAI图像生成模型发布视频

12:47

HuggingFace Daily Papers（社区热门论文）

复杂度平衡扩散分裂（CBS）：基于函数逼近理论的时间容量分配框架

标准连续时间生成模型需处理从各向同性噪声到复杂数据分布的不同信号状态，统一架构效率低下。本文提出复杂度平衡分裂（CBS）框架，基于函数逼近理论和de Boor均衡分布原理，将扩散时间线划分为等近似负担的片段，为生成动力学难建模区域分配更多表示容量。通过两种互补监测函数——基于流Dirichlet能量的空间测度和基于采样轨迹加速度的几何测度——估算局部复杂度，无需启发式分割或搜索。在SiT、JiT、UNet等架构及数据集上，CBS不增加每步推理成本，持续提升合成质量：在SiT-XL上使用CFG时，相比朴素时间划分，FID改善约35%。

图像生成开源/仓库数据/训练论文/研究

12:47

HuggingFace Daily Papers（社区热门论文）

迈向真正多语言 ASR：代码切换语音识别向未见语言对的泛化研究

代码切换ASR（CS-ASR）因多语言代码切换语音资源稀缺而极具挑战。现有方法依赖合成数据生成或特定语言对微调，但扩展性受限于语言对数量随支持语言数组合增长。本文通过模型合并与领域泛化方法，探究从有限已见语言对学到的CS能力能否泛化至未见语言对。实验表明，合并的双语CS-ASR模型仅能适度泛化到未见语言对，提示双语CS能力在跨语言对间的迁移有限。

多模态论文/研究语音

12:28

Bloomberg：Technology（RSS）

特朗普官员担忧美国漏洞让中国公司购买英伟达 Blackwell 芯片

特朗普官员过去一周陷入一场激烈争论，核心问题是过去一年美国对华科技政策到底是什么。他们担忧美国存在的漏洞可能让中国公司绕过限制，购买英伟达 Blackwell 芯片。

政策/监管现象/趋势

12:14

IT之家（RSS）

汤道生承认腾讯业务线快慢不一，姚顺雨透露AI下半场主攻三方向

在今日的2026腾讯云AI产业应用大会上，腾讯高级执行副总裁汤道生回应“腾讯慢了”的批评，承认复杂组织内不同业务线速度不一，有快有慢也有失败与探索，对外界建议持开放态度，并称对龙虾热潮反应较快。首席AI科学家姚顺雨表示AI下半场应在中国建立长期AGI组织，重点聚焦三方向：夯实预训练与后训练技术底座；将基础技术转化为实际产品创造价值；探索新研究范式与机会。

现象/趋势行业动态

11:46

HuggingFace Daily Papers（社区热门论文）

强化学习驱动未见语言翻译的上下文学习

大语言模型（LLM）翻译极低资源语言时，现有方法（继续训练或编码语法书）易过拟合特定语言，零样本迁移有限。本文提出一种强化学习（RL）方法，以字符级翻译指标chrF作为奖励，训练模型从丰富语言上下文中提取并应用语言知识，实现对完全未见语言的翻译。实验表明，即使使用轻量级奖励，RL训练模型在未见语言上的表现优于上下文学习和监督微调。研究显示，结果导向的RL可超越数学、编程等传统推理任务，成为从上下文中学习语言的通用方案。

推理数据/训练论文/研究

11:46

HuggingFace Daily Papers（社区热门论文）

ArcANE：角色扮演语言智能体能否在正确时机保持角色？

现有基准仅评测角色扮演语言智能体（RPLA）对给定章节的事实回忆，未检验其回应是否贴合角色心理发展轨迹，尤其当场景超出原著文本时。ArcANE 是自动构建的基准，覆盖17部小说和80个主角，利用角色弧线将叙事沿心理轴分段，并为每个阶段提出相同场景（含原著内与外）。在6个模型和6种上下文模式下，使用角色弧线作为条件均优于其他策略，在原著外场景（检索无法获取信息）上差距最大。进一步微调开源权重模型得 ArcANE-8B/32B，在原著外场景上扩大了弧线优势。

智能体论文/研究评测/基准

11:14

IT之家（RSS）

姚顺雨回应加入腾讯：坦诚直白文化是首要原因

在2026年腾讯云AI产业应用大会上，腾讯首席AI科学家姚顺雨回应加入原因，称最重要的是腾讯坦诚直白、基于信任而非指标运转的文化及长期主义。姚顺雨毕业于清华姚班、普林斯顿大学博士，2024年加入OpenAI主导首个智能体模型及Deep Research项目，2025年入选TR35。2025年12月腾讯升级大模型架构，成立AI Infra部等，姚顺雨兼任AI Infra部、大语言模型部负责人。

OpenAI大佬观点现象/趋势

11:14

IT之家（RSS）

深圳团队依托华为昇腾 910C 成功训练 1.6 万亿参数 DeepSeek-V4-Pro 大模型

深圳河套学院联合哈尔滨工业大学（深圳）、深圳市大数据研究院、华为及深智城，依托华为昇腾 910C 国产 AI 算力集群，完成 1.6 万亿参数大模型 DeepSeek-V4-Pro 的全参数后训练。项目实现模型算力利用率（MFU）超过 30%，关键训练算子效率提升 14%，各项指标均达到工业级运行标准。此次实践证实国产 AI 芯片可支撑世界级超大参数模型的训练任务，相关技术路径具备可行性。

DeepSeek行业动态

11:14

IT之家（RSS）

38.98万元起，鸿蒙智行MPV智界V9全国首批交付仪式明日举行

鸿蒙智行智界V9全国首批交付仪式于6月6日10:30开启。该车售价38.98万-51.98万元，轴距3250mm。车内配备12.3英寸仪表、双17.2英寸中控屏及21.4英寸吸顶屏。全系标配38个传感器与896线激光雷达，将首批升级华为乾崑智驾ADS 5（预计6月末至7月初推送）。全系标配途灵平台、±7°后轮转向，转弯半径5.35m。

其他

11:14

IT之家（RSS）

精选71

腾讯高级执行副总裁汤道生：今年腾讯大部分代码都由 AI 生成

在 6 月 5 日的腾讯云 AI 产业应用大会上，腾讯高级执行副总裁汤道生表示，今年腾讯大部分代码都由 AI 生成，工程师将更多时间用于架构设计，定期指导与修正 AI 输出。腾讯 2026 年 Q1 财报显示，重组后的 AI 研发团队重构了基础设施，并搭建了 Hy3 preview 模型。腾讯总裁刘炽平今年 3 月透露，去年腾讯在 AI 新产品上投入 180 亿元，今年投入至少翻倍。

编码行业动态

推荐理由：腾讯高管公开说今年大部分代码是AI写的，这个数据比谷歌微软还激进，对国内开发者的信号很明确，会写代码不再是护城河，能设计架构才是。

11:04

公众号：腾讯元宝

全网@元宝总结实录：汤道生、姚顺雨对谈AI下半场

汤道生与姚顺雨在2026AI产业应用大会上围绕AI下半场展开对谈，腾讯元宝AI录音笔提供全程完整实录。

大佬观点现象/趋势

10:48

Hacker News 热门（buzzing.cc 中文翻译）

Transformer 需要三个投影吗？--对 QKV 变体的系统研究

一项系统研究探讨 Transformer 注意力机制中是否必须使用三个独立的投影（Query、Key、Value）。通过分析多种 QKV 变体结构，论文对「三投影」这一设计选择进行了系统性评估。

数据/训练论文/研究

10:46

HuggingFace Daily Papers（社区热门论文）

OPRD：在线策略表示蒸馏

传统在线策略蒸馏（OPD）仅在输出空间匹配下一个token概率，受限于大词汇表（如Qwen约150k token）的采样方差，且忽略教师中间隐藏状态。OPRD将蒸馏提升至隐藏状态空间，在同一rollout上对齐学生与教师选定层的表示，绕过LM头。理论上消除采样方差，提供逐层结构信息。在AIME 2024/2025和AIMO上，OPRD缩小师生差距，而OPD基线低于教师。训练速度提升1.44倍，内存减少54%。代码已开源。

推理数据/训练论文/研究

10:46

HuggingFace Daily Papers（社区热门论文）

DataCOPE：面向智能体数据分析的无监督技能发现框架

DataCOPE 是一个无监督验证器引导的技能发现框架，用于提升数据智能体性能，无需更新模型参数。它从探索轨迹中提取验证器信号，迭代协调数据智能体、无监督验证器和技能管理器进行对比性技能蒸馏。报告式分析中实例化为自适应检查表验证器，推理式分析中实例化为答案一致性验证器。在 Deep Data Research 和 DABStep 上的评估显示，DataCOPE 在四种模型设置下平均将报告式任务分数提升 9.71%，推理式任务提升 32.30%。

智能体数据/训练论文/研究

10:46

HuggingFace Daily Papers（社区热门论文）

MLEvolve：一种自我演进的自动化机器学习算法发现框架

MLEvolve 是一个基于大语言模型的多智能体框架，用于端到端机器学习算法自动发现。它通过渐进式 MCGS 树搜索实现跨分支信息流动，并引入熵驱动的演进式调度，使搜索从广泛探索转向集中利用。框架配备 Retrospective Memory，结合冷启动知识库与动态全局记忆，实现任务经验检索复用。战略规划与代码生成解耦，保证长时间迭代稳定。在 MLE-Bench 评测中，MLEvolve 在 12 小时预算（半标准时长）内取得平均奖牌率和有效提交率等多项 SOTA，并在数学算法优化任务上超越 AlphaEvolve，展现跨域泛化能力。代码已开源。

智能体数据/训练论文/研究

10:46

HuggingFace Daily Papers（社区热门论文）

Future-L1：用于视频事件预测的交错潜在视觉推理

Future-L1 是一种交错潜在视觉推理框架，让 MLLM 在自回归解码中交替生成语言 token 与连续潜在视觉 span。为此构建了 Future-L1-50K 数据集，并用潜在感知 RL 目标 LA-DAPO 优化采样轨迹。在 FutureBench 上，Future-L1 将 Qwen3-VL-8B 得分从 61.0 提升至 85.4，超过此前最优 Video-CoE 10.4 分；在 TwiFF-Bench 上平均分从 2.44 升至 3.04。结果表明，将中间视觉语义保留在潜在空间而非转化为文本，有益于未来视频推理。

arXiv多模态视频论文/研究

10:46

HuggingFace Daily Papers（社区热门论文）

NF-CoT：基于归一化流的潜在推理框架

NF-CoT 在大语言模型骨干内实例化 TARFlow 风格的归一化流，为从显式 CoT 蒸馏的紧凑连续思想定义可处理概率模型。连续思想位置由 NF head 生成，文本位置由同一因果流中的标准 LM head 生成。该设计保留因果自回归生成、概率采样、KV 缓存兼容性和精确似然估计，并支持潜在推理空间的直接策略梯度优化。在代码生成基准上，NF-CoT 相比显式 CoT 和先前潜在推理方法提高了通过率，同时显著降低了中间推理成本。

arXiv推理编码论文/研究

10:46

HuggingFace Daily Papers（社区热门论文）

Discrete-WAM：统一离散视觉-动作Token编辑用于世界-策略学习

自动驾驶需推理自车动作如何影响世界演化，现有端到端方法依赖直接状态-动作映射，缺乏对动作条件动力学的显式建模；连续潜空间世界模型缺乏组合因果推理。Discrete-WAM提出统一潜视觉-动作世界策略，将未来视觉状态与自车动作表示为对齐的离散token，在离散扩散框架内联合实现世界建模、世界-动作策略和层级决策策略，支持跨替代未来的组合因果推理与可控生成。在大规模自动驾驶基准上取得有竞争力的性能。

具身智能论文/研究

10:46

HuggingFace Daily Papers（社区热门论文）

WLA：统一世界建模、语言推理与动作生成的世界-语言-动作模型

WLA模型以文本指令、图像和机器人状态为输入，联合预测文本子任务、子目标图像和动作。其核心为自回归Transformer（非双向扩散Transformer），通过World Expert监督物理动态，并利用元查询使世界预测隐式影响动作生成（推理时可禁用，也可激活以支持测试时缩放）。原型WLA-0拥有2B活跃参数，在RTX 5090上单次推理40ms。在模拟与真实环境评估中，WLA-0在RoboTwin2.0 Clean上达92.94%成功率，在RMBench上达56.5%，并可直接从跨具身机器人视频学习新任务（无需动作标注）。

arXiv具身智能多模态论文/研究

10:46

HuggingFace Daily Papers（社区热门论文）

LoomVideo：高效统一视频生成与编辑架构

LoomVideo是一个5B参数的高效统一架构，支持视频生成与编辑。它用多模态大语言模型（MLLM）替换标准文本编码器，通过Deepstack注入机制对齐MLLM特征与扩散Transformer。核心创新为零开销的Scale-and-Add条件方法，直接缩放和加性处理源视频潜变量，避免token拼接导致的序列长度翻倍与自注意力计算复杂度增加。集成Negative Temporal RoPE策略处理多张参考图像。该模型在综合基准上达到或接近SOTA，尤其在电商和时尚生成场景表现突出，推理速度相比同类模型提升至少5.41倍。

多模态视频论文/研究

10:24

公众号：龙猫LongCat（美团）

ACL'26美团技术团队6篇论文入选：聚焦大模型评测与推理优化

美团技术团队在ACL'26上分享6篇论文，涵盖代码评测、复杂流程推理、数学竞赛、过度思考分析、推理后训练优化及生成式推荐。CoreCodeBench从12个开源库生成1524个结构化任务，有效性达78.55%；SOP-Maze基于真实业务构建397个流程实例，测试显示前沿模型存在流程遵循、对话脆弱性和计算错误三类短板；AMO-Bench含50道高难度数学题，最强模型准确率仅52.4%；The Evolution of Thought提出推理完成点（RCP）检测器减少冗余生成；MASPO通过软高斯门控等优化推理后训练，提升Avg@32和Pass@32；FLR将隐式推理分解为多维偏好因子，平均提升3.2%。

开源/仓库推理论文/研究评测/基准

10:24

公众号：龙猫LongCat（美团）

美团LongCat大模型人才校招全球启动

美团LongCat大模型启动全球人才校招，面向全球招募人才，目标是构建从数字世界到物理世界的全球标杆AGI，欢迎加入。

数据/训练行业动态

10:14

IT之家（RSS）

精选79

Anthropic 发布报告称其最新 AI 模型已显现脱离人类控制迹象，呼吁全球暂缓前沿 AI 开发，以便社会制度建设和对齐研究跟上进展。该公司主张美国、中国等主要 AI 公司达成共识，发布可验证的规则，并类比“核武器不扩散条约”，但指出 AI 更难监管。该观点引发美国白宫部分官员不满，批评其夸大风险。Anthropic 计划未来数月召集各方探讨全球协调机制如何运作。

Anthropic安全/对齐行业动态

推荐理由：Anthropic呼吁暂缓AI研发，虽然被白宫官员批「夸大风险」「给对手使绊」，但Mythos模型确实够强。这份报告是道德信号还是商业博弈，值得细看。

10:14

IT之家（RSS）

海尔在2026上海老博会推出行业首套AI未来智慧养老解决方案

6月5日，海尔在2026上海老博会上通过新品牌Haier care推出行业首套AI未来智慧养老方案，首次展出三大AI陪伴机器人：具身服务机器人（自主开关冰箱、洗衣）、家务机器人（AI视觉识别收纳清洁）、陪伴机器人（跌倒监测、服药提醒、联系家人）。失能人群方案包括天悦超低电动护理床（离地15cm）、体征监测护理床、步入式浴缸、下肢运动康复机及AI智驾轮椅机器人（自动定速巡航、避障、跟随）。同步推出九大AI健康管理方案，覆盖心血管、按摩、渐冻症呼吸护理等。现场展示海尔关爱智能床S1、双助扶手马桶、电动助行器、微高压氧舱等产品。

产品更新具身智能

10:14

IT之家（RSS）

AMD 展示其首个机架级 AI 平台 Helios，对垒英伟达 NVL72 VR200

AMD 在 2026 台北国际电脑展展示其首个机架级 AI 平台 Helios，核心配置包括第 6 代 EPYC Venice 处理器与 72 颗 Instinct MI455X 加速器，总计 31TB HBM4 显存、1400TB/s 带宽，计划 2026 年内供货。FP4 稠密精度下理论算力达 2900 PFLOPS，略落后于英伟达 NVL72 VR200，但显存容量占优，适合大语言模型等任务。72 颗加速器通过 UALink-over-Ethernet 互连，scale-up 带宽最高 260TB/s；配备 Pensando Vulcano 网卡，支持 Ultra Ethernet 规范的 800GbE，scale-out 带宽 43TB/s。

产品更新部署/工程

10:14

IT之家（RSS）

互联网史上首次：Cloudflare 称机器人请求流量已超人类

Cloudflare首席执行官Matthew Prince表示，互联网机器人请求流量首次超过人类，占网站HTTP请求的57.5%，人类仅占42.5%。这一转折比其此前预期的2027年末或2027年初更早到来。机器人流量涵盖传统爬虫、AI智能体、AI聊天等，它们像真人一样访问网页执行任务。Cloudflare强调，数据统计的是请求次数，真人用户仍主导使用时长和视频流媒体等浏览行为。

现象/趋势行业动态

关联讨论 2 条

09:31

公众号：数字生命卡兹克

精选68

Anthropic《When AI builds itself》：当AI开始自我构建

Anthropic发文指出，AI系统正加速自身开发，递归自我改进或将到来。目前Anthropic超80%代码由Claude编写，工程师每日合并代码量达2024年8倍。Claude Opus 4.6可胜任12小时软件任务，Mythos Preview连续工作至少16小时，SWE-bench和CORE-Bench等基准均已饱和。内部测试显示，Mythos Preview使研究效率提升约4倍，代码速度优化达52倍，在开放任务中成功率达76%，并弥合97%的研究项目差距。Claude在64%情况下给出比人类更好的研究建议。

Anthropic安全/对齐现象/趋势编码

推荐理由：Anthropic首次公开内部数据，工程师代码产出提升8倍，Claude自我加速的曲线已经画出来了。这篇文章不是预测是事实，做AI的人都该花20分钟读完。

09:28

Gary Marcus：The Road to AI We Can Trust（RSS）

Gary Marcus：无需恐慌Anthropic新博客

Anthropic发布最新博客后，推特圈热议不断。Gary Marcus在其博客中直接以“无需恐慌”为题发文，暗示不必过度反应。

Anthropic大佬观点

09:28

Bloomberg：Technology（RSS）

Meta AI 首席AI官：模型提供健康建议是差异化机遇

Meta AI 首席AI官 Alexandr Wang 表示，公司未来人工智能模型将通过消费者健康功能与竞争对手形成差异化。

Meta行业动态

09:14

IT之家（RSS）

谷歌云服务部门新一轮裁员，安全团队在列

谷歌在过去两周内对云服务部门进行新一轮裁员，波及GTIG威胁情报小组和Mandiant等部门。GTIG团队负责追踪黑客活动与分析网络攻击，部分员工已在领英公开被裁经历。Mandiant源于谷歌2022年收购的网络安全公司，已深度整合至Google Cloud。谷歌表示裁员主要是为了向AI等增长领域重新投入资源，具体人数和岗位尚不清楚。

Google安全/对齐行业动态

09:14

IT之家（RSS）

七彩虹灵创 K16 游戏本发售：锐龙 AI Max+ 395 配 Radeon 8060S 核显，23999 元起

七彩虹灵创K16游戏本6月5日10点首销，搭载16核32线程AMD锐龙AI Max+ 395处理器与Radeon 8060S核显，至高128GB LPDDR5X 8000MT/s内存、2TB PCIe 4.0 SSD，整机160W性能释放。配备2560x1600 165Hz IPS屏（100% sRGB、500尼特），4区RGB背光数字小键盘和机械师玻璃触控板。I/O含Oculink、USB-C 4、HDMI 2.1、RJ45 2.5G网口。内置Nova Studio AI平台，支持一键部署大模型、ComfyUI工作流和AI办公智能体。64GB+1TB版23999元（国补后22499元），128GB+2TB版27999元（国补后26499元）。

产品更新端侧

09:00

公众号：千问APP（阿里）

精选62

千问联合人民日报健康发布《2026 AI健康助手使用指南》

千问联合人民日报健康共同发布业内首份《2026 AI健康助手使用指南》，由北京协和医院、积水潭医院、广安门医院等20位主任医师参与审核。指南基于千问每天回应数千万次健康咨询的真实经验，将AI在健康生活中的核心价值归纳为五个角色：日常预防的健康管家、症状判断的安全守门人、就医过程的就诊小助手、读懂报告的健康档案员、康复与情绪的陪伴者。千问提醒，AI不能替代医生，出现紧急情况需直接就医。

教程/实践

推荐理由：千问和人民日报健康搞的这份指南，协和、积水潭等20位主任医师参与审核，把AI在健康咨询里能干什么梳理得很清楚，普通人有小毛病时知道怎么问、什么时候该直接去医院，实用。

09:00

公众号：腾讯元宝

志愿填报有点懵？问问元宝高考通！

08:14

IT之家（RSS）

苹果批准首个 iMessage AI 智能体 Poke，可回邮件设提醒

苹果批准 Poke 成为首个接入 Apple Messages for Business 的第三方 AI 智能体。用户可在 iMessage 内让 Poke 回复邮件、安排聚餐、创建提醒，支持网页搜索、图片生成与编辑、美国国内航班值机、低价机票追踪，并控制 Philips Hue 灯光与 Sonos 音箱，还接入了 Oura、Outlook、Gmail、GitHub、Strava 等服务。定价方面，轻量操作免费，高强度请求需协商。Poke 由加州初创公司 The Interaction Company of California 打造，2026 年 3 月已公开发布。

智能体行业动态

08:14

IT之家（RSS）

微软演示 AI 定制 Win11：一句话整机联动，调整壁纸、主题色、键盘灯效等

微软在 Build 2026 开发者大会上展示 Windows 11 AI 个性化功能，AI 智能体可根据用户自然语言描述联动调整壁纸、主题色、明暗模式和键盘灯效。现场演示“春日樱花风格”自动切换。开发者可利用 Windows API 和 WinUI Skills 项目构建原生应用。智能体还能通过 LampArray 接口设计键盘逐灯动画，并将主题色写入注册表路径，实现连贯任务处理。

智能体Microsoft产品更新端侧

08:14

IT之家（RSS）

三大运营商"词元产品"服务上架中国算力平台

6月3日，中国信通院宣布中国电信、中国移动、中国联通的“词元产品”服务正式登陆中国算力平台。词元是大模型最小信息单元，具有可计量、可定价、可交易特征。天翼云Token Plan分开发者/中小企业版（基于GLM-5）和个人/家庭版（基于DeepSeek V3.2）；移动云Coding Plan（基于MiniMax-2.5）支持Claude Code等编程工具；联通云推出Coding Plan（整合DeepSeek V4、GLM-5、MiniMax M2.5）和Token Plan（个人版支持DeepSeek V4-Flash、MiniMax M2.5，团队版采用Credits弹性计费）。服务已在中国算力平台·算力超市上架。

产品更新推理编码

08:04

Simon Willison 博客

AI乐观派与怀疑派：分别在对抗时间和熵

Charity Majors指出，AI乐观派和怀疑派都在同一团队中构建优秀软件，但方向相反。乐观派看到积极拥抱AI的团队获得了真实的、非连续的能力跃升，这是其他技术周期中未曾见过的；远离可能面临生存威胁。怀疑派则警示，代码产出速度超过工程师阅读能力、领域缺乏完整上下文时，信任账户被透支，可靠性下降、机构知识流失，最终导致无人理解的系统和频繁的轮班压力。两者都是真实威胁。核心问题在于缺乏连接乐观派与怀疑派的自然反馈循环，设计这样的反馈循环是组织设计难题。

智能体大佬观点

08:00

HuggingFace Daily Papers（社区热门论文）

大语言模型智能体的冷启动安全性差距

工具调用 LLM 智能体在对话开始时安全风险最高，完成若干常规 agentic 任务后安全性显著提升，称为冷启动安全性差距。为系统研究此问题，提出基准 SODA（Safety Over Depth for Agents），可控制在安全威胁前最多 20 个前置任务。在 4 个模型族的 7 个模型上，前置任务从 0 增至 20 时安全提升 9–52%。表征分析显示模型隐藏状态逐渐移向安全对齐区域。常规任务本身是安全提升主因，agent 自身响应影响较小但有助于保持效用。在 AgentHarm、Agent Safety Bench 等安全基准及 BFCL、API-Bank 等效用基准上得到验证。建议部署前让 agent 完成少量常规任务以缓解该差距。

智能体安全/对齐论文/研究