AIHOT

19:59

Bloomberg：Technology（RSS）

AI投资热潮是否已过度？

投资者意识到人工智能热潮终将结束，问题在于何时。彭博MLIV最新伦敦活动上，Skylar Montgomery Koning分享了关键观点。

现象/趋势

19:29

Bloomberg：Technology（RSS）

Meta 高管 Wang：AI 智能体将重新定义人与技术的关系

Meta 高管 Wang 表示，AI 智能体将重新定义人与技术的关系，行业需要建立信任，才能让人们充分利用 AI。

智能体Meta大佬观点

19:27

MarkTechPost（RSS）

2026年15款最佳Vibe Coding工具对比：价格、功能与适用场景

Vibe Coding将自然语言转化为可运行的软件。文章对比了2026年15款Vibe Coding工具的价格、功能与适用场景，帮助开发者选择最适合的应用构建方式。

编码评测/基准

19:27

MarkTechPost（RSS）

Microsoft Fara 教程：在 Google Colab 中使用模拟 OpenAI 兼容端点运行浏览器智能体

一篇实践指南，介绍如何在 Google Colab 中运行 Microsoft Fara，使用模拟的 OpenAI 兼容端点测试浏览器智能体循环。

智能体Microsoft教程/实践部署/工程

19:27

MarkTechPost（RSS）

Perplexity AI 推出混合本地-服务器推理编排器：自动在设备端与云端间路由 AI 任务

Perplexity AI 发布面向个人电脑的混合本地-服务器推理编排器，可自动将 AI 任务在设备端模型与云端模型之间动态路由，实现推理负载的智能分配与优化。

产品更新推理端侧

19:27

MarkTechPost（RSS）

NVIDIA AI 发布 Dynamo Snapshot：基于 CRIU 的 Kubernetes AI 推理快速启动系统

NVIDIA Dynamo Snapshot 使用 CRIU 和 cuda-checkpoint 工具，在 Kubernetes 上对 vLLM 推理工作节点进行检查点和恢复，实现快速启动。

开源/仓库推理部署/工程

19:26

The Decoder：AI News（RSS）

Anthropic 的 Mythos 模型据报用于 NSA 对中国和伊朗的进攻性网络行动

Anthropic 据报已派驻约六名工程师至 NSA，将其 Mythos 模型适配于进攻性网络行动。该模型可能用于入侵中国或伊朗的网络系统。此举符合 Anthropic 的立场：其关于限制 AI 用于大规模监控的承诺仅适用于美国公民。

Anthropic安全/对齐行业动态

19:22

公众号：腾讯混元

精选62

腾讯混元提出Stem稀疏注意力算法，被ICML 2026收录

Stem算法通过Token位置衰减（TPD）和输出感知度量（OAM）两项创新，仅用25%算力即逼近稠密注意力精度。配套HPC算子针对Hopper架构优化，支持FP8量化与vLLM的Paged KV Cache，在混元Hy3 preview上实现首字延迟降低3.6倍。HPC-BSA相比MIT-BSA稳定保持约3倍加速，在8K至256K序列长度上表现一致。

开源生态推理论文/研究部署/工程

推荐理由：把稀疏注意力从一刀切升级成按信息流分配预算，算子在Hopper上把理论加速几乎无损转化，3.6倍首字延迟下降不是灌水——做长上下文应用的值得照着开源代码试。

19:17

公众号：火山引擎

火山引擎豆包Seedance 2.0进入广告核心生产流程

火山引擎豆包视频生成模型Seedance 2.0以音画同出、全能参考、物理规律遵循、长视频一致性及电影级审美，打通品牌广告高质感创作与效果广告规模化量产。品牌场景已应用于智己汽车、华为手机、芝华仕等；效果广告场景下，30秒素材制作成本30-45元/条，单日稳定产出上百条，AIGC优质素材平均ARPU提升80.2%。基于Seedance 2.0的KickArt 3.0 Agent可实现爆款素材参考生成与批量裂变，已在汽车、3C、电商、快消等行业落地。

产品更新视频

19:15

IT之家（RSS）

高通宣布车端人工智能 Claw 生态计划，将智能体 AI 引入智能座舱

在2026高通汽车技术与合作峰会上，高通联合诚迈科技等生态企业发布车端人工智能Claw生态计划。该计划结合骁龙数字底盘与高通智能体AI运行环境，将AI智能体和多模态大模型直接部署到车端，旨在消除下一代汽车智能开发碎片化。核心能力涵盖：全天候多模态感知（融合车内外摄像头、音频等）、百亿参数混合专家模型（MoE）在终端侧实时运行、六层车规级安全架构（覆盖车辆控制分级、用户授权、隐私保护等），以及持续演进的AI生态系统。推动汽车从移动工具进化为智能伙伴。

智能体多模态端侧行业动态

18:59

Bloomberg：Technology（RSS）

Meta AI 负责人 Wang 谈如何在 AI 竞赛中获胜

Meta 首席 AI 官 Alexandr Wang 在 2026 年旧金山举行的 Bloomberg Tech 大会上，与 Bloomberg 的 Kurt Wagner 展开对话，围绕模型开发、基础设施投资和 AI 竞争态势进行了讨论。

Meta大佬观点行业动态

18:59

Bloomberg：Technology（RSS）

Broadcom CEO 谈最大的 AI 芯片押注

Broadcom 总裁兼 CEO Hock Tan 在旧金山举行的 Bloomberg Tech 2026 会议上，与 Bloomberg 的 Tom Giles 讨论了半导体需求、AI 扩展以及收入展望。

大佬观点部署/工程

18:59

Bloomberg：Technology（RSS）

加州参议员 Wiener：AI 监管如同狂野西部

加州参议员 Scott Wiener 在旧金山举行的 Bloomberg Tech 2026 上与 Brad Stone 讨论 AI 监管、透明度及公共政策框架。

政策/监管

18:59

Bloomberg：Technology（RSS）

Claude 试图取代金融顾问的工作？

文章以一个直白的问题开头：你愿意将多少钱交给 Claude？这预示着 AI 聊天机器人正试图闯入金融顾问的领域，替代传统人类顾问的工作。

智能体AnthropicOpenAI现象/趋势

18:59

Bloomberg：Technology（RSS）

Haun Ventures 创始人 Katie Haun 谈 AI 智能体前沿投资

在旧金山举行的 Bloomberg Tech 2026 大会上，Haun Ventures 创始人兼 CEO Katie Haun 与 Bloomberg 的 Emily Chang 对话，分享其风投机构在 AI 智能体领域的前沿投资策略，认为智能体是当前新兴技术中最具潜力的方向之一。

智能体大佬观点

18:52

公众号：百度智能云（文心）

百度伐谋走进北工大实验室：从制氢安全到空间站监测，加速科研探索

百度伐谋进入北京工业大学苗扬团队实验室，辅助解决PEM电解槽制氢故障诊断、空间站空气监测和液体表面波可视化等难题。在制氢安全中，模型准确率从92.26%提升至95.04%，探索周期从“周级”缩短至“小时级”；在空间站色谱柱优化中，72小时内生成方案，体积缩小40%、分离效率提升3倍、误差降低8.17%；海外运维场景预计节省70%–80%维修等待时间。伐谋不替科研人员“写答案”，而是围绕目标、变量和评价标准进行大规模搜索试错。

推理搜索行业动态

18:52

公众号：百度智能云（文心）

FluxA与百度智能云战略合作，为Agent经济搭建基础设施

百度智能云与FluxA建立战略合作，共同为Agent经济搭建基础设施。百度智能云提供可交易商品体系、自雇佣交易机制、能力工具箱及出海分销通道；FluxA作为支付底座，提供低费率高频微交易、Financial Harness安全授权、全球收款与Token Paywall。目前超9万个Agent使用FluxA钱包，超1万个AI Agent资源完成商业化。今年一季度中国两地区OPC新增超6000户，日均Token消耗140万亿。DAA被视为AI时代衡量生态价值的核心指标。

智能体MCP/工具行业动态

18:47

HuggingFace Daily Papers（社区热门论文）

Dream.exe：视频生成模型能否生成可执行的机器人操作？

Dream.exe 是一个评估视频生成模型物理世界理解能力的框架，通过视频到执行的流水线，将生成的机器人操作视频转化为真实可执行轨迹，并在物理模拟器中验证成功率。研究评估了8个模型，包括GPT-4o、Sora、CogVideoX-5B、Meta-LLaMA 3D、GR-1等，覆盖101个手动设计的操作任务，分为三个物理复杂度等级，评测视觉质量、轨迹保真度和执行成功率。结果显示，多个模型达到了可测量的执行成功率，但视觉质量不能预测可执行性。Dream.exe即将开源。

具身智能论文/研究

18:29

Bloomberg：Technology（RSS）

财富管理顾问直面AI智能体冲击

传统财富管理顾问在金融服务行业中最易受AI颠覆冲击。彭博社Isabelle Lee指出，聊天机器人和智能体的崛起正迫使这一领域重新审视其服务模式。

现象/趋势行业动态

18:15

IT之家（RSS）

消息称LG将引进1万块英伟达Blackwell GPU，为其迄今最大规模

LG集团将引进1万块英伟达Blackwell架构GPU，用于其人工智能转型（AX）计划。这是该集团有史以来最大规模的单次英伟达GPU采购，整体投资预计达数万亿韩元。LG人工智能研究院正持续开发EXAONE系列大语言模型；LG电子推进人形机器人商业化；LG U+作为韩国三大电信运营商之一，也是重要AI云服务供应商。英伟达CEO黄仁勋今日会见了LG集团会长具光谟。

行业动态部署/工程

18:15

IT之家（RSS）

视觉内容社交平台 Pinterest 为 AI 服务导入亚马逊 AWS Trainium 芯片

Pinterest 宣布大幅扩展与 AWS 的合作，计划在 2031 年前投入 40 亿美元，扩大对 AWS 定制芯片（包括 CPU 和 AI ASIC）的使用。目前约 1/3 的计算基础设施已运行在 AWS Graviton 系列 Arm CPU 上，未来还将利用 AWS Trainium 托管和运行 LLM / VLM 模型，支持个性化视觉搜索和 AI 辅助发现。首席技术官 Matt Madrigal 表示，深化合作将加速 AI 创新，提升用户体验和广告主效果。

推理行业动态部署/工程

17:58

Bloomberg：Technology（RSS）

苹果在 WWDC 2026 推出 AI、Siri 与 iOS 27

苹果将在周一 WWDC 2026 上发布新款 AI、Siri 与 iOS 27，试图实现人工智能领域的翻身。

大佬观点

17:58

Bloomberg：Technology（RSS）

高盛策略师：AI交易热情降温下的市场整合是"健康的"

高盛资产配置研究主管Christian Mueller-Glissmann接受彭博电视采访时表示，随着人工智能交易热潮降温，市场出现一定程度的整合“可能并非坏事”。他认为，当前市场情绪变化是健康调整的一部分。

大佬观点现象/趋势

17:58

Bloomberg：Technology（RSS）

Nvidia 确认三大内存供应商为 Vera Rubin HBM4 供货

Nvidia CEO 黄仁勋确认，公司已认证全球三大内存芯片制造商，为其 AI 加速器供应最先进的高带宽内存 HBM4。Bloomberg Intelligence 的 Matthew Bloxham 提供了更多分析。

数据/训练行业动态部署/工程

17:56

The Decoder：AI News（RSS）

Anthropic 表示 Claude 现在写 90% 以上的代码，并希望世界拥有 AI 暂停按钮

Anthropic 内部数据显示，Claude 承担了超过 80% 的生产代码编写，工程师每日代码产出是 2024 年的 8 倍。该公司目标是实现 AI 自我改进，这将引发巨大加速。为此 Anthropic 呼吁建立可验证的全球 AI 开发暂停机制，并表示若其他前沿实验室同样暂停，他们也会停止。

Anthropic安全/对齐编码行业动态

关联讨论 9 条

17:54

公众号：通义实验室（千问）

精选70

PawBench：给通用智能体一把可度量的尺

通义实验室推出全新评测基准PawBench v1.0，面向个人助理与通用智能体场景，将底座模型与运行框架Harness纳入同一体系进行交叉评测。评测矩阵包含9个模型与3个Harness（Hermes、OpenClaw、QwenPaw），覆盖150道真实任务共4050个测试单元。结果显示，QwenPaw（76.4分）、OpenClaw（75.4分）、Hermes（70.4分）之间存在显著分差，Harness环境对表现的影响甚至大于模型本身。PawBench还通过切片分析揭示了Harness在产物校验、Skill主动发现和Web搜索默认可用性等方面的关键差距。项目已开源。

智能体MCP/工具评测/基准

推荐理由：PawBench 把 Harness 从‘看不见的手’变成可诊断的变量，好 Harness 能让弱模型以下克上，这份评测对 Agent 框架开发者是一份必读的校验清单。

17:48

HuggingFace Daily Papers（社区热门论文）

SigmaScale：基于SVD低秩分解与学习缩放矩阵的LLM压缩方法

SigmaScale通过学习辅助缩放矩阵S改进基于截断SVD的大语言模型压缩。该方法在激活感知压缩损失下优化两组向量，定义对角行和列缩放变换。学习缩放降低了权重矩阵的有效内在秩（有效秩熵减少），且降低幅度与压缩损失强相关。在Llama 3.1 8B Instruct和Qwen3-8B上的实验表明，SigmaScale在困惑度和零样本基准上与当前最先进SVD压缩方法竞争力相当，在特定任务上表现出优势，成为降低LLM推理计算成本的有效选项。

推理论文/研究部署/工程

17:28

Bloomberg：Technology（RSS）

Anthropic 呼吁建立 AI 暂停按钮，让人类有时间应对影响

Anthropic 呼吁行业建立一个能够暂停人工智能开发的机制，以便给社会机会“应对其巨大影响”。该提议旨在通过强制性或自愿性的暂停按钮，在 AI 快速迭代过程中为人类留出反思和调整的空间。

Anthropic安全/对齐行业动态

17:15

IT之家（RSS）

英伟达黄仁勋确认三星、SK海力士、美光通过 HBM4 认证，Vera Rubin 平台已进入量产

英伟达 CEO 黄仁勋首次确认，已完成对三星电子、SK 海力士和美光科技的认证，允许三家供应商为英伟达 AI 加速器供应 HBM4（高带宽内存）。HBM4 是下一代 Vera Rubin 平台的关键组件。黄仁勋表示，三家供应商均已通过资质认证、全线进入量产阶段，正全力保障 Vera Rubin 供货需求。该平台由 Vera CPU 与 Rubin GPU 集群搭建，整机产品将于今年秋季正式出货。

行业动态

17:15

IT之家（RSS）

腾讯内部调整 AI Token 额度：改为按工作任务动态调配，看产出不看消耗

腾讯内部将 AI Token 额度从全员统一改为按工作任务动态调配，总投入只增不减，不搞 Token 消耗量排名。一位代码产出量是其他员工 3 倍的员工反馈未受影响，老板反而主动增加其配额。在腾讯云 AI 产业应用大会上，腾讯高级执行副总裁汤道生表示，今年腾讯大部分代码由 AI 生成，工程师更多时间做架构设计，写代码工作交给 AI 并定期指导修正。

行业动态

16:47

HuggingFace Daily Papers（社区热门论文）

OMTG（一对多时间定位）系统性方案发布

一对多时间定位（OMTG）旨在定位文本查询对应的多个不连续视频片段。现有SOTA多模态大模型（MLLMs）在此任务上几乎得零分，缺乏事件基数感知。为此，研究者建立了首个综合OMTG基准，引入计数准确率（C-Acc）和有效时间F1（EtF1）作为评测指标；构建包含56k样本的高质量OMTG数据集；开发了针对OMTG的时间奖励和描述奖励函数，其中描述奖励利用密集视频描述的链式推理指导策略优化。该方法在OMTG Bench上达到43.65%的EtF1，分别超过Gemini 2.5 Pro和Seed-1.8达15.85%和15.61%。

多模态视频论文/研究

16:28

Bloomberg：Technology（RSS）

走进Hudson River Trading的惊人token消耗 | Odd Lots

Hudson River Trading（HRT）AI主管Iain Dunning时隔七个月再次接受播客访谈，讨论这家大型做市商部署AI的进展。话题涉及内存价格、计算瓶颈、HRT员工实际在token上的花费、公司可能自研芯片的原因，以及AI引发的谵妄现象。

现象/趋势部署/工程

16:28

Bloomberg：Technology（RSS）

施罗德与Schonfeld投资者谈AI世界的价值发现

施罗德固定收益部门主管Remi Olu-Pitan与Schonfeld宏观股票主管Colin Lancaster在Bloomberg节目中探讨AI大规模投资与颠覆背景下的市场前景。两人此前在伦敦MLIV Money & Macro活动上发言。

现象/趋势

16:15

IT之家（RSS）

2GB内存以上的入门级手机就能用上，谷歌为Android Go系统带来Gemini

谷歌前天宣布为Android Go系统引入Gemini，配备2GB以上内存的Android Go手机可使用精简版Gemini Go AI助手。Gemini Go将替换原有Google Assistant Go，通过Google搜索应用提供服务。用户可通过长按Home键或电源键启动，支持拨打电话、发短信、查地图、搜餐厅、设闹钟、创建日历、播放媒体，并可上传文档和照片获取更多上下文。该助手已开始分阶段推送，用户将在未来几天或数周内体验到。

Google产品更新端侧

16:15

IT之家（RSS）

小米机器人团队拿下CVPR 2026和ICRA 2026双料冠军

小米机器人团队在CVPR 2026 Workshops和ICRA 2026 WBC两项国际赛事中夺得冠军。在CVPR 2026 RoboChallenge中，匿名参赛模型「my16」（自研WAM世界动作模型）以40.89%成功率位列总榜第一，是本届唯一突破40%的模型。在ICRA 2026 WBC超市场景挑战中，综合得分99.2分（接近满分），整体成功率94%，领先第二名10个百分点；简单任务成功率100%，复杂任务成功率90%。该模型采用“S1/S2双系统+长短期记忆+跨本体预训练”架构。

具身智能行业动态

16:15

IT之家（RSS）

MiniMax 就 M3 切换 Token 计费致歉，公布订阅权益保护与档位迁移方案

MiniMax 就 M3 模型上线后切换 Token Plan 计费未提前充分沟通致歉。M3 为更大尺寸、多模态、1M 上下文模型，改用行业统一的 Token-Based 计量。老用户权益：3.22 前购买的无周限额用户 M2.7 和 M3 仍保持无周限额；3.22 至本周五前购买的用户 M3 周限额永久加赠 50%；M3 上线前 7 天内所有订阅用户 5 小时/周额度翻倍。档位迁移：Plus/Max 价格不变，M2.7 次数增加 10%，新增 M3 与多模态权益；Starter 29 元与 Plus-极速 98 元仅对老用户保留；停售的 Max-极速 199 元与 Ultra-极速 899 元可迁至更低月费新档，每月补发差价积分；新增 Ultra 469 元档。补偿积分有效期从一个月改为一年。

产品更新多模态

16:15

IT之家（RSS）

NBA 中国基于阿里千问打造首个官方大模型 NBA Chat，可解读球员位置、得分等核心数据

6月5日，阿里云宣布NBA中国与阿里巴巴共同推出的首个官方大模型“NBA Chat”在“NBA中国”App上线。其模型底座为阿里千问大模型，结合篮球历史数据、球员深度分析等数字资产进行微调，提供智能篮球问答服务。后续将升级Agent能力，支持战术拆解、赛后复盘及球员位置、得分等核心数据解读。去年10月阿里巴巴成为NBA中国官方云计算与人工智能合作伙伴，并在NBA中国赛展示360度实时回放技术。

智能体产品更新

15:58

Bloomberg：Technology（RSS）

鸿海精密5月销售额增长超预期，AI基础设施驱动英伟达服务器需求

鸿海精密（Hon Hai Precision Industry Co.）4月至5月营收同比增长34%，超出市场预期。增长动力主要来自对英伟达（Nvidia）服务器的强劲需求，这些服务器是AI基础设施的关键组成部分。

行业动态部署/工程

15:47

HuggingFace Daily Papers（社区热门论文）

LLMs可以泄露训练数据，但它们愿意吗？一种基于倾向性的记忆评估框架

提出PropMe框架，通过对比前缀攻击与非对抗性评估，衡量大语言模型在普通使用中泄露训练数据的倾向性。配套SimpleTrace管道，基于infini-gram对生成内容进行确定性溯源，计算逐字、近似逐字及倾向性转换后的记忆指标。在Comma和DFM Decoder两个全开放模型、Common Pile和Dynaword两个数据集上的评估显示：前缀攻击可大幅提升记忆提取，但非对抗性提示下倾向性分数始终较低，说明模型能泄露数据但通常不会自发这么做。DFM Decoder（从Comma持续预训练而来）在Common Pile上的记忆能力和倾向性均下降，表明后续训练侧重不同数据可降低记忆。建议记忆审计同时报告最坏情况可提取性和日常泄露倾向性。

安全/对齐论文/研究

15:15

IT之家（RSS）

英伟达黄仁勋：机器人将成为韩国下一个重要产业

英伟达CEO黄仁勋6月5日抵达韩国金浦机场后对记者表示，机器人将成为韩国下一个重要产业，并计划与现代、LG、SK、三星和Naver等企业合作推进机器人与AI领域。他认为韩国为Physical AI提供充足空间，半导体制造将越来越依赖机器人和AI。英伟达或将其计算平台、AI软件和机器人系统引入三星、SK等芯片生产流程。

具身智能大佬观点