投资者意识到人工智能热潮终将结束,问题在于何时。彭博MLIV最新伦敦活动上,Skylar Montgomery Koning分享了关键观点。
投资者意识到人工智能热潮终将结束,问题在于何时。彭博MLIV最新伦敦活动上,Skylar Montgomery Koning分享了关键观点。
Meta 高管 Wang 表示,AI 智能体将重新定义人与技术的关系,行业需要建立信任,才能让人们充分利用 AI。
Vibe Coding将自然语言转化为可运行的软件。文章对比了2026年15款Vibe Coding工具的价格、功能与适用场景,帮助开发者选择最适合的应用构建方式。
一篇实践指南,介绍如何在 Google Colab 中运行 Microsoft Fara,使用模拟的 OpenAI 兼容端点测试浏览器智能体循环。
Perplexity AI 发布面向个人电脑的混合本地-服务器推理编排器,可自动将 AI 任务在设备端模型与云端模型之间动态路由,实现推理负载的智能分配与优化。
NVIDIA Dynamo Snapshot 使用 CRIU 和 cuda-checkpoint 工具,在 Kubernetes 上对 vLLM 推理工作节点进行检查点和恢复,实现快速启动。
Anthropic 据报已派驻约六名工程师至 NSA,将其 Mythos 模型适配于进攻性网络行动。该模型可能用于入侵中国或伊朗的网络系统。此举符合 Anthropic 的立场:其关于限制 AI 用于大规模监控的承诺仅适用于美国公民。
Stem算法通过Token位置衰减(TPD)和输出感知度量(OAM)两项创新,仅用25%算力即逼近稠密注意力精度。配套HPC算子针对Hopper架构优化,支持FP8量化与vLLM的Paged KV Cache,在混元Hy3 preview上实现首字延迟降低3.6倍。HPC-BSA相比MIT-BSA稳定保持约3倍加速,在8K至256K序列长度上表现一致。
火山引擎豆包视频生成模型Seedance 2.0以音画同出、全能参考、物理规律遵循、长视频一致性及电影级审美,打通品牌广告高质感创作与效果广告规模化量产。品牌场景已应用于智己汽车、华为手机、芝华仕等;效果广告场景下,30秒素材制作成本30-45元/条,单日稳定产出上百条,AIGC优质素材平均ARPU提升80.2%。基于Seedance 2.0的KickArt 3.0 Agent可实现爆款素材参考生成与批量裂变,已在汽车、3C、电商、快消等行业落地。
在2026高通汽车技术与合作峰会上,高通联合诚迈科技等生态企业发布车端人工智能Claw生态计划。该计划结合骁龙数字底盘与高通智能体AI运行环境,将AI智能体和多模态大模型直接部署到车端,旨在消除下一代汽车智能开发碎片化。核心能力涵盖:全天候多模态感知(融合车内外摄像头、音频等)、百亿参数混合专家模型(MoE)在终端侧实时运行、六层车规级安全架构(覆盖车辆控制分级、用户授权、隐私保护等),以及持续演进的AI生态系统。推动汽车从移动工具进化为智能伙伴。
Meta 首席 AI 官 Alexandr Wang 在 2026 年旧金山举行的 Bloomberg Tech 大会上,与 Bloomberg 的 Kurt Wagner 展开对话,围绕模型开发、基础设施投资和 AI 竞争态势进行了讨论。
Broadcom 总裁兼 CEO Hock Tan 在旧金山举行的 Bloomberg Tech 2026 会议上,与 Bloomberg 的 Tom Giles 讨论了半导体需求、AI 扩展以及收入展望。
加州参议员 Scott Wiener 在旧金山举行的 Bloomberg Tech 2026 上与 Brad Stone 讨论 AI 监管、透明度及公共政策框架。
文章以一个直白的问题开头:你愿意将多少钱交给 Claude?这预示着 AI 聊天机器人正试图闯入金融顾问的领域,替代传统人类顾问的工作。
在旧金山举行的 Bloomberg Tech 2026 大会上,Haun Ventures 创始人兼 CEO Katie Haun 与 Bloomberg 的 Emily Chang 对话,分享其风投机构在 AI 智能体领域的前沿投资策略,认为智能体是当前新兴技术中最具潜力的方向之一。
百度伐谋进入北京工业大学苗扬团队实验室,辅助解决PEM电解槽制氢故障诊断、空间站空气监测和液体表面波可视化等难题。在制氢安全中,模型准确率从92.26%提升至95.04%,探索周期从“周级”缩短至“小时级”;在空间站色谱柱优化中,72小时内生成方案,体积缩小40%、分离效率提升3倍、误差降低8.17%;海外运维场景预计节省70%–80%维修等待时间。伐谋不替科研人员“写答案”,而是围绕目标、变量和评价标准进行大规模搜索试错。
百度智能云与FluxA建立战略合作,共同为Agent经济搭建基础设施。百度智能云提供可交易商品体系、自雇佣交易机制、能力工具箱及出海分销通道;FluxA作为支付底座,提供低费率高频微交易、Financial Harness安全授权、全球收款与Token Paywall。目前超9万个Agent使用FluxA钱包,超1万个AI Agent资源完成商业化。今年一季度中国两地区OPC新增超6000户,日均Token消耗140万亿。DAA被视为AI时代衡量生态价值的核心指标。
Dream.exe 是一个评估视频生成模型物理世界理解能力的框架,通过视频到执行的流水线,将生成的机器人操作视频转化为真实可执行轨迹,并在物理模拟器中验证成功率。研究评估了8个模型,包括GPT-4o、Sora、CogVideoX-5B、Meta-LLaMA 3D、GR-1等,覆盖101个手动设计的操作任务,分为三个物理复杂度等级,评测视觉质量、轨迹保真度和执行成功率。结果显示,多个模型达到了可测量的执行成功率,但视觉质量不能预测可执行性。Dream.exe即将开源。
传统财富管理顾问在金融服务行业中最易受AI颠覆冲击。彭博社Isabelle Lee指出,聊天机器人和智能体的崛起正迫使这一领域重新审视其服务模式。
LG集团将引进1万块英伟达Blackwell架构GPU,用于其人工智能转型(AX)计划。这是该集团有史以来最大规模的单次英伟达GPU采购,整体投资预计达数万亿韩元。LG人工智能研究院正持续开发EXAONE系列大语言模型;LG电子推进人形机器人商业化;LG U+作为韩国三大电信运营商之一,也是重要AI云服务供应商。英伟达CEO黄仁勋今日会见了LG集团会长具光谟。
Pinterest 宣布大幅扩展与 AWS 的合作,计划在 2031 年前投入 40 亿美元,扩大对 AWS 定制芯片(包括 CPU 和 AI ASIC)的使用。目前约 1/3 的计算基础设施已运行在 AWS Graviton 系列 Arm CPU 上,未来还将利用 AWS Trainium 托管和运行 LLM / VLM 模型,支持个性化视觉搜索和 AI 辅助发现。首席技术官 Matt Madrigal 表示,深化合作将加速 AI 创新,提升用户体验和广告主效果。
苹果将在周一 WWDC 2026 上发布新款 AI、Siri 与 iOS 27,试图实现人工智能领域的翻身。
高盛资产配置研究主管Christian Mueller-Glissmann接受彭博电视采访时表示,随着人工智能交易热潮降温,市场出现一定程度的整合“可能并非坏事”。他认为,当前市场情绪变化是健康调整的一部分。
Nvidia CEO 黄仁勋确认,公司已认证全球三大内存芯片制造商,为其 AI 加速器供应最先进的高带宽内存 HBM4。Bloomberg Intelligence 的 Matthew Bloxham 提供了更多分析。
Anthropic 内部数据显示,Claude 承担了超过 80% 的生产代码编写,工程师每日代码产出是 2024 年的 8 倍。该公司目标是实现 AI 自我改进,这将引发巨大加速。为此 Anthropic 呼吁建立可验证的全球 AI 开发暂停机制,并表示若其他前沿实验室同样暂停,他们也会停止。
关联讨论 9 条Anthropic:The Institute(旗舰研究长文 · 网页)X:Anthropic (@AnthropicAI)X:Emad Mostaque (@EMostaque)Hacker News 热门(buzzing.cc 中文翻译)X:Kim (@kimmonismus)X:小互 (@xiaohu)X:Testing Catalog (@testingcatalog)X:卡兹克 (@Khazix0918)X:Rohan Paul (@rohanpaul_ai)通义实验室推出全新评测基准PawBench v1.0,面向个人助理与通用智能体场景,将底座模型与运行框架Harness纳入同一体系进行交叉评测。评测矩阵包含9个模型与3个Harness(Hermes、OpenClaw、QwenPaw),覆盖150道真实任务共4050个测试单元。结果显示,QwenPaw(76.4分)、OpenClaw(75.4分)、Hermes(70.4分)之间存在显著分差,Harness环境对表现的影响甚至大于模型本身。PawBench还通过切片分析揭示了Harness在产物校验、Skill主动发现和Web搜索默认可用性等方面的关键差距。项目已开源。
SigmaScale通过学习辅助缩放矩阵S改进基于截断SVD的大语言模型压缩。该方法在激活感知压缩损失下优化两组向量,定义对角行和列缩放变换。学习缩放降低了权重矩阵的有效内在秩(有效秩熵减少),且降低幅度与压缩损失强相关。在Llama 3.1 8B Instruct和Qwen3-8B上的实验表明,SigmaScale在困惑度和零样本基准上与当前最先进SVD压缩方法竞争力相当,在特定任务上表现出优势,成为降低LLM推理计算成本的有效选项。
Anthropic 呼吁行业建立一个能够暂停人工智能开发的机制,以便给社会机会“应对其巨大影响”。该提议旨在通过强制性或自愿性的暂停按钮,在 AI 快速迭代过程中为人类留出反思和调整的空间。
英伟达 CEO 黄仁勋首次确认,已完成对三星电子、SK 海力士和美光科技的认证,允许三家供应商为英伟达 AI 加速器供应 HBM4(高带宽内存)。HBM4 是下一代 Vera Rubin 平台的关键组件。黄仁勋表示,三家供应商均已通过资质认证、全线进入量产阶段,正全力保障 Vera Rubin 供货需求。该平台由 Vera CPU 与 Rubin GPU 集群搭建,整机产品将于今年秋季正式出货。
腾讯内部将 AI Token 额度从全员统一改为按工作任务动态调配,总投入只增不减,不搞 Token 消耗量排名。一位代码产出量是其他员工 3 倍的员工反馈未受影响,老板反而主动增加其配额。在腾讯云 AI 产业应用大会上,腾讯高级执行副总裁汤道生表示,今年腾讯大部分代码由 AI 生成,工程师更多时间做架构设计,写代码工作交给 AI 并定期指导修正。
一对多时间定位(OMTG)旨在定位文本查询对应的多个不连续视频片段。现有SOTA多模态大模型(MLLMs)在此任务上几乎得零分,缺乏事件基数感知。为此,研究者建立了首个综合OMTG基准,引入计数准确率(C-Acc)和有效时间F1(EtF1)作为评测指标;构建包含56k样本的高质量OMTG数据集;开发了针对OMTG的时间奖励和描述奖励函数,其中描述奖励利用密集视频描述的链式推理指导策略优化。该方法在OMTG Bench上达到43.65%的EtF1,分别超过Gemini 2.5 Pro和Seed-1.8达15.85%和15.61%。
Hudson River Trading(HRT)AI主管Iain Dunning时隔七个月再次接受播客访谈,讨论这家大型做市商部署AI的进展。话题涉及内存价格、计算瓶颈、HRT员工实际在token上的花费、公司可能自研芯片的原因,以及AI引发的谵妄现象。
施罗德固定收益部门主管Remi Olu-Pitan与Schonfeld宏观股票主管Colin Lancaster在Bloomberg节目中探讨AI大规模投资与颠覆背景下的市场前景。两人此前在伦敦MLIV Money & Macro活动上发言。
谷歌前天宣布为Android Go系统引入Gemini,配备2GB以上内存的Android Go手机可使用精简版Gemini Go AI助手。Gemini Go将替换原有Google Assistant Go,通过Google搜索应用提供服务。用户可通过长按Home键或电源键启动,支持拨打电话、发短信、查地图、搜餐厅、设闹钟、创建日历、播放媒体,并可上传文档和照片获取更多上下文。该助手已开始分阶段推送,用户将在未来几天或数周内体验到。
小米机器人团队在CVPR 2026 Workshops和ICRA 2026 WBC两项国际赛事中夺得冠军。在CVPR 2026 RoboChallenge中,匿名参赛模型「my16」(自研WAM世界动作模型)以40.89%成功率位列总榜第一,是本届唯一突破40%的模型。在ICRA 2026 WBC超市场景挑战中,综合得分99.2分(接近满分),整体成功率94%,领先第二名10个百分点;简单任务成功率100%,复杂任务成功率90%。该模型采用“S1/S2双系统+长短期记忆+跨本体预训练”架构。
MiniMax 就 M3 模型上线后切换 Token Plan 计费未提前充分沟通致歉。M3 为更大尺寸、多模态、1M 上下文模型,改用行业统一的 Token-Based 计量。老用户权益:3.22 前购买的无周限额用户 M2.7 和 M3 仍保持无周限额;3.22 至本周五前购买的用户 M3 周限额永久加赠 50%;M3 上线前 7 天内所有订阅用户 5 小时/周额度翻倍。档位迁移:Plus/Max 价格不变,M2.7 次数增加 10%,新增 M3 与多模态权益;Starter 29 元与 Plus-极速 98 元仅对老用户保留;停售的 Max-极速 199 元与 Ultra-极速 899 元可迁至更低月费新档,每月补发差价积分;新增 Ultra 469 元档。补偿积分有效期从一个月改为一年。
6月5日,阿里云宣布NBA中国与阿里巴巴共同推出的首个官方大模型“NBA Chat”在“NBA中国”App上线。其模型底座为阿里千问大模型,结合篮球历史数据、球员深度分析等数字资产进行微调,提供智能篮球问答服务。后续将升级Agent能力,支持战术拆解、赛后复盘及球员位置、得分等核心数据解读。去年10月阿里巴巴成为NBA中国官方云计算与人工智能合作伙伴,并在NBA中国赛展示360度实时回放技术。
鸿海精密(Hon Hai Precision Industry Co.)4月至5月营收同比增长34%,超出市场预期。增长动力主要来自对英伟达(Nvidia)服务器的强劲需求,这些服务器是AI基础设施的关键组成部分。
提出PropMe框架,通过对比前缀攻击与非对抗性评估,衡量大语言模型在普通使用中泄露训练数据的倾向性。配套SimpleTrace管道,基于infini-gram对生成内容进行确定性溯源,计算逐字、近似逐字及倾向性转换后的记忆指标。在Comma和DFM Decoder两个全开放模型、Common Pile和Dynaword两个数据集上的评估显示:前缀攻击可大幅提升记忆提取,但非对抗性提示下倾向性分数始终较低,说明模型能泄露数据但通常不会自发这么做。DFM Decoder(从Comma持续预训练而来)在Common Pile上的记忆能力和倾向性均下降,表明后续训练侧重不同数据可降低记忆。建议记忆审计同时报告最坏情况可提取性和日常泄露倾向性。
英伟达CEO黄仁勋6月5日抵达韩国金浦机场后对记者表示,机器人将成为韩国下一个重要产业,并计划与现代、LG、SK、三星和Naver等企业合作推进机器人与AI领域。他认为韩国为Physical AI提供充足空间,半导体制造将越来越依赖机器人和AI。英伟达或将其计算平台、AI软件和机器人系统引入三星、SK等芯片生产流程。