Hudson River Trading 的 AI 负责人 Iain Dunning 在 Odd Lots 播客中,与主持人 Joe Weisenthal 和 Tracy Alloway 讨论了该公司如何部署 AI,以及员工实际在模型 token 上的花费情况。
DA Davidson 技术研究主管 Luria 认为,Nvidia 的利润率在 2030 年前相对安全,可维持在 70% 以上,原因是超大规模云服务商在 AI 数据中心芯片方面几乎没有替代选择。
AI 初创公司 Quilty 宣称其工具仅通过阅读剧本就能准确预测电影的市场表现。然而,实际测试结果引发质疑:在拥有全球数据的情况下,Quilty 预测后来票房惨败的《Christy》会优于最终成为奥斯卡获奖大片的《Sinners》。Quilty 创始人认为这类工具能“民主化”电影行业,为新兴创作者提供辅助,但权威性有待验证。
华为云在INSPIRE创想者大会上联合智谱、DeepSeek、MiniMax、Kimi等20余家厂商发布“百模千态,云聚共赢”计划,共建系统化商业生态。同时推出Agentic Infra新范式及四大新品:AICS灵衢智算集群支持10万卡级规模、总算力200EFLOPS、Token生成时延低于10毫秒、千卡吞吐500万Tokens/秒、可用性99.95%;AMS记忆存储方案实现PB级记忆空间并支持KV Cache分层池化;CCE VolcanoNext通智一体化调度引擎提升资源利用率超30%;AgentSphere羽量级沙箱实现100毫秒级启动与每分钟十万级批创能力。
6月5日,开源鸿蒙具身智能PMC(筹)发布EmbodiedAI 1.0.1版本。该版本聚焦机器人控制与智能体应用,升级导航规划、运动控制、仿真开发、硬件适配等核心能力,兼容ROS生态、机器人模拟器及多种本体形态。集成开源鸿蒙原生模拟器、MuJoCo、Gazebo三大仿真环境,打通从代码开发到真机验证的全流程链路。人形机器人、四足机器狗、商用服务机器人等已完成适配验证。目前具身智能方向已组建18个专项SIG工作组,版本源码已正式开放。
OpenAI 确认将遵守特朗普签署的行政命令,在 AI 模型公开发布前允许联邦监管机构进行安全审查。公司国家事务负责人乔治·奥斯本表示参与这一自愿安排,审查期限为 30 天。该命令旨在评估 AI 模型的“高级网络能力”,并认定“受监管的前沿模型”,相关模型的分发和销售可能受限。OpenAI 称一直主动与政府部门沟通安全监管问题。
鸿海科技集团与英特尔宣布战略合作,结合英特尔在处理器、硅光子技术与软件生态的优势,以及鸿海的全球制造、系统整合与AI数据中心部署能力,共同探索从芯片、机柜到系统与应用的全方位AI解决方案。合作首先聚焦AI机柜领域,开发基于英特尔至强处理器的机柜级AI基础设施,推进高速互连、散热与液冷设计;同时在边缘与物理AI领域定义下一代平台架构,布局代理式AI、终端智能与机器人;此外还将探索定制ASIC、SoC与系统整合设计服务的合作。
据《连线》今日报道,Meta 通过多次应用更新将人脸识别代码推送到智能眼镜配套 App 中,代号“NameTag”。该功能利用已部署的三个 AI 模型将人脸转换为“人脸特征模板”,与手机本地数据库匹配,识别成功后向佩戴者发送通知。App 下载量超 5000 万次。Meta 回应称代码仅为探索,尚未决定推出,且不会建立中央人脸数据库。此前 Meta 曾因人脸识别问题在伊利诺伊州和得克萨斯州分别达成 6.5 亿美元和 14 亿美元和解。
微软XBOX CEO阿莎·夏尔马宣布取消主机端Copilot AI伴侣项目,原因是玩家并不期待这种体验。两年前微软曾演示Copilot在游戏中与玩家对话,去年更宣布将Copilot for Gaming带到XBOX,但夏尔马上任后立即叫停。她表示XBOX仍在探索AI在游戏开发中的用途,但AI作为游戏助手对玩家的好处不明确,而神经渲染等画面超分技术(如英伟达DLSS和AMD FSR)价值更清晰。夏尔马强调这是XBOX的决定,微软CEO纳德拉给了她为玩家作最佳决定的空间。
BlackRock全球固定收益首席投资官Rick Rieder就5月美国就业报告发表评论,称报告在多个方面“令人瞩目”。他指出,AI基础设施相关的非住宅建设项目拉动了建筑业强劲增长,对整体就业数据贡献显著。
ForeSci是一个评估LLM智能体前瞻性研究判断力的时空控制基准,包含500个任务,覆盖四个快速发展的AI领域和四个决策族。每个任务配有截止时间对齐的离线知识库,训练数据止于截止点,后续论文仅用于验证。评估了原生LLM、Hybrid RAG和三种研究智能体适配方法在四个骨干模型上的表现。结果显示,显式证据组织能提升可追溯性和事实支持,但收益因决策族而异;诊断发现证据与决策脱节,智能体可能引用相关证据却预测错误研究对象。该基准将前瞻性AI研究判断转化为可控评估系统。
本研究提出反事实语境修正框架,用于审计LLM在模拟社交媒体用户立场时的语境敏感性。给定原始对话后,先推断目标用户立场,再对语境施加受控修正策略(纯文本与结合模因的多模态策略)并重新模拟。评估平均方向性立场转变与立场转换率,发现两种策略在不同极化偏好机制下均实现有效且稳健的立场转换。该框架揭示了LLM立场模拟的语境敏感性,同时突出了其模拟在线舆论动态的前景与风险。
研究分析 Rectified Flows 生成模型在插值路径 X_λ = (1-λ)X_0 + λX_1 上的训练数据成员信息泄露。训练集与测试集的重建误差在 λ 轴上呈钟形曲线,该差距随训练累积,而验证指标保持稳定。钟形峰值在 Gaussian 假设下有闭合解析解,并在音频与图像数据上验证其普适性。利用该 λ 分辨结构可实现成员推断攻击(MIA),区分训练集与非训练集样本。
通过微调,让大型语言模型(LLM)生成具有1995年风格的文档。项目来自 passo.uno,于 2026 年 6 月 5 日在 Hacker News 上获得 103 点热度。
华为与国网辽宁电力在2026年能源网络通信创新应用大会上揭牌全球首个电力端到端光通信网样板点,覆盖主网fgOTN、配网高隔离PON、全光智慧变电站和低压HPLC四大场景。fgOTN已成熟商用并参与ITU-T标准编制;高隔离PON支持EPON/GPON双模自适应,具备-40℃至70℃宽温、6kV防雷及50毫秒级倒换;全光智慧变电站使巡检任务配置效率提升75%,IVS1900平台提供420TOPS算力;HPLC采集成功率99.9%。该样板点形成可复制的新型电力系统通信目标网方案。
腾讯混元提出 Stem 稀疏注意力算法,已被机器学习顶会 ICML-26 收录。该算法从因果信息流重新审视块级稀疏,引入 Token 位置衰减(TPD)和输出感知度量(OAM),仅用 25% 算力即逼近稠密注意力精度。配套的 HPC 开源 Stem+BSA 算子将稀疏收益转化为实际加速,在 128K 上下文下首字延迟降低 3.6 倍。
6月5日,快手旗下可灵AI宣布全球用户突破1亿,企业客户近5万。过去一年,可灵完成26次迭代,深入影视、广告、音乐MV、游戏、电商、智能硬件等场景,并发布由可灵AI全片生成的两周年短片。据IT之家此前报道,快手正评估拟议重组可灵AI相关资产及业务,或引入外部融资;目前可灵AI正在进行Pre-IPO轮融资,投前估值180亿美元,内部按2027年初递交港股上市申报材料推进。
Chrome Canary 中出现隐藏 flag“Fulfill Searchbox Queries in AI Mode”,启用后地址栏搜索直接进入 AI Mode,界面类似聊天机器人,跳过传统搜索结果页。该功能完成度已接近可发布状态,但谷歌尚未公开宣布。用户可通过 chrome://flags 开启,支持 Mac、Windows、Linux 和 ChromeOS,短期内不会上线。
飞牛 fnOS 于 6 月 5 日宣布,ARM 设备飞牛相册更新至 v0.9.4-4,新增 OPPO/一加设备互联(X86 此前已支持)。互联功能包括:无感发现局域网设备、控制中心系统级入口、后台从云端拉取原图备份、手机原生相册浏览 NAS 照片。同时修复 AI 设置加载超时、非管理员无法维护工具等问题;智能识别新增“更新智能分类”及更多分类词,优化 UI,修复大分辨率图片预览动画失效、描述无法输入空格等 bug。X86 系统同步更新 v1.1.3107,支持更多 OPPO/一加互联,解决旧安全证书兼容性及应用中心小龙虾插件更新失败问题。
6月4日,面壁智能在高通汽车技术与合作峰会上推出端侧智能座舱产品矩阵SuperMate。该产品基于MiniCPM-o4.5全双工全模态大模型,实现多源感知、融合决策与精准执行的全链路端侧处理。采用意图驱动与思维链自主编排,引入L1-L5记忆分层机制和动态信任窗口,支持打断与情绪调节。目前SuperMate已量产交付超30万台车辆,覆盖68个场景,无需依赖云端。面壁智能通过低比特量化与知识蒸馏降低算力需求,推动端侧AI规模化装车。
OpenSquilla通过Meta Skill将多个Skill按YAML定义步骤、顺序和依赖,在Runtime层预先校验,防止无效调用。在PinchBench 1.2.1上,三模型混用的OpenSquilla与Claude Opus 4.7版OpenClaw得分几乎相同,但Token少一半,成本不到1/9。将Superpowers下14个Skill组合为Meta Skill后,输入Token压缩至67%。支持多模型,用本地小模型分类任务,模型切换仅在新Session生效;子Agent压缩上下文,400K窗口内可保持记忆。同一会话执行8个框架调研报告,仅花费7美分,Token和成本精确到小数点后四位。
TeraWulf Inc. 在成功执行一笔高收益债券销售后,正寻求进入杠杆贷款市场,为其 AI 基础设施建设提供资金。该公司此前通过垃圾债发行获得融资,现计划扩大融资渠道以支持数据中心扩张。
微软向企业客户推销 MAI 模型时声称其训练数据仅使用“干净且经过商业许可的数据”,但实际部分依赖 Common Crawl 等未授权网络数据。与其它 AI 公司一样,微软援引合理使用原则,并将阻止其爬虫的责任推给网站所有者。
荣耀MagicOS六月更新公布。YOYO新增排队码提醒、AI图像创作、伴学助手(仅平板)、时光问图、漫画故事等风格模板;YOYO建议支持大众点评排号动态提醒;YOYO智能体新增女生音色。灵动胶囊新增咪咕视频赛事比分、淘宝闪购买药、高德/百度驾车导航、美团骑行、大众点评排号等生态服务。锁屏小组件新增世界时钟、小红书看笔记等。新增AI窥屏防护、虚拟权限、离焦视力舒缓运动模式。优化一碰传、输入法、相机关闭闪退等问题。合入安卓2026年5月安全补丁。适配机型包括Magic V6、Magic8系列、Magic7系列等数十款。
SpaceX正为IPO寻求1.77万亿美元估值,计划下周融资约750亿美元,或成史上最大IPO。摩根士丹利预测,其2040年营收可达3.4万亿美元,调整后EBITDA超2.7万亿。2025年营收187亿美元,亏损49亿美元。高盛和摩根士丹利均预计2028年营收接近1600亿美元;2030年预测存分歧:高盛预计超4700亿美元,摩根士丹利预计近3300亿美元。两家银行认为AI业务是关键,高盛预计2030年AI贡献约3220亿美元,摩根士丹利约1900亿美元。
英国政府拟立法要求科技公司高管为未成年网络防护负责,若未能阻止儿童在手机上看到裸露图片,高管面临最高五年监禁。计划下周公布,要求谷歌、苹果等公司阻止儿童通过移动设备发送、接收、查看或分享色情及电影性场景等敏感图片,并须在较短时间内完成整改。苹果2022年已推出儿童安全功能,通过机器学习检测“信息”和FaceTime中的敏感内容;谷歌去年也推出检测和模糊敏感图片功能,并在儿童尝试操作时发出警告。英国政府希望科技公司整合并扩大这些现有措施。
据路透社报道,Anthropic 与特朗普政府关系出现缓和。此前 Anthropic 拒绝将 AI 模型用于国内监控和完全自主武器系统,被列入国家安全黑名单。4月中旬 Anthropic CEO 首次访问白宫商讨合作。白宫曾邀请其出席原定5月21日签署的 AI 行政令仪式(后取消但本周二已签署)。Anthropic 还与美国家网络总监讨论用 AI 系统 Mythos 保护关键基础设施。Anthropic 仍在法院挑战“供应链风险”认定。
Ladybird 浏览器项目宣布不再接受公开 pull request。维护者 Andreas Kling 指出,过去提交大量补丁意味着付出实质性努力,可作为善意的合理代理,但这一假设已不再成立。代码是手工输入还是由 AI 生成已无关紧要,关键是谁对进入浏览器的代码负责。Ladybird 正成为面向真实用户的浏览器,引入变更的人必须是决定该变更属于项目并承担后果的人。
壳牌(Shell)将利用 C3 AI 的智能体(agents),从基础异常检测转向全自动预测性维护。目前壳牌已在上下游运营中使用 C3 AI Reliability Suite 监控超过 30,000 个关键设备,未来将借助 AI 智能体进一步自动化维护流程。
投资者意识到人工智能热潮终将结束,问题在于何时。彭博MLIV最新伦敦活动上,Skylar Montgomery Koning分享了关键观点。
Meta 高管 Wang 表示,AI 智能体将重新定义人与技术的关系,行业需要建立信任,才能让人们充分利用 AI。
Vibe Coding将自然语言转化为可运行的软件。文章对比了2026年15款Vibe Coding工具的价格、功能与适用场景,帮助开发者选择最适合的应用构建方式。
一篇实践指南,介绍如何在 Google Colab 中运行 Microsoft Fara,使用模拟的 OpenAI 兼容端点测试浏览器智能体循环。
Perplexity AI 发布面向个人电脑的混合本地-服务器推理编排器,可自动将 AI 任务在设备端模型与云端模型之间动态路由,实现推理负载的智能分配与优化。
NVIDIA Dynamo Snapshot 使用 CRIU 和 cuda-checkpoint 工具,在 Kubernetes 上对 vLLM 推理工作节点进行检查点和恢复,实现快速启动。
Anthropic 据报已派驻约六名工程师至 NSA,将其 Mythos 模型适配于进攻性网络行动。该模型可能用于入侵中国或伊朗的网络系统。此举符合 Anthropic 的立场:其关于限制 AI 用于大规模监控的承诺仅适用于美国公民。
Stem算法通过Token位置衰减(TPD)和输出感知度量(OAM)两项创新,仅用25%算力即逼近稠密注意力精度。配套HPC算子针对Hopper架构优化,支持FP8量化与vLLM的Paged KV Cache,在混元Hy3 preview上实现首字延迟降低3.6倍。HPC-BSA相比MIT-BSA稳定保持约3倍加速,在8K至256K序列长度上表现一致。
火山引擎豆包视频生成模型Seedance 2.0以音画同出、全能参考、物理规律遵循、长视频一致性及电影级审美,打通品牌广告高质感创作与效果广告规模化量产。品牌场景已应用于智己汽车、华为手机、芝华仕等;效果广告场景下,30秒素材制作成本30-45元/条,单日稳定产出上百条,AIGC优质素材平均ARPU提升80.2%。基于Seedance 2.0的KickArt 3.0 Agent可实现爆款素材参考生成与批量裂变,已在汽车、3C、电商、快消等行业落地。
在2026高通汽车技术与合作峰会上,高通联合诚迈科技等生态企业发布车端人工智能Claw生态计划。该计划结合骁龙数字底盘与高通智能体AI运行环境,将AI智能体和多模态大模型直接部署到车端,旨在消除下一代汽车智能开发碎片化。核心能力涵盖:全天候多模态感知(融合车内外摄像头、音频等)、百亿参数混合专家模型(MoE)在终端侧实时运行、六层车规级安全架构(覆盖车辆控制分级、用户授权、隐私保护等),以及持续演进的AI生态系统。推动汽车从移动工具进化为智能伙伴。