微软MAI系列AI模型训练数据曝光,官方技术论文显示模型使用了包括Common Crawl在内的开放网络数据,而非此前宣称的仅依赖企业级、干净且商业授权数据。微软称训练数据为“公开可得数据”与“授权的人类生成数据”的混合,并采用自有爬虫遵守robots.txt。但未屏蔽内容默认可被抓取的逻辑被指类似“没有锁门就等于同意进入”,引发争议。
微软MAI系列AI模型训练数据曝光,官方技术论文显示模型使用了包括Common Crawl在内的开放网络数据,而非此前宣称的仅依赖企业级、干净且商业授权数据。微软称训练数据为“公开可得数据”与“授权的人类生成数据”的混合,并采用自有爬虫遵守robots.txt。但未屏蔽内容默认可被抓取的逻辑被指类似“没有锁门就等于同意进入”,引发争议。
字节跳动今日发表声明,否认造车或推出汽车品牌的计划。声明指出,“赛豆”不是字节跳动或豆包推出的汽车品牌,字节与赛豆没有股权合作。豆包、火山引擎与汽车行业伙伴的合作仅限于提供豆包大模型、智能座舱等技术服务,以提升车载智能交互体验。此前《晚点Auto》爆料赛力斯正筹备新品牌“赛豆科技”,预计6月发布,并将与火山引擎展开深度合作。
一篇题为“Transformers are inherently succinct”的论文在 openreview.net 上发布,从理论上论证 Transformer 架构具有内在的简洁性(succinctness)。
比亚迪否认网传其自研人形机器人代号“尧舜禹”、第七代原型机在深圳和长沙工厂实地测试、约150台上岗、年内内部部署2万台等消息,称均不属实。比亚迪集团执行副总裁李柯此前表示,比亚迪也在开发人形机器人,汽车相关AI能力与机器人有同源性,未来可通过经销商网络售卖机器人。李柯还称,中国机器人缺大脑,美国机器人四肢不发达,需实现两者结合。
科技媒体Android Authority 6月5日报道,谷歌否认将AI Mode设为Chrome默认搜索方式的说法。此前Chrome Canary频道新增"Fulfill Searchbox Queries in AI Mode"实验选项,启用后地址栏查询直接进入AI Mode,引发媒体猜测。谷歌搜索工程副总裁Rajan Patel回应称该发布属错误,目前无相关计划。媒体认为"错误"更指向该功能不应在本次Canary版本中出现,而非内部未测试。
Simon Willison 发布 alpha 包 micropython-wasm,用于在 Python 应用中安全执行代码。该包将 MicroPython 编译为 WebAssembly,通过 wasmtime 库运行,实现内存和 CPU 限制、严格的文件与网络访问控制,并支持主机函数交互。它可作为 Datasette Agent 的沙箱插件 datasette-agent-micropython。
Ladybird 浏览器项目正冲刺首个 Alpha 版本,宣布不再接受公开拉取请求,仅允许维护者提交代码。创始人 Andreas Kling 表示,生成式 AI 让任何人可快速生成看似完整的代码变更,但提交者未必真正理解项目。浏览器处理全网不受信任输入,一个伪装良好的漏洞就可能被利用。所有未处理的公开 PR 已立即关闭。
微软重启自动安装计划,自本月起在已安装Microsoft 365应用的商用Windows PC上自动安装Microsoft 365 Copilot。该计划2025年9月宣布,2026年3月因技术问题搁置,现已恢复。推广分阶段进行,功能标志部署从6月4日持续至7月1日,预计6月底完成。IT管理员可选择退出。
6月6日,中国科学院海洋研究所发布“琅琊”2.0,在1.0基础上从海洋状态变量预报拓展至台风、降水、风暴潮、海冰等六类复杂海洋现象,开发了6个垂直模型。台风模型融合大气海洋环境场、卫星云图和历史演变信息,提升24小时路径与强度预报;降水模型基于卫星数据学习时空演变预测未来变化;海冰模型面向北极航道,实现3公里分辨率、月尺度以上快速预测,支撑航道安全研判。
iOS 27 版 Siri 围绕用户画像、屏幕感知和应用整合三大方向升级:可访问邮件、信息等内容,理解当前屏幕并跨应用串联任务。Siri 升级为聊天机器人形态,具备搜索、概括、内容与图像生成能力,支持多轮对话和上下文记忆。苹果为其打造独立应用,驻留灵动岛并采用发光胶囊动画与透明卡片展示。隐私方面推行本地+私有云机制,部分请求转 Google Cloud 调用授权版 Gemini。iOS 27 允许 Siri 接入 ChatGPT、Claude、Gemini 等第三方 AI。新 Siri 预计 2026 年 6 月 8 日在 WWDC 预览。
彭博社马克·古尔曼爆料,iOS 27 中 Apple Intelligence 多项升级。Visual Intelligence 新增读取营养成分标签、提取名片等信息。修图推出 Extend(AI 补全照片边界)、Reframe(调整空间照片角度)和 Enhance(优化画质色彩)。Safari 新增 Organize Tabs,按购物、旅行等主题自动分类标签页。Genmoji 根据用户照片库和常用短语主动生成个性化表情,该能力还将进入壁纸设置。健康项目 Mulberry 含血糖追踪和相机锻炼监测,预计不随 iOS 27 首发。
苹果在 2026 年全球开发者大会(WWDC)开幕前夕汇总 iPadOS 27 新功能,聚焦 AI 体验升级。Safari 新增 Organize Tabs 功能,自动按主题整理标签页。Spotlight 搜索深度整合 Siri,支持提问、找文件、启动应用、查询天气等,并接入新 AI 搜索系统。快捷指令支持自然语言创建。系统级语法检查覆盖全系统,以半透明菜单展示原文和修改建议,可单独或批量接受修改。
据 IT 之家引述 9to5Mac 报道,iOS 27 版 Siri 上线初期将引入候补名单机制,苹果按批次开放体验资格,内部将其定义为“测试版”与“预览版”。官方可能在 2026 年 WWDC 宣布新功能,但并非所有用户能第一时间参与。苹果将边上线边打磨,收集用户反馈改进 Siri 表现。此前 Apple Intelligence 在 iOS 18.1 早期版本也曾采用类似机制。新版 Siri 采用全新架构并首次接入谷歌 Gemini 模型,系统稳定性、响应质量、兼容性与隐私体验需更谨慎观察。
Claude Code v2.1.166 新增 fallbackModel 设置,最多配置三个后备模型在主模型过载或不可用时按序尝试;--fallback-model 现也适用于交互会话。deny rule 中工具名位置支持 glob 模式("*"拒绝所有工具),未知工具名启动时警告。跨会话消息中继不再携带用户权限,接收方拒绝被中继的权限请求。MAX_THINKING_TOKENS=0、--thinking disabled 及逐模型 thinking 开关可禁用默认开启思考的模型(仅 Claude API,第三方不变)。API 返回非预期不可重试错误时,在后备模型上重试一次。修复了图像处理失败、远程会话卡死、JetBrains IDE 终端闪烁、Kitty 键盘协议下 Shift+非 ASCII 字符丢失、PowerShell 命令验证挂起、macOS 后台进程孤儿化等问题。
关联讨论 2 条Claude Code:GitHub Releases(RSS)X:Claude Devs (@ClaudeDevs)OpenAI 正式向 Free、Go、Plus、Pro 个人账户及自助 ChatGPT Business 账户推出 Lockdown Mode。该模式通过限制出站网络请求,阻止提示词注入攻击中最后一步的数据外泄,但无法阻止注入本身出现在内容中。Simon Willison 认为这一设计直击“致命三角”中最易切断的数据外泄腿,且采用确定性机制而不依赖易被攻破的 AI 评估。
Anthropic称其最新AI模型已显现可能脱离人类控制的迹象,呼吁全球主要AI公司协调放缓前沿AI开发。腾讯汤道生表示今年腾讯大部分代码由AI生成,工程师更多投入架构设计。华为云联合智谱、DeepSeek、Kimi等20余家模型厂商发布“百模千态,云聚共赢”生态合作计划。抖音副总李亮回应“豆包误判蘑菇”称AI仅供参考。追觅创始人俞浩内部发文称一季度扫地机器人全球销量销售额双第一,其微博因违规被禁言。理想与蔚来就底盘实测视频论战。英伟达CEO黄仁勋在首尔称已在韩国新建AI技术中心。微软中国Azure被曝裁员,理论最高补偿N+7。
谷歌与 SpaceX 达成云计算合作,自 2026 年 10 月起至 2029 年 6 月,每月向 SpaceX 支付 9.2 亿美元(约 62.46 亿元人民币),租用至少 11 万张英伟达 GPU 及 CPU 等芯片对应的计算能力,用于训练和推理 AI 等高密度场景。该合作既缓解谷歌算力供应紧张与扩容周期压力,也为 SpaceX 的人工智能业务新增重要收入来源,为其 IPO 提供叙事筹码。
美元仍为全球主导货币,但经济学家Ken Rogoff指出债务和地缘政治变化正侵蚀其储备货币地位。AI驱动的搜索减少网页流量,出版商被迫调整吸引受众和创收模式。美中卫星发射竞赛或催生商业航天基础设施热潮。玻利维亚希望利用矿产储备吸引外资,但政治不稳定构成挑战。
针对机器人操作中关节部件感知的准确性与泛化性需求,提出几何主结构(GPS)表示,在可扩展性与质量间取得平衡。GPS结合便携式VR设备,标注单个物体序列仅需一分钟,质量高于基于点跟踪的affordance方法。利用VR-GPS系统收集6个部件类别下234个物体的41K帧数据,训练出以单张RGB-D图像为输入的泛化GPS模型。无需领域内微调,基于GPS预测的启发式策略在9个物体270个初始状态上达到73%成功率。代码、数据和工具已开源。
MuJoCo-Drones-Gym是一个开源多无人机仿真环境,兼容Gymnasium接口,基于MuJoCo物理引擎,支持任意数量Bitcraze Crazyflie 2.x四旋翼。模块化API可选刚体/Python动力学/地面效应、桨叶阻力与下洗流等物理模型,动作接口包括电机转速、归一化推力、速度设定点和PID航点。观测空间含运动学状态、RGB/深度/分割相机图像和邻域信息。内置PettingZoo ParallelEnv支持多智能体强化学习,并提供悬停、速度跟踪、多无人机悬停、航点导航、编队飞行、绕杆竞速、通用多智能体模板七个任务环境。利用MuJoCo改进的接触处理、渲染与并行能力,适用于无人机控制算法开发与强化学习训练。
Robust-U1提出显式视觉自恢复框架,使多模态大语言模型能够修复真实世界噪声破坏的输入图像。方法包含三阶段:监督微调进行初始重建、基于像素级SSIM与语义级CLIP相似度双奖励的强化学习对齐高视觉质量、融合损坏图像与恢复图像的多模态推理。在真实损坏基准上取得最先进鲁棒性,在通用VQA基准上维持对抗性损坏下的优越性能。实验表明高质量视觉恢复直接提升推理能力,自恢复成为鲁棒理解的关键机制。
强化学习与可验证奖励(RLVR)是增强多模态大语言模型视觉推理的主流范式,但现有方法只优化结果,忽略生成中的细粒度跨模态协调。token级分析显示,模型在链式推理中无法动态交替提取视觉证据与合成文本上下文,导致推理失败。为此提出DyCo-RL,将动态跨模态协调融入RLVR优化:利用Fisher-Rao测地距离测量模态内注意力转移,为token分配视觉或文本功能角色,基于实际注意力与角色对齐度进行优势重加权。DyCo-RL在Qwen2.5-VL-3B/7B上应用,一致改进四种代表性RLVR算法,在七个视觉中心与数学推理基准上取得提升。
POISE是一种位置感知的攻击方法,通过将触发指令压缩为单个看似良性的身体指令,并利用上下文感知生成器将其与附近步骤融合,实现对LLM智能体的隐蔽技能注入。在codex+gpt-5.2上的Skill-Inject评估中,POISE达到89.3%的攻击成功率(ASR),比随机位置身体基线高28.0个百分点,比仅YAML注入基线高2.6个百分点,同时保留了身体注入的隐蔽优势。由于LLM扫描器对合法技能身体误判率达74.6%,POISE仅使5.6%的受污染变体触发新的高风险警报,令当前静态防御失效。
大语言模型(LLM)安全评估通常局限于行为层面,难以反映内部鲁棒性。论文形式化“审计差距”——行为安全与干预下鲁棒性之间的差异。通过构建分离模型(保持安全行为但潜在空间脆弱),提出基于干预的评估框架,包括有害微调与逐层潜在扰动,并设计潜在脆弱性得分(LVS)衡量界限扰动下有害行为的可诱导性。在多个安全与未安全对齐的SOTA模型上验证,分离模型在有害干预下LVS显著升高,中间表征对干预最敏感。结论表明仅依赖行为安全评估无法全面刻画模型鲁棒性,需结合表征感知审计。
Light-WAM是面向机器人操作的高效轻量级世界动作模型。它采用紧凑视频骨干,在降采样潜在空间中进行未来视频监督,降低视频协同训练成本。动作预测由StateFusionActionExpert完成,从多个骨干层读取状态并通过学习查询池化融合特征,在单次前向中直接预测动作块,避免重型生成式动作专家。该模型仅0.44B可训练参数,在LIBERO上保持强劲性能,在RoboTwin 2.0上达到可用多任务水平,推理延迟72.03ms,峰值GPU内存4.1GiB,并提升了训练吞吐量。
现有科学关系抽取基准主要面向计算机科学,缺乏心理学等变量导向实证领域的任务。本文提出变量中心实证图抽取任务,将科学摘要映射为以归一化变量为节点、边表示实证与层级关系的类型化图。构建EmpiriGraph-Psy基准,包含210篇经领域标注者标注的心理学摘要。评估表明,分阶段图构建管道(分步进行变量抽取、归一化、层级构建、证据选择、关系抽取和边验证)显著优于直接抽取,最佳配置macro-F1达0.74。错误分析显示,调节关系和概念层级仍是最大难点。
CHIAR-Former 是一种 4 层混合 Transformer,根据每个 token 的谱熵将其路由至 DCT 谱混合或全自注意力(RBF 核混合在消融中被拒绝)。仅含 DCT+注意力的变体在 WikiText-103 上获得 Val PPL 36.54,相比全注意力基线(PPL 66.62)提升 45%,同时减少 62.5% 注意力 FLOPs。在 WikiText-2、IMDB 情感分类和 ListOps 上的评估表明,模型在大规模自然文本中因 token 多样性受益,而全注意力在小数据集和合成任务中仍占优势。
Bayesian-Agent是一个原生跨框架,将可复用的技能和SOP视为关于冻结LLM在特定提示、上下文和环境下能否成功的后验假设。它记录已验证的轨迹证据,维护基于特征条件的分类后验,并将后验状态映射为补丁、拆分、压缩、退役和探索等可检查操作。使用deepseek-v4-flash,该方法使SOP-Bench从80%提升至95%,Lifelong AgentBench从90%提升至100%,RealFin-Bench从45%提升至65%。评估覆盖原生后端及GenericAgent、mini-swe-agent、Claude Code等可选后端,结果包含正、负、饱和及案例研究。源代码已开源。
论文提出一个轻量级基于集合的深度学习框架(Set-Based Transformer),以多个不同远距离辐射测量值为输入,联合估计透射率、大气路径辐射和下行谱。使用稀疏自编码器分析学习到的表示,发现若干潜在特征在测试数据的地理一致子集上激活,尽管训练时未使用位置监督。在 MODTRAN 生成的远距离 LWIR 数据集上,所有估计产品均实现低光谱失真。代码和数据集已公开。
Hacker News 上一条“Ask HN”帖子向用户征集使用生成式人工智能(GenAI)时令人惊呼“天啊”的震撼时刻,该帖于 6 月 5 日发布,获得 105 个点赞。
Elijah Potter 推出了 "Hacker News, Sans AI" 页面,过滤掉 Hacker News 上所有人工智能相关内容,只展示非 AI 的帖子。该页面上线后获得 100 个 HN 点赞。
作者分享了一个用于测试驱动开发(TDD)的Agent技能,该技能在Hacker News上获得100个HN点数,于6月4日发布。
Lowfat是一款可插拔的命令行界面(CLI)过滤器,可在LLM使用场景中节省约91.8%的模型token消耗。项目已开源并托管在GitHub上。
该教程演示如何配置Qualcomm AI Hub Models,运行MobileNet-V2推理与YOLOv7目标检测,并在真实设备上完成模型编译。
开发者用Qwen2.5-3B构建了五人森林生物多智能体经济体,每个智能体独立运行,通过vLLM部署在Modal,以Gradio为交互窗口。3B模型在100%调用中输出有效JSON,但经济判断能力弱。通过设计稀缺性(食物品种限制、易腐坏、冬季燃料危机)和优化提示词(禁止买入自产物品、给出示例)提升决策质量。15轮模拟中,蜜价从10跌至3、柴价从4涨至7、财富基尼系数从0.14扩至0.38。项目展示了小模型可靠格式化与不可靠推理之间的工程填补。
电子签名公司 DocuSign 股价在全年业绩指引未能令投资者满意后随大盘下跌。CEO Allan Thygesen 介绍了公司基于 AI 的智能协议管理平台,目前已有 4 万客户正在使用该平台。
Meta 首席执行官 Mark Zuckerberg 计划建造一座规模庞大的数据中心,路易斯安那州领导人积极争取该项目落户。这笔价值约 2000 亿美元的交易经历了大量谈判和保密过程。Bloomberg 记者 Riley Griffin 向主持人 Sarah Holder 披露了交易内幕。