AIHOT

全部动态资讯 · 9024 条

全部一手资讯 X 论文

6月4日周四

6月3日周三

6月4日

00:15

TechCrunch：AI（RSS）

亚马逊将在搜索结果中展示AI生成的产品图片

亚马逊将利用视觉搜索与AI技术，在用户搜索时生成并展示匹配查询的AI产品图片。该零售商表示，此举旨在帮助引导用户找到对应商品。

产品更新图像生成多模态

00:10

IT之家（RSS）

谷歌 Pixel 11 全系机型官方壁纸抢先看

Mystic Leaks 分享了谷歌 Pixel 11、Pixel 11 Pro、Pixel 11 Pro XL 的官方壁纸，Pixel 11 Pro Fold 的壁纸此前已在 4 月的安卓 17 早期版本中曝光。目前各型号壁纸图片均已公开，详情可见 IT之家报道。

其他

00:10

IT之家（RSS）

美国银行今年招聘近4000名新人，AI正改写实习工作

美国银行今年招聘近4000名暑期实习生和全职校招新人，各占一半，规模与去年持平。约24万人申请不到2000个实习岗位，录取率约0.8%。AI工具让申请更容易，也加剧竞争。美银仍将入门级人才招聘作为战略重点，但实习生需学会用AI完成过去手工的pitch deck和建模等工作，将更多时间投入更高层次任务。美银CEO表示已削减运营岗位，但在关系管理、技术、网络安全等关键领域继续招聘，看重候选人“智识严谨性”和“好奇心”。实习生从培训第一天起就接触AI。

现象/趋势行业动态

00:10

IT之家（RSS）

拼好饭上"岛"、窥屏保护实装：荣耀 Magic8 系列 MagicOS 10.0.0.160 开推

荣耀 Magic8 系列手机今日推送 MagicOS 10.0.0.160 版本升级，系统包约 11.11GB。新版本上线 YOYO AI 创作、AI 窥屏防护（智能识别窥视并触发遮挡）和虚拟权限（应用访问通话记录/联系人/日程仅返回空白）。灵动胶囊新增支持淘宝闪购买药、百度地图驾车导航、大众点评排号及美团拼好饭。桌面新增装饰卡片和闹钟卡片，锁屏小组件新增笔记与录音机，安全输入键盘支持挖孔区避让与圆角适配。离焦视力舒缓新增运动舒缓模式。系统优化相机拍摄、功耗与稳定性，合入安卓 2026 年 5 月安全补丁。

产品更新图像生成

00:08

Hacker News 热门（buzzing.cc 中文翻译）

多伦多大学研究人员演示AI蠕虫可攻击任何联网设备

多伦多大学研究人员展示了一种人工智能蠕虫，能够主动传播并攻击任何联网设备，无需人工干预即可在系统间移动。这项研究揭示了AI驱动自主攻击的潜在威胁。

智能体安全/对齐

00:07

Google Developers Blog（RSS）

在笔记本电脑上运行 Gemma 4 12B：借助 Google AI Edge 解锁本地智能体工作流

Google DeepMind 的 Gemma 4 12B 模型可在 16GB RAM 的普通笔记本上运行，支持本地数据处理与视觉洞察生成。macOS 用户可通过 Google AI Edge Gallery 执行动态 Python 代码与可视化，通过 Google AI Edge Eloquent 实现完全离线的语音听写和文本编辑。另外，LiteRT-LM CLI 新增 serve 命令，可创建行业兼容的本地端点，驱动完全本地的 AI 工具和智能体。

智能体Google产品更新多模态

关联讨论 4 条

00:07

Google Developers Blog（RSS）

精选78

Gemma 4 12B：开发者指南

Gemma 4 12B 是一款密集多模态模型，专为消费级设备上的高性能本地 AI 执行而设计。其采用新颖的无编码器架构，绕过传统视觉和音频编码器，将多模态数据直接输入大语言模型主干。

Google多模态模型发布端侧

关联讨论 4 条

推荐理由：Google 把多模态模型直接塞进消费级设备，靠的不再是缩水而是架构层面的创新。12B 放在本地跑，这次玩法变了。

6月3日

23:51

Bloomberg：Technology（RSS）

达利欧：AI市场泡沫迹象明显，终将破裂

亿万富翁投资者瑞·达利欧（Ray Dalio）表示，当前蓬勃发展的人工智能（AI）市场已显示出泡沫迹象，并预计这种泡沫最终将会破裂。

大佬观点现象/趋势

23:42

HuggingFace Daily Papers（社区热门论文）

KVarN：方差归一化的KV-Cache量化方法可缓解推理任务中的误差累积

KVarN是一种免校准的KV-cache量化方法，通过Hadamard旋转结合双标度方差归一化，同时对K和V矩阵的两个轴进行归一化，以修复异常token尺度误差，大幅减少自回归解码中量化误差随时间步的累积。在2-bit精度下，KVarN在MATH500、AIME24和HumanEval等生成基准上达到新的SOTA。该方法的vLLM实现已在GitHub开源。

arXiv推理论文/研究部署/工程

23:21

Bloomberg：Technology（RSS）

Musk的xAI暂停招聘专业人员训练Grok聊天机器人

Elon Musk旗下xAI暂停招聘用于训练Grok聊天机器人专业技能的专家，此举可能标志着该公司在技术开发方式上的转变。

xAI行业动态

23:15

TechCrunch：AI（RSS）

英国新规要求谷歌提供工具，允许出版商选择退出 AI 搜索

英国监管机构要求谷歌提供一项工具，允许网站出版商选择退出生成式AI搜索功能。该选项将先在英国测试，随后在全球范围内推出。

Google搜索政策/监管

23:15

TechCrunch：AI（RSS）

两位前高盛和Meta创始人打造语音AI，瞄准非洲和中东被忽视的市场

这家由前高盛和Meta创始人创办的语音AI初创公司，专注于非洲和中东市场，其自有技术栈目前已处理日均超过17000通电话。

行业动态语音

23:10

IT之家（RSS）

小米汽车：升级 HyperOS 1.16 版本后，YU7 Pro / Max / 长续航版均搭载 XLA 认知大模型

小米汽车升级 Xiaomi HyperOS 1.16 后，YU7 长续航版、Pro 版、Max 版均搭载小米 XLA 认知大模型，新增语音控车 Beta 和商场地库车位级领航功能。YU7 GT 可通过舒适模式或经济模式调节驾驶体验，前者动力平顺、悬架滤震，后者前电机脱开、后驱行驶以延长续航；晕车舒缓模式则优化动力、制动和能量回收，降低晕车发生率。后续将不断解锁更多新体验。

产品更新端侧

23:10

IT之家（RSS）

京东开源 JoyAI-Echo 长音视频生成框架，支持对话式编辑与 5 分钟角色一致

京东发布并开源 JoyAI-Echo 长音视频生成框架。其内置记忆库可在长达 5 分钟的视频中保持角色身份、视觉形象和声音音色高度一致。框架采用记忆驱动后训练流程，结合 SFT、跨模态 RLHF 与 Distribution Matching Distillation（DMD）技术，DMD 带来约 7.5 倍推理速度提升。JoyAI-Echo 还引入 Director Agent，支持自然语言需求自动拆分为剧本、角色、场景和镜头，实现对话式编辑。配套实时超分模块支持 736×1280 → 1152×1920 及 736×1280 → 1472×2560 两档分辨率提升。京东称该项目标志着其在长视频生成领域进入全球第一梯队。

多模态开源/仓库

23:10

IT之家（RSS）

双 2.5G 网口：高通骁龙 8cx Gen3 迷你主板瑞莎 Dragon Q8B 亮相，104 美元起

瑞莎在深圳开发者活动日展出 Dragon Q8B 迷你主板，搭载 5nm 骁龙 8cx Gen3（SC8280XP），八核 Kryo CPU 最高 3.0 GHz，Adreno 690 GPU，AI 算力最高 29 TOPS，支持最高 32GB LPDDR4X 内存。板型 100mm×75mm，配备双 2.5GbE 网口、双 M.2 2280 NVMe 插槽（PCIe 3.0 x4+x2）、UFS 3.1、双 USB-C（DP 1.4b）、双 USB-A 3.2、HDMI 2.1、40 针 GPIO 等。4GB 版定价 149 美元，首发优惠 45 美元（约 104 美元），7 月 31 日上市。同期展出更小的 Dragon Q5E（QCS6690，6 TOPS）及两款与飞牛合作的高通平台 NAS（6 盘位全闪存、4 盘位）。

产品更新端侧

23:10

IT之家（RSS）

精选86

谷歌：Gemini App 月活超 9 亿同比翻倍，是其增长最快的产品之一

谷歌母公司 Alphabet 公布投资者演示文稿显示，Gemini App 月活跃用户超 9 亿，一年内翻倍超过一倍。Gemini 已为谷歌 13 款超 10 亿用户产品提供支持，其中 5 款用户量超 30 亿（搜索、Gmail、Android、Chrome、YouTube）。谷歌搜索 AI Overviews 月活跃用户超 25 亿。自 Gemini 3 推出，核心 AI 响应成本降低 30% 以上。谷歌预计本月推出 Gemini 3.5 Pro 模型。

Google搜索行业动态

关联讨论 1 条

推荐理由：9亿月活且一年翻倍，AI Overviews月活25亿，这些数字比任何benchmark都更能说明问题。谷歌本月还要推Gemini 3.5 Pro，进度比预期快，做搜索和产品的需要盯紧。

22:42

HuggingFace Daily Papers（社区热门论文）

ByG：无需配对数据的流匹配图像/视频编辑框架

提出 Bootstrap Your Generator (ByG) 框架，用于非配对训练流匹配图像/视频编辑模型。方法从冻结的基础模型中提取指令遵循线索，结合循环一致性保持结构；通过梯度路由将下游损失反向传播到噪声训练状态，弥合训练-推理差距。在数据稀缺的图像和视频编辑任务上达到 SOTA，泛化到未见领域，性能优于用百万级配对样本训练的监督基线。实验表明，从基础模型提取的语义线索提供了稳健的训练信号，无需外部奖励模型。

arXiv图像生成视频论文/研究

22:42

HuggingFace Daily Papers（社区热门论文）

AURA：面向机器人策略的恒定VRAM动作门控记忆

AURA-Mem是一种恒定大小的递归记忆机制，专为机器人策略设计。它包装了一个冻结的视觉-语言-动作主干（7B参数），通过学习门控仅在当前观测会改变下一步动作时写入记忆。推理状态固定为4,224字节，而KV-cache在100,000步时大6,061倍。在LIBERO-Long上，门控策略未降低成功率（0.233），略优于始终写入的KV臂（0.217），同时写入次数减少7.0倍。在合成基准上，AURA-Mem匹配最佳O(1)基线精度，写入次数减少5.19–6.13倍，而随机或周期调度无法复现该增益。

具身智能论文/研究

22:41

Hugging Face：Blog（RSS）

为 Reachy Mini 添加 MCP 工具

Reachy Mini 对话应用现在可通过 MCP 协议添加远程工具。执行 `reachy-mini-conversation-app tool-spaces add` 命令即可从 Hugging Face Spaces 安装远程工具（如搜索、天气），并自动启用至当前 profile 的 tools.txt 中。内置工具（头部动作、跳舞、表情、摄像头等）仍为本地 Python 代码，远程工具则通过 MCP 端点调用。profiles 通过 tools.txt 控制哪些工具可用，不在文件中的工具模型无法调用。用户也可编写自定义本地工具。远程工具适合无状态能力，便于发布、共享和迭代，无需修改应用本身。支持 install、list、remove 等子命令。

Hugging FaceMCP/工具产品更新具身智能

22:37

Hacker News 热门（buzzing.cc 中文翻译）

PlayStation 架构

本文来自 www.copetti.org，标题为“PlayStation Architecture”，是一篇介绍 PlayStation 游戏主机硬件架构的技术文章，并附有架构图。该文章于 2026 年 6 月 3 日在 Hacker News 上获得 100 个点赞，由 buzzing.cc 提供中文翻译版本。

其他

22:21

Bloomberg：Technology（RSS）

彭博财富：Centerbridge 联合创始人 Jeff Aronson 谈私人信贷与 AI 投资

Centerbridge 联合创始人 Jeff Aronson 表示，私人信贷对美国经济不构成系统性风险。他认为 AI 正在重塑投资领域，但不会取代人类判断。Aronson 回顾了自己从律师转型为不良债务投资者、并于 2005 年创立 Centerbridge 的经历。该采访于 4 月 21 日在纽约录制，是彭博财富第六季首集。

现象/趋势行业动态

22:21

Bloomberg：Technology（RSS）

Alphabet 增发规模扩大至 847.5 亿美元用于 AI 支出

Alphabet Inc. 将股权融资规模从两天前公布的 800 亿美元提高至 847.5 亿美元，以资助不断增长的人工智能支出计划。

Google行业动态

22:16

The Verge：AI（RSS）

微软与OpenAI分手--如今他们准备开战

在年度Build大会上，微软宣布了一系列AI新举措，包括超级应用、自研推理模型、网络安全工具和OpenClaw风格的AI智能体。该公司此前长期依赖与OpenAI的独家合作，但这段充满戏剧性的关系已在4月底实质上破裂（微软仍保留OpenAI主要云合作伙伴身份）。微软正以独立姿态成为AI领域的重要玩家。

智能体Microsoft产品更新推理

22:09

IT之家（RSS）

精选73

月之暗面 Kimi Work Beta 版开启内测：面向知识工作者的通用型本地 Agent

月之暗面今日宣布，Kimi Work Beta 版随最新版 Mac 和 Windows 客户端开启内测。Kimi Work 是基于 Kimi Code 的通用型本地 Agent，支持安装使用技能、运行定时任务，并继承在线版的专业技能与数据库，内置可调用浏览器的 Kimi WebBridge。用户用自然语言描述目标即可自动拆解任务、并行执行并交付产物。支持 Agent 集群，最高可创建含 300 个子 Agent 的团队。官方透露，Kimi Work 自身由 Kimi Code 写成，工程师一周内完成客户端开发，累计产出超 5 万行有效代码，其中 92% 由 AI 自主生成。

智能体产品更新端侧编码

关联讨论 4 条

推荐理由：月之暗面把AI Agent搬到了本地，不是聊天窗口，而是直接操控你的电脑。92%的代码由AI自己写的自举能力，比功能本身更吓人。做办公自动化的同行该看看怎么被卷了。

22:09

IT之家（RSS）

华为联合天津港发布新一代港口智能水平运输系统解决方案，可适配全球绝大多数传统集装箱码头

华为联合天津港发布新一代港口智能水平运输系统解决方案，围绕“感、联、算、控”四大核心能力，融合多维感知、混行动态路径规划、虚拟红绿灯智能管控、AI全域交通态势研判等技术，实现ART（人工智能运输机器人）与人工集卡安全高效混行作业。该方案无需大规模土建改造，可适配全球绝大多数传统集装箱码头。截至目前，华为已服务全球100多个港口。

产品更新具身智能

22:09

IT之家（RSS）

摩根士丹利将向外部 AI 智能体开放万亿美元资管业务接口

摩根士丹利将向外部 AI 智能体开放其关键财富管理渠道。客户部署的 AI 智能体可直接从股权管理平台 ShareWorks 和 Equity Edge 提取数据，绕过传统人类界面。该公司已归集 1.2 万亿美元受托资产。摩根士丹利已向少数客户授予早期访问权限，计划明年覆盖其 3,400 家托管客户。竞争对手摩根大通和高盛已在内部使用 AI 智能体，但尚未对外开放。

智能体行业动态部署/工程

22:09

IT之家（RSS）

谷歌母公司 Alphabet 宣布将股权融资规模增至 847.5 亿美元

Alphabet 将股权融资规模从 800 亿美元增至 847.5 亿美元，用于投资 AI 基础设施与算力。其中 A 类普通股和 C 类资本股发行增至 180 亿美元，存托股份发行增至 167.5 亿美元；伯克希尔·哈撒韦以私募形式投资 100 亿美元。发行预计 2026 年 6 月初完成。

数据/训练行业动态

22:09

IT之家（RSS）

上海海思一站式集成开发环境 HiSpark Studio 开源

上海海思 HiSpark Studio 正式在 GitCode 平台开源。该 IDE 基于 VS Code 扩展架构，集成工程管理、代码编辑、编译构建、烧录调试、图形化配置等全链路开发能力，支持智能设备、星闪（NearLink）、嵌入式 AI 开发。核心亮点包括 SDK 一键下载、一键编译与烧录、GDB 调试、图形化工具集（图片解压缩、视频首帧提取、3D 建模、蒙版工具）、系统配置工具、AI 模型处理（量化压缩、格式转换、一键部署验证）及远程开发模式。

开源/仓库端侧

22:09

IT之家（RSS）

欧盟提出"技术主权"一揽子方案，强调"数字自主性"与"韧性"

欧盟委员会6月3日公布“欧洲技术主权一揽子方案”，涵盖《云与人工智能发展法案》《芯片法案2.0》、“开源战略”和“能源领域数字化与人工智能战略路线图”。《云与人工智能发展法案》目标在未来5至7年内将欧洲数据中心容量提高3倍；《芯片法案2.0》旨在基于欧洲芯片优势建设尖端半导体能力。但“数字欧洲”组织认为，“含欧量”要求可能割裂供应链，削弱竞争力。

开源生态政策/监管

22:09

IT之家（RSS）

由华为牵头制定，欧洲电信标准化协会发布首个面向 AI 计算平台安全要求的国际标准

2026年5月，ETSI发布由华为牵头制定的ETSI TS 104 033，系ETSI首个面向AI计算平台安全要求的国际标准。该标准2023年11月由华为在ETSI SAI会议牵头立项，获英国电信、高通、贝尔法斯特女王大学、博世、德国BSI支持。标准要求缓解AI计算平台安全风险，华为昇腾安全解决方案据此覆盖从数据中心Atlas SuperPoD到边缘推理设备。

安全/对齐行业动态

22:07

Hacker News 热门（buzzing.cc 中文翻译）

每个字节都至关重要

文章标题为《Every Byte Matters》，来自 fzakaria.com，讨论字节级优化的重要性。

其他

22:07

The Verge：订阅版科技（RSS）

精选82

微软与OpenAI分道扬镳--如今双方准备正面交锋

微软与OpenAI的合作关系已彻底破裂，双方进入正面竞争态势。前DeepMind高管、现任微软AI主管Mustafa Suleyman明确表示，微软现在必须从头证明自己能独立完成所有必需的任务。这标志着两家科技巨头从紧密合作伙伴转变为直接竞争对手。

MicrosoftOpenAI行业动态

推荐理由：微软和OpenAI正式分手，Mustafa Suleyman放话要从头自研。这对整个AI生态的重构不亚于当年谷歌收购DeepMind，开发者选边站的压力一下子变真实了。

21:51

Bloomberg：Technology（RSS）

Meta 首次向企业销售 AI 智能体，推动服务变现

Meta Platforms Inc. 首次向企业销售AI智能体，这是该公司为抵消巨额AI投资而寻求创收的最新举措。

智能体Meta产品更新

21:51

Ars Technica：AI（RSS）

Meta 追赶 AI 竞争对手的努力

外界对 Meta 能否缩小与 AI 竞争对手的差距仍存疑虑。

Meta开源生态现象/趋势

21:46

The Decoder：AI News（RSS）

Perplexity 宣布推出混合 AI 系统，自动决定任务在本地还是云端运行

Perplexity 发布了一个编排器，将本地计算机上的 AI 模型与云端强大模型相结合，并自动决定每个任务分配至本地处理还是云端处理。

产品更新推理部署/工程

21:45

TechCrunch：AI（RSS）

精选72

Meta 面向 WhatsApp Business 的 AI 智能体现已全球上线

Meta 为 WhatsApp Business 打造的 AI 智能体面向全球商家开放，将按照模型 token 使用量向企业收费。

智能体Meta产品更新

推荐理由：WhatsApp把AI agent推到全球小商家，按token计费，这可能是AI客服真正普及的节点，比对话框里的产品更有落地感。

21:41

Hugging Face：Blog（RSS）

精选55

DharmaOCR 利用 DPO 将文本退化率降低 59.4%

4月发布的DharmaOCR（结构化OCR模型）在巴西葡萄牙语文档提取任务中，使用直接偏好优化（DPO）作为监督微调（SFT）后的第二训练阶段。SFT无法直接惩罚文本退化（重复循环），而DPO以模型自身失败输出（退化循环）作为负样本进行偏好训练，使所有测试模型族的文本退化率平均降低59.4%，最高达87.6%（如Nanonets-OCR2-3B从1.61%降至0.20%）。传统DPO多用于聊天对齐，该工作将其扩展至客观的OCR任务，证明DPO可针对性修复特定失败模式。

Hugging Face教程/实践数据/训练

推荐理由：DPO 不只能对齐，这篇直接用模型自身的垃圾输出当反例，把 OCR 的重复错误平均降了 59%。思路不复杂，但告诉做结构化生成的工程师：训练数据里最该保留的就是模型犯的错。

21:37

Tomer Tunguz 博客（VC 分析）

精选66

智能性价比

微软在模型发布卡中首次加入平均token使用量指标。其模型在SWE-Bench Verified上达71.6分，仅消耗约Claude Haiku 4.5三分之一的token。Artificial Analysis的Intelligence Index显示GPT 5.5与Claude Opus 4.8得分相近（约60分），但Opus 4.8运行成本高出40%（$4,685 vs $3,357）。Uber因四个月内AI预算超支而限制员工使用；Salesforce花费$3亿购买Anthropic tokens并冻结工程招聘。模型公司如今需同时在性能和成本两个维度竞争。

MicrosoftOpenAI推理现象/趋势

推荐理由：微软在模型发布卡上悄悄加了“平均token消耗”这个指标，这不是小改动，而是宣告AI从堆算力转向算账时代。Uber和Salesforce的预算教训已经很清楚了。

21:34

Google Blog：AI（RSS）

Google Search 提升二手和复古购物体验的5种方式

Google Search 和 Google Shopping 中的 AI 工具帮助用户在二手和复古购物中发现好物。

Google搜索教程/实践

21:30

Anthropic：Newsroom（网页）

精选59

介绍 Claude Partner Network 的 Services Track 和 Partner Hub

Anthropic 扩展 Claude Partner Network，推出 Services Track 分级体系和 Partner Hub 门户。Services Track 设 Select、Preferred、Global Premier 三级，按认证人数、投产客户数及客户推荐信量化评定。Partner Hub 提供每日更新仪表盘和公开目录，方便合作伙伴查看进展、客户寻找供应商。该网络三月启动以来已有超 4 万家公司申请，逾 1 万顾问获认证；Accenture 训练 3 万人，Cognizant 部署约 35 万员工，Deloitte 惠及 47 万人，KPMG 覆盖 27.6 万，Infosys 构建行业智能体，PwC 先在美推广再扩至全球。

Anthropic产品更新行业动态部署/工程

推荐理由：Anthropic 给合作伙伴画了一条明确的爬升阶梯，从 Select 到 Global Premier，企业客户终于有个公开透明的渠道找靠谱的实施团队，做 AI 咨询的可以认真评估入局了。