AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
精选全部日报更多
全部动态资讯 · 9024 条
全部一手资讯X论文
6月4日周四
6月3日周三
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月4日
00:15
TechCrunch:AI(RSS)
47
亚马逊将在搜索结果中展示AI生成的产品图片

亚马逊将利用视觉搜索与AI技术,在用户搜索时生成并展示匹配查询的AI产品图片。该零售商表示,此举旨在帮助引导用户找到对应商品。

产品更新图像生成多模态
00:10
IT之家(RSS)
15
谷歌 Pixel 11 全系机型官方壁纸抢先看

Mystic Leaks 分享了谷歌 Pixel 11、Pixel 11 Pro、Pixel 11 Pro XL 的官方壁纸,Pixel 11 Pro Fold 的壁纸此前已在 4 月的安卓 17 早期版本中曝光。目前各型号壁纸图片均已公开,详情可见 IT之家报道。

其他
00:10
IT之家(RSS)
54
美国银行今年招聘近4000名新人,AI正改写实习工作

美国银行今年招聘近4000名暑期实习生和全职校招新人,各占一半,规模与去年持平。约24万人申请不到2000个实习岗位,录取率约0.8%。AI工具让申请更容易,也加剧竞争。美银仍将入门级人才招聘作为战略重点,但实习生需学会用AI完成过去手工的pitch deck和建模等工作,将更多时间投入更高层次任务。美银CEO表示已削减运营岗位,但在关系管理、技术、网络安全等关键领域继续招聘,看重候选人“智识严谨性”和“好奇心”。实习生从培训第一天起就接触AI。

现象/趋势行业动态
00:10
IT之家(RSS)
23
拼好饭上"岛"、窥屏保护实装:荣耀 Magic8 系列 MagicOS 10.0.0.160 开推

荣耀 Magic8 系列手机今日推送 MagicOS 10.0.0.160 版本升级,系统包约 11.11GB。新版本上线 YOYO AI 创作、AI 窥屏防护(智能识别窥视并触发遮挡)和虚拟权限(应用访问通话记录/联系人/日程仅返回空白)。灵动胶囊新增支持淘宝闪购买药、百度地图驾车导航、大众点评排号及美团拼好饭。桌面新增装饰卡片和闹钟卡片,锁屏小组件新增笔记与录音机,安全输入键盘支持挖孔区避让与圆角适配。离焦视力舒缓新增运动舒缓模式。系统优化相机拍摄、功耗与稳定性,合入安卓 2026 年 5 月安全补丁。

产品更新图像生成
00:08
Hacker News 热门(buzzing.cc 中文翻译)
63
多伦多大学研究人员演示AI蠕虫可攻击任何联网设备

多伦多大学研究人员展示了一种人工智能蠕虫,能够主动传播并攻击任何联网设备,无需人工干预即可在系统间移动。这项研究揭示了AI驱动自主攻击的潜在威胁。

智能体安全/对齐
00:07
Google Developers Blog(RSS)
75
在笔记本电脑上运行 Gemma 4 12B:借助 Google AI Edge 解锁本地智能体工作流

Google DeepMind 的 Gemma 4 12B 模型可在 16GB RAM 的普通笔记本上运行,支持本地数据处理与视觉洞察生成。macOS 用户可通过 Google AI Edge Gallery 执行动态 Python 代码与可视化,通过 Google AI Edge Eloquent 实现完全离线的语音听写和文本编辑。另外,LiteRT-LM CLI 新增 serve 命令,可创建行业兼容的本地端点,驱动完全本地的 AI 工具和智能体。

智能体Google产品更新多模态
关联讨论 4 条The Decoder:AI News(RSS)X:Google AI for Developers (@googleaidevs)Hacker News 热门(buzzing.cc 中文翻译)X:Jeff Dean (@JeffDean)
00:07
Google Developers Blog(RSS)
精选78
Gemma 4 12B:开发者指南

Gemma 4 12B 是一款密集多模态模型,专为消费级设备上的高性能本地 AI 执行而设计。其采用新颖的无编码器架构,绕过传统视觉和音频编码器,将多模态数据直接输入大语言模型主干。

Google多模态模型发布端侧
关联讨论 4 条The Decoder:AI News(RSS)X:Google AI for Developers (@googleaidevs)Hacker News 热门(buzzing.cc 中文翻译)X:Jeff Dean (@JeffDean)
推荐理由:Google 把多模态模型直接塞进消费级设备,靠的不再是缩水而是架构层面的创新。12B 放在本地跑,这次玩法变了。
6月3日
23:51
Bloomberg:Technology(RSS)
48
达利欧:AI市场泡沫迹象明显,终将破裂

亿万富翁投资者瑞·达利欧(Ray Dalio)表示,当前蓬勃发展的人工智能(AI)市场已显示出泡沫迹象,并预计这种泡沫最终将会破裂。

大佬观点现象/趋势
23:42
HuggingFace Daily Papers(社区热门论文)
68
KVarN:方差归一化的KV-Cache量化方法可缓解推理任务中的误差累积

KVarN是一种免校准的KV-cache量化方法,通过Hadamard旋转结合双标度方差归一化,同时对K和V矩阵的两个轴进行归一化,以修复异常token尺度误差,大幅减少自回归解码中量化误差随时间步的累积。在2-bit精度下,KVarN在MATH500、AIME24和HumanEval等生成基准上达到新的SOTA。该方法的vLLM实现已在GitHub开源。

arXiv推理论文/研究部署/工程
23:21
Bloomberg:Technology(RSS)
58
Musk的xAI暂停招聘专业人员训练Grok聊天机器人

Elon Musk旗下xAI暂停招聘用于训练Grok聊天机器人专业技能的专家,此举可能标志着该公司在技术开发方式上的转变。

xAI行业动态
23:15
TechCrunch:AI(RSS)
67
英国新规要求谷歌提供工具,允许出版商选择退出 AI 搜索

英国监管机构要求谷歌提供一项工具,允许网站出版商选择退出生成式AI搜索功能。该选项将先在英国测试,随后在全球范围内推出。

Google搜索政策/监管
23:15
TechCrunch:AI(RSS)
43
两位前高盛和Meta创始人打造语音AI,瞄准非洲和中东被忽视的市场

这家由前高盛和Meta创始人创办的语音AI初创公司,专注于非洲和中东市场,其自有技术栈目前已处理日均超过17000通电话。

行业动态语音
23:10
IT之家(RSS)
54
小米汽车:升级 HyperOS 1.16 版本后,YU7 Pro / Max / 长续航版均搭载 XLA 认知大模型

小米汽车升级 Xiaomi HyperOS 1.16 后,YU7 长续航版、Pro 版、Max 版均搭载小米 XLA 认知大模型,新增语音控车 Beta 和商场地库车位级领航功能。YU7 GT 可通过舒适模式或经济模式调节驾驶体验,前者动力平顺、悬架滤震,后者前电机脱开、后驱行驶以延长续航;晕车舒缓模式则优化动力、制动和能量回收,降低晕车发生率。后续将不断解锁更多新体验。

产品更新端侧
23:10
IT之家(RSS)
67
京东开源 JoyAI-Echo 长音视频生成框架,支持对话式编辑与 5 分钟角色一致

京东发布并开源 JoyAI-Echo 长音视频生成框架。其内置记忆库可在长达 5 分钟的视频中保持角色身份、视觉形象和声音音色高度一致。框架采用记忆驱动后训练流程,结合 SFT、跨模态 RLHF 与 Distribution Matching Distillation(DMD)技术,DMD 带来约 7.5 倍推理速度提升。JoyAI-Echo 还引入 Director Agent,支持自然语言需求自动拆分为剧本、角色、场景和镜头,实现对话式编辑。配套实时超分模块支持 736×1280 → 1152×1920 及 736×1280 → 1472×2560 两档分辨率提升。京东称该项目标志着其在长视频生成领域进入全球第一梯队。

多模态开源/仓库
23:10
IT之家(RSS)
32
双 2.5G 网口:高通骁龙 8cx Gen3 迷你主板瑞莎 Dragon Q8B 亮相,104 美元起

瑞莎在深圳开发者活动日展出 Dragon Q8B 迷你主板,搭载 5nm 骁龙 8cx Gen3(SC8280XP),八核 Kryo CPU 最高 3.0 GHz,Adreno 690 GPU,AI 算力最高 29 TOPS,支持最高 32GB LPDDR4X 内存。板型 100mm×75mm,配备双 2.5GbE 网口、双 M.2 2280 NVMe 插槽(PCIe 3.0 x4+x2)、UFS 3.1、双 USB-C(DP 1.4b)、双 USB-A 3.2、HDMI 2.1、40 针 GPIO 等。4GB 版定价 149 美元,首发优惠 45 美元(约 104 美元),7 月 31 日上市。同期展出更小的 Dragon Q5E(QCS6690,6 TOPS)及两款与飞牛合作的高通平台 NAS(6 盘位全闪存、4 盘位)。

产品更新端侧
23:10
IT之家(RSS)
精选86
谷歌:Gemini App 月活超 9 亿同比翻倍,是其增长最快的产品之一

谷歌母公司 Alphabet 公布投资者演示文稿显示,Gemini App 月活跃用户超 9 亿,一年内翻倍超过一倍。Gemini 已为谷歌 13 款超 10 亿用户产品提供支持,其中 5 款用户量超 30 亿(搜索、Gmail、Android、Chrome、YouTube)。谷歌搜索 AI Overviews 月活跃用户超 25 亿。自 Gemini 3 推出,核心 AI 响应成本降低 30% 以上。谷歌预计本月推出 Gemini 3.5 Pro 模型。

Google搜索行业动态
关联讨论 1 条X:Gemini (@GeminiApp)
推荐理由:9亿月活且一年翻倍,AI Overviews月活25亿,这些数字比任何benchmark都更能说明问题。谷歌本月还要推Gemini 3.5 Pro,进度比预期快,做搜索和产品的需要盯紧。
22:42
HuggingFace Daily Papers(社区热门论文)
60
ByG:无需配对数据的流匹配图像/视频编辑框架

提出 Bootstrap Your Generator (ByG) 框架,用于非配对训练流匹配图像/视频编辑模型。方法从冻结的基础模型中提取指令遵循线索,结合循环一致性保持结构;通过梯度路由将下游损失反向传播到噪声训练状态,弥合训练-推理差距。在数据稀缺的图像和视频编辑任务上达到 SOTA,泛化到未见领域,性能优于用百万级配对样本训练的监督基线。实验表明,从基础模型提取的语义线索提供了稳健的训练信号,无需外部奖励模型。

arXiv图像生成视频论文/研究
22:42
HuggingFace Daily Papers(社区热门论文)
61
AURA:面向机器人策略的恒定VRAM动作门控记忆

AURA-Mem是一种恒定大小的递归记忆机制,专为机器人策略设计。它包装了一个冻结的视觉-语言-动作主干(7B参数),通过学习门控仅在当前观测会改变下一步动作时写入记忆。推理状态固定为4,224字节,而KV-cache在100,000步时大6,061倍。在LIBERO-Long上,门控策略未降低成功率(0.233),略优于始终写入的KV臂(0.217),同时写入次数减少7.0倍。在合成基准上,AURA-Mem匹配最佳O(1)基线精度,写入次数减少5.19–6.13倍,而随机或周期调度无法复现该增益。

具身智能论文/研究
22:41
Hugging Face:Blog(RSS)
46
为 Reachy Mini 添加 MCP 工具

Reachy Mini 对话应用现在可通过 MCP 协议添加远程工具。执行 `reachy-mini-conversation-app tool-spaces add` 命令即可从 Hugging Face Spaces 安装远程工具(如搜索、天气),并自动启用至当前 profile 的 tools.txt 中。内置工具(头部动作、跳舞、表情、摄像头等)仍为本地 Python 代码,远程工具则通过 MCP 端点调用。profiles 通过 tools.txt 控制哪些工具可用,不在文件中的工具模型无法调用。用户也可编写自定义本地工具。远程工具适合无状态能力,便于发布、共享和迭代,无需修改应用本身。支持 install、list、remove 等子命令。

Hugging FaceMCP/工具产品更新具身智能
22:37
Hacker News 热门(buzzing.cc 中文翻译)
29
PlayStation 架构

本文来自 www.copetti.org,标题为“PlayStation Architecture”,是一篇介绍 PlayStation 游戏主机硬件架构的技术文章,并附有架构图。该文章于 2026 年 6 月 3 日在 Hacker News 上获得 100 个点赞,由 buzzing.cc 提供中文翻译版本。

其他
22:21
Bloomberg:Technology(RSS)
53
彭博财富:Centerbridge 联合创始人 Jeff Aronson 谈私人信贷与 AI 投资

Centerbridge 联合创始人 Jeff Aronson 表示,私人信贷对美国经济不构成系统性风险。他认为 AI 正在重塑投资领域,但不会取代人类判断。Aronson 回顾了自己从律师转型为不良债务投资者、并于 2005 年创立 Centerbridge 的经历。该采访于 4 月 21 日在纽约录制,是彭博财富第六季首集。

现象/趋势行业动态
22:21
Bloomberg:Technology(RSS)
66
Alphabet 增发规模扩大至 847.5 亿美元用于 AI 支出

Alphabet Inc. 将股权融资规模从两天前公布的 800 亿美元提高至 847.5 亿美元,以资助不断增长的人工智能支出计划。

Google行业动态
22:16
The Verge:AI(RSS)
67
微软与OpenAI分手--如今他们准备开战

在年度Build大会上,微软宣布了一系列AI新举措,包括超级应用、自研推理模型、网络安全工具和OpenClaw风格的AI智能体。该公司此前长期依赖与OpenAI的独家合作,但这段充满戏剧性的关系已在4月底实质上破裂(微软仍保留OpenAI主要云合作伙伴身份)。微软正以独立姿态成为AI领域的重要玩家。

智能体Microsoft产品更新推理
22:09
IT之家(RSS)
精选73
月之暗面 Kimi Work Beta 版开启内测:面向知识工作者的通用型本地 Agent

月之暗面今日宣布,Kimi Work Beta 版随最新版 Mac 和 Windows 客户端开启内测。Kimi Work 是基于 Kimi Code 的通用型本地 Agent,支持安装使用技能、运行定时任务,并继承在线版的专业技能与数据库,内置可调用浏览器的 Kimi WebBridge。用户用自然语言描述目标即可自动拆解任务、并行执行并交付产物。支持 Agent 集群,最高可创建含 300 个子 Agent 的团队。官方透露,Kimi Work 自身由 Kimi Code 写成,工程师一周内完成客户端开发,累计产出超 5 万行有效代码,其中 92% 由 AI 自主生成。

智能体产品更新端侧编码
关联讨论 4 条X:Testing Catalog (@testingcatalog)X:Kimi.ai (@Kimi_Moonshot)X:邵猛 (@shao__meng)X:Berry Xia (@berryxia)
推荐理由:月之暗面把AI Agent搬到了本地,不是聊天窗口,而是直接操控你的电脑。92%的代码由AI自己写的自举能力,比功能本身更吓人。做办公自动化的同行该看看怎么被卷了。
22:09
IT之家(RSS)
48
华为联合天津港发布新一代港口智能水平运输系统解决方案,可适配全球绝大多数传统集装箱码头

华为联合天津港发布新一代港口智能水平运输系统解决方案,围绕“感、联、算、控”四大核心能力,融合多维感知、混行动态路径规划、虚拟红绿灯智能管控、AI全域交通态势研判等技术,实现ART(人工智能运输机器人)与人工集卡安全高效混行作业。该方案无需大规模土建改造,可适配全球绝大多数传统集装箱码头。截至目前,华为已服务全球100多个港口。

产品更新具身智能
22:09
IT之家(RSS)
65
摩根士丹利将向外部 AI 智能体开放万亿美元资管业务接口

摩根士丹利将向外部 AI 智能体开放其关键财富管理渠道。客户部署的 AI 智能体可直接从股权管理平台 ShareWorks 和 Equity Edge 提取数据,绕过传统人类界面。该公司已归集 1.2 万亿美元受托资产。摩根士丹利已向少数客户授予早期访问权限,计划明年覆盖其 3,400 家托管客户。竞争对手摩根大通和高盛已在内部使用 AI 智能体,但尚未对外开放。

智能体行业动态部署/工程
22:09
IT之家(RSS)
68
谷歌母公司 Alphabet 宣布将股权融资规模增至 847.5 亿美元

Alphabet 将股权融资规模从 800 亿美元增至 847.5 亿美元,用于投资 AI 基础设施与算力。其中 A 类普通股和 C 类资本股发行增至 180 亿美元,存托股份发行增至 167.5 亿美元;伯克希尔·哈撒韦以私募形式投资 100 亿美元。发行预计 2026 年 6 月初完成。

数据/训练行业动态
22:09
IT之家(RSS)
47
上海海思一站式集成开发环境 HiSpark Studio 开源

上海海思 HiSpark Studio 正式在 GitCode 平台开源。该 IDE 基于 VS Code 扩展架构,集成工程管理、代码编辑、编译构建、烧录调试、图形化配置等全链路开发能力,支持智能设备、星闪(NearLink)、嵌入式 AI 开发。核心亮点包括 SDK 一键下载、一键编译与烧录、GDB 调试、图形化工具集(图片解压缩、视频首帧提取、3D 建模、蒙版工具)、系统配置工具、AI 模型处理(量化压缩、格式转换、一键部署验证)及远程开发模式。

开源/仓库端侧
22:09
IT之家(RSS)
69
欧盟提出"技术主权"一揽子方案,强调"数字自主性"与"韧性"

欧盟委员会6月3日公布“欧洲技术主权一揽子方案”,涵盖《云与人工智能发展法案》《芯片法案2.0》、“开源战略”和“能源领域数字化与人工智能战略路线图”。《云与人工智能发展法案》目标在未来5至7年内将欧洲数据中心容量提高3倍;《芯片法案2.0》旨在基于欧洲芯片优势建设尖端半导体能力。但“数字欧洲”组织认为,“含欧量”要求可能割裂供应链,削弱竞争力。

开源生态政策/监管
22:09
IT之家(RSS)
60
由华为牵头制定,欧洲电信标准化协会发布首个面向 AI 计算平台安全要求的国际标准

2026年5月,ETSI发布由华为牵头制定的ETSI TS 104 033,系ETSI首个面向AI计算平台安全要求的国际标准。该标准2023年11月由华为在ETSI SAI会议牵头立项,获英国电信、高通、贝尔法斯特女王大学、博世、德国BSI支持。标准要求缓解AI计算平台安全风险,华为昇腾安全解决方案据此覆盖从数据中心Atlas SuperPoD到边缘推理设备。

安全/对齐行业动态
22:07
Hacker News 热门(buzzing.cc 中文翻译)
22
每个字节都至关重要

文章标题为《Every Byte Matters》,来自 fzakaria.com,讨论字节级优化的重要性。

其他
22:07
The Verge:订阅版科技(RSS)
精选82
微软与OpenAI分道扬镳--如今双方准备正面交锋

微软与OpenAI的合作关系已彻底破裂,双方进入正面竞争态势。前DeepMind高管、现任微软AI主管Mustafa Suleyman明确表示,微软现在必须从头证明自己能独立完成所有必需的任务。这标志着两家科技巨头从紧密合作伙伴转变为直接竞争对手。

MicrosoftOpenAI行业动态

推荐理由:微软和OpenAI正式分手,Mustafa Suleyman放话要从头自研。这对整个AI生态的重构不亚于当年谷歌收购DeepMind,开发者选边站的压力一下子变真实了。
21:51
Bloomberg:Technology(RSS)
66
Meta 首次向企业销售 AI 智能体,推动服务变现

Meta Platforms Inc. 首次向企业销售AI智能体,这是该公司为抵消巨额AI投资而寻求创收的最新举措。

智能体Meta产品更新
21:51
Ars Technica:AI(RSS)
56
Meta 追赶 AI 竞争对手的努力

外界对 Meta 能否缩小与 AI 竞争对手的差距仍存疑虑。

Meta开源生态现象/趋势
21:46
The Decoder:AI News(RSS)
61
Perplexity 宣布推出混合 AI 系统,自动决定任务在本地还是云端运行

Perplexity 发布了一个编排器,将本地计算机上的 AI 模型与云端强大模型相结合,并自动决定每个任务分配至本地处理还是云端处理。

产品更新推理部署/工程
21:45
TechCrunch:AI(RSS)
精选72
Meta 面向 WhatsApp Business 的 AI 智能体现已全球上线

Meta 为 WhatsApp Business 打造的 AI 智能体面向全球商家开放,将按照模型 token 使用量向企业收费。

智能体Meta产品更新

推荐理由:WhatsApp把AI agent推到全球小商家,按token计费,这可能是AI客服真正普及的节点,比对话框里的产品更有落地感。
21:41
Hugging Face:Blog(RSS)
精选55
DharmaOCR 利用 DPO 将文本退化率降低 59.4%

4月发布的DharmaOCR(结构化OCR模型)在巴西葡萄牙语文档提取任务中,使用直接偏好优化(DPO)作为监督微调(SFT)后的第二训练阶段。SFT无法直接惩罚文本退化(重复循环),而DPO以模型自身失败输出(退化循环)作为负样本进行偏好训练,使所有测试模型族的文本退化率平均降低59.4%,最高达87.6%(如Nanonets-OCR2-3B从1.61%降至0.20%)。传统DPO多用于聊天对齐,该工作将其扩展至客观的OCR任务,证明DPO可针对性修复特定失败模式。

Hugging Face教程/实践数据/训练

推荐理由:DPO 不只能对齐,这篇直接用模型自身的垃圾输出当反例,把 OCR 的重复错误平均降了 59%。思路不复杂,但告诉做结构化生成的工程师:训练数据里最该保留的就是模型犯的错。
21:37
Tomer Tunguz 博客(VC 分析)
精选66
智能性价比

微软在模型发布卡中首次加入平均token使用量指标。其模型在SWE-Bench Verified上达71.6分,仅消耗约Claude Haiku 4.5三分之一的token。Artificial Analysis的Intelligence Index显示GPT 5.5与Claude Opus 4.8得分相近(约60分),但Opus 4.8运行成本高出40%($4,685 vs $3,357)。Uber因四个月内AI预算超支而限制员工使用;Salesforce花费$3亿购买Anthropic tokens并冻结工程招聘。模型公司如今需同时在性能和成本两个维度竞争。

MicrosoftOpenAI推理现象/趋势

推荐理由:微软在模型发布卡上悄悄加了“平均token消耗”这个指标,这不是小改动,而是宣告AI从堆算力转向算账时代。Uber和Salesforce的预算教训已经很清楚了。
21:34
Google Blog:AI(RSS)
53
Google Search 提升二手和复古购物体验的5种方式

Google Search 和 Google Shopping 中的 AI 工具帮助用户在二手和复古购物中发现好物。

Google搜索教程/实践
21:30
Anthropic:Newsroom(网页)
精选59
介绍 Claude Partner Network 的 Services Track 和 Partner Hub

Anthropic 扩展 Claude Partner Network,推出 Services Track 分级体系和 Partner Hub 门户。Services Track 设 Select、Preferred、Global Premier 三级,按认证人数、投产客户数及客户推荐信量化评定。Partner Hub 提供每日更新仪表盘和公开目录,方便合作伙伴查看进展、客户寻找供应商。该网络三月启动以来已有超 4 万家公司申请,逾 1 万顾问获认证;Accenture 训练 3 万人,Cognizant 部署约 35 万员工,Deloitte 惠及 47 万人,KPMG 覆盖 27.6 万,Infosys 构建行业智能体,PwC 先在美推广再扩至全球。

Anthropic产品更新行业动态部署/工程

推荐理由:Anthropic 给合作伙伴画了一条明确的爬升阶梯,从 Select 到 Global Premier,企业客户终于有个公开透明的渠道找靠谱的实施团队,做 AI 咨询的可以认真评估入局了。
‹ 上一页
1…4142434445…50
下一页 ›