亚马逊将利用视觉搜索与AI技术,在用户搜索时生成并展示匹配查询的AI产品图片。该零售商表示,此举旨在帮助引导用户找到对应商品。
亚马逊将利用视觉搜索与AI技术,在用户搜索时生成并展示匹配查询的AI产品图片。该零售商表示,此举旨在帮助引导用户找到对应商品。
Mystic Leaks 分享了谷歌 Pixel 11、Pixel 11 Pro、Pixel 11 Pro XL 的官方壁纸,Pixel 11 Pro Fold 的壁纸此前已在 4 月的安卓 17 早期版本中曝光。目前各型号壁纸图片均已公开,详情可见 IT之家报道。
美国银行今年招聘近4000名暑期实习生和全职校招新人,各占一半,规模与去年持平。约24万人申请不到2000个实习岗位,录取率约0.8%。AI工具让申请更容易,也加剧竞争。美银仍将入门级人才招聘作为战略重点,但实习生需学会用AI完成过去手工的pitch deck和建模等工作,将更多时间投入更高层次任务。美银CEO表示已削减运营岗位,但在关系管理、技术、网络安全等关键领域继续招聘,看重候选人“智识严谨性”和“好奇心”。实习生从培训第一天起就接触AI。
荣耀 Magic8 系列手机今日推送 MagicOS 10.0.0.160 版本升级,系统包约 11.11GB。新版本上线 YOYO AI 创作、AI 窥屏防护(智能识别窥视并触发遮挡)和虚拟权限(应用访问通话记录/联系人/日程仅返回空白)。灵动胶囊新增支持淘宝闪购买药、百度地图驾车导航、大众点评排号及美团拼好饭。桌面新增装饰卡片和闹钟卡片,锁屏小组件新增笔记与录音机,安全输入键盘支持挖孔区避让与圆角适配。离焦视力舒缓新增运动舒缓模式。系统优化相机拍摄、功耗与稳定性,合入安卓 2026 年 5 月安全补丁。
多伦多大学研究人员展示了一种人工智能蠕虫,能够主动传播并攻击任何联网设备,无需人工干预即可在系统间移动。这项研究揭示了AI驱动自主攻击的潜在威胁。
Google DeepMind 的 Gemma 4 12B 模型可在 16GB RAM 的普通笔记本上运行,支持本地数据处理与视觉洞察生成。macOS 用户可通过 Google AI Edge Gallery 执行动态 Python 代码与可视化,通过 Google AI Edge Eloquent 实现完全离线的语音听写和文本编辑。另外,LiteRT-LM CLI 新增 serve 命令,可创建行业兼容的本地端点,驱动完全本地的 AI 工具和智能体。
关联讨论 4 条The Decoder:AI News(RSS)X:Google AI for Developers (@googleaidevs)Hacker News 热门(buzzing.cc 中文翻译)X:Jeff Dean (@JeffDean)Gemma 4 12B 是一款密集多模态模型,专为消费级设备上的高性能本地 AI 执行而设计。其采用新颖的无编码器架构,绕过传统视觉和音频编码器,将多模态数据直接输入大语言模型主干。
关联讨论 4 条The Decoder:AI News(RSS)X:Google AI for Developers (@googleaidevs)Hacker News 热门(buzzing.cc 中文翻译)X:Jeff Dean (@JeffDean)亿万富翁投资者瑞·达利欧(Ray Dalio)表示,当前蓬勃发展的人工智能(AI)市场已显示出泡沫迹象,并预计这种泡沫最终将会破裂。
KVarN是一种免校准的KV-cache量化方法,通过Hadamard旋转结合双标度方差归一化,同时对K和V矩阵的两个轴进行归一化,以修复异常token尺度误差,大幅减少自回归解码中量化误差随时间步的累积。在2-bit精度下,KVarN在MATH500、AIME24和HumanEval等生成基准上达到新的SOTA。该方法的vLLM实现已在GitHub开源。
Elon Musk旗下xAI暂停招聘用于训练Grok聊天机器人专业技能的专家,此举可能标志着该公司在技术开发方式上的转变。
英国监管机构要求谷歌提供一项工具,允许网站出版商选择退出生成式AI搜索功能。该选项将先在英国测试,随后在全球范围内推出。
这家由前高盛和Meta创始人创办的语音AI初创公司,专注于非洲和中东市场,其自有技术栈目前已处理日均超过17000通电话。
小米汽车升级 Xiaomi HyperOS 1.16 后,YU7 长续航版、Pro 版、Max 版均搭载小米 XLA 认知大模型,新增语音控车 Beta 和商场地库车位级领航功能。YU7 GT 可通过舒适模式或经济模式调节驾驶体验,前者动力平顺、悬架滤震,后者前电机脱开、后驱行驶以延长续航;晕车舒缓模式则优化动力、制动和能量回收,降低晕车发生率。后续将不断解锁更多新体验。
京东发布并开源 JoyAI-Echo 长音视频生成框架。其内置记忆库可在长达 5 分钟的视频中保持角色身份、视觉形象和声音音色高度一致。框架采用记忆驱动后训练流程,结合 SFT、跨模态 RLHF 与 Distribution Matching Distillation(DMD)技术,DMD 带来约 7.5 倍推理速度提升。JoyAI-Echo 还引入 Director Agent,支持自然语言需求自动拆分为剧本、角色、场景和镜头,实现对话式编辑。配套实时超分模块支持 736×1280 → 1152×1920 及 736×1280 → 1472×2560 两档分辨率提升。京东称该项目标志着其在长视频生成领域进入全球第一梯队。
瑞莎在深圳开发者活动日展出 Dragon Q8B 迷你主板,搭载 5nm 骁龙 8cx Gen3(SC8280XP),八核 Kryo CPU 最高 3.0 GHz,Adreno 690 GPU,AI 算力最高 29 TOPS,支持最高 32GB LPDDR4X 内存。板型 100mm×75mm,配备双 2.5GbE 网口、双 M.2 2280 NVMe 插槽(PCIe 3.0 x4+x2)、UFS 3.1、双 USB-C(DP 1.4b)、双 USB-A 3.2、HDMI 2.1、40 针 GPIO 等。4GB 版定价 149 美元,首发优惠 45 美元(约 104 美元),7 月 31 日上市。同期展出更小的 Dragon Q5E(QCS6690,6 TOPS)及两款与飞牛合作的高通平台 NAS(6 盘位全闪存、4 盘位)。
谷歌母公司 Alphabet 公布投资者演示文稿显示,Gemini App 月活跃用户超 9 亿,一年内翻倍超过一倍。Gemini 已为谷歌 13 款超 10 亿用户产品提供支持,其中 5 款用户量超 30 亿(搜索、Gmail、Android、Chrome、YouTube)。谷歌搜索 AI Overviews 月活跃用户超 25 亿。自 Gemini 3 推出,核心 AI 响应成本降低 30% 以上。谷歌预计本月推出 Gemini 3.5 Pro 模型。
关联讨论 1 条X:Gemini (@GeminiApp)提出 Bootstrap Your Generator (ByG) 框架,用于非配对训练流匹配图像/视频编辑模型。方法从冻结的基础模型中提取指令遵循线索,结合循环一致性保持结构;通过梯度路由将下游损失反向传播到噪声训练状态,弥合训练-推理差距。在数据稀缺的图像和视频编辑任务上达到 SOTA,泛化到未见领域,性能优于用百万级配对样本训练的监督基线。实验表明,从基础模型提取的语义线索提供了稳健的训练信号,无需外部奖励模型。
AURA-Mem是一种恒定大小的递归记忆机制,专为机器人策略设计。它包装了一个冻结的视觉-语言-动作主干(7B参数),通过学习门控仅在当前观测会改变下一步动作时写入记忆。推理状态固定为4,224字节,而KV-cache在100,000步时大6,061倍。在LIBERO-Long上,门控策略未降低成功率(0.233),略优于始终写入的KV臂(0.217),同时写入次数减少7.0倍。在合成基准上,AURA-Mem匹配最佳O(1)基线精度,写入次数减少5.19–6.13倍,而随机或周期调度无法复现该增益。
Reachy Mini 对话应用现在可通过 MCP 协议添加远程工具。执行 `reachy-mini-conversation-app tool-spaces add` 命令即可从 Hugging Face Spaces 安装远程工具(如搜索、天气),并自动启用至当前 profile 的 tools.txt 中。内置工具(头部动作、跳舞、表情、摄像头等)仍为本地 Python 代码,远程工具则通过 MCP 端点调用。profiles 通过 tools.txt 控制哪些工具可用,不在文件中的工具模型无法调用。用户也可编写自定义本地工具。远程工具适合无状态能力,便于发布、共享和迭代,无需修改应用本身。支持 install、list、remove 等子命令。
本文来自 www.copetti.org,标题为“PlayStation Architecture”,是一篇介绍 PlayStation 游戏主机硬件架构的技术文章,并附有架构图。该文章于 2026 年 6 月 3 日在 Hacker News 上获得 100 个点赞,由 buzzing.cc 提供中文翻译版本。
Centerbridge 联合创始人 Jeff Aronson 表示,私人信贷对美国经济不构成系统性风险。他认为 AI 正在重塑投资领域,但不会取代人类判断。Aronson 回顾了自己从律师转型为不良债务投资者、并于 2005 年创立 Centerbridge 的经历。该采访于 4 月 21 日在纽约录制,是彭博财富第六季首集。
Alphabet Inc. 将股权融资规模从两天前公布的 800 亿美元提高至 847.5 亿美元,以资助不断增长的人工智能支出计划。
在年度Build大会上,微软宣布了一系列AI新举措,包括超级应用、自研推理模型、网络安全工具和OpenClaw风格的AI智能体。该公司此前长期依赖与OpenAI的独家合作,但这段充满戏剧性的关系已在4月底实质上破裂(微软仍保留OpenAI主要云合作伙伴身份)。微软正以独立姿态成为AI领域的重要玩家。
月之暗面今日宣布,Kimi Work Beta 版随最新版 Mac 和 Windows 客户端开启内测。Kimi Work 是基于 Kimi Code 的通用型本地 Agent,支持安装使用技能、运行定时任务,并继承在线版的专业技能与数据库,内置可调用浏览器的 Kimi WebBridge。用户用自然语言描述目标即可自动拆解任务、并行执行并交付产物。支持 Agent 集群,最高可创建含 300 个子 Agent 的团队。官方透露,Kimi Work 自身由 Kimi Code 写成,工程师一周内完成客户端开发,累计产出超 5 万行有效代码,其中 92% 由 AI 自主生成。
关联讨论 4 条X:Testing Catalog (@testingcatalog)X:Kimi.ai (@Kimi_Moonshot)X:邵猛 (@shao__meng)X:Berry Xia (@berryxia)华为联合天津港发布新一代港口智能水平运输系统解决方案,围绕“感、联、算、控”四大核心能力,融合多维感知、混行动态路径规划、虚拟红绿灯智能管控、AI全域交通态势研判等技术,实现ART(人工智能运输机器人)与人工集卡安全高效混行作业。该方案无需大规模土建改造,可适配全球绝大多数传统集装箱码头。截至目前,华为已服务全球100多个港口。
摩根士丹利将向外部 AI 智能体开放其关键财富管理渠道。客户部署的 AI 智能体可直接从股权管理平台 ShareWorks 和 Equity Edge 提取数据,绕过传统人类界面。该公司已归集 1.2 万亿美元受托资产。摩根士丹利已向少数客户授予早期访问权限,计划明年覆盖其 3,400 家托管客户。竞争对手摩根大通和高盛已在内部使用 AI 智能体,但尚未对外开放。
Alphabet 将股权融资规模从 800 亿美元增至 847.5 亿美元,用于投资 AI 基础设施与算力。其中 A 类普通股和 C 类资本股发行增至 180 亿美元,存托股份发行增至 167.5 亿美元;伯克希尔·哈撒韦以私募形式投资 100 亿美元。发行预计 2026 年 6 月初完成。
上海海思 HiSpark Studio 正式在 GitCode 平台开源。该 IDE 基于 VS Code 扩展架构,集成工程管理、代码编辑、编译构建、烧录调试、图形化配置等全链路开发能力,支持智能设备、星闪(NearLink)、嵌入式 AI 开发。核心亮点包括 SDK 一键下载、一键编译与烧录、GDB 调试、图形化工具集(图片解压缩、视频首帧提取、3D 建模、蒙版工具)、系统配置工具、AI 模型处理(量化压缩、格式转换、一键部署验证)及远程开发模式。
欧盟委员会6月3日公布“欧洲技术主权一揽子方案”,涵盖《云与人工智能发展法案》《芯片法案2.0》、“开源战略”和“能源领域数字化与人工智能战略路线图”。《云与人工智能发展法案》目标在未来5至7年内将欧洲数据中心容量提高3倍;《芯片法案2.0》旨在基于欧洲芯片优势建设尖端半导体能力。但“数字欧洲”组织认为,“含欧量”要求可能割裂供应链,削弱竞争力。
2026年5月,ETSI发布由华为牵头制定的ETSI TS 104 033,系ETSI首个面向AI计算平台安全要求的国际标准。该标准2023年11月由华为在ETSI SAI会议牵头立项,获英国电信、高通、贝尔法斯特女王大学、博世、德国BSI支持。标准要求缓解AI计算平台安全风险,华为昇腾安全解决方案据此覆盖从数据中心Atlas SuperPoD到边缘推理设备。
微软与OpenAI的合作关系已彻底破裂,双方进入正面竞争态势。前DeepMind高管、现任微软AI主管Mustafa Suleyman明确表示,微软现在必须从头证明自己能独立完成所有必需的任务。这标志着两家科技巨头从紧密合作伙伴转变为直接竞争对手。
Meta Platforms Inc. 首次向企业销售AI智能体,这是该公司为抵消巨额AI投资而寻求创收的最新举措。
Perplexity 发布了一个编排器,将本地计算机上的 AI 模型与云端强大模型相结合,并自动决定每个任务分配至本地处理还是云端处理。
Meta 为 WhatsApp Business 打造的 AI 智能体面向全球商家开放,将按照模型 token 使用量向企业收费。
4月发布的DharmaOCR(结构化OCR模型)在巴西葡萄牙语文档提取任务中,使用直接偏好优化(DPO)作为监督微调(SFT)后的第二训练阶段。SFT无法直接惩罚文本退化(重复循环),而DPO以模型自身失败输出(退化循环)作为负样本进行偏好训练,使所有测试模型族的文本退化率平均降低59.4%,最高达87.6%(如Nanonets-OCR2-3B从1.61%降至0.20%)。传统DPO多用于聊天对齐,该工作将其扩展至客观的OCR任务,证明DPO可针对性修复特定失败模式。
微软在模型发布卡中首次加入平均token使用量指标。其模型在SWE-Bench Verified上达71.6分,仅消耗约Claude Haiku 4.5三分之一的token。Artificial Analysis的Intelligence Index显示GPT 5.5与Claude Opus 4.8得分相近(约60分),但Opus 4.8运行成本高出40%($4,685 vs $3,357)。Uber因四个月内AI预算超支而限制员工使用;Salesforce花费$3亿购买Anthropic tokens并冻结工程招聘。模型公司如今需同时在性能和成本两个维度竞争。
Google Search 和 Google Shopping 中的 AI 工具帮助用户在二手和复古购物中发现好物。
Anthropic 扩展 Claude Partner Network,推出 Services Track 分级体系和 Partner Hub 门户。Services Track 设 Select、Preferred、Global Premier 三级,按认证人数、投产客户数及客户推荐信量化评定。Partner Hub 提供每日更新仪表盘和公开目录,方便合作伙伴查看进展、客户寻找供应商。该网络三月启动以来已有超 4 万家公司申请,逾 1 万顾问获认证;Accenture 训练 3 万人,Cognizant 部署约 35 万员工,Deloitte 惠及 47 万人,KPMG 覆盖 27.6 万,Infosys 构建行业智能体,PwC 先在美推广再扩至全球。