Arm CEO Rene Haas 表示,由于AI需求远超预期,公司可能提前实现自研AI芯片年收入150亿美元的目标(原计划2029年底前达成)。Arm于今年3月宣布首款自研芯片AGI CPU,将由Meta作为主要客户,采用台积电代工,拥有多达136个核心,功耗可达300W。该芯片旨在与英伟达等公司的加速器协同工作,用于协调任务分配、数据预处理和运行AI查询响应。
Arm CEO Rene Haas 表示,由于AI需求远超预期,公司可能提前实现自研AI芯片年收入150亿美元的目标(原计划2029年底前达成)。Arm于今年3月宣布首款自研芯片AGI CPU,将由Meta作为主要客户,采用台积电代工,拥有多达136个核心,功耗可达300W。该芯片旨在与英伟达等公司的加速器协同工作,用于协调任务分配、数据预处理和运行AI查询响应。
国家卫生健康委办公厅发布通知,提出加强数智化赋能,探索在城市社区卫生服务机构推广应用医学人工智能辅助诊断、处方前置审核、语音病历信息自动采集辅助书写等技术,以提高医务人员诊疗效率。通知同时要求合理利用人工智能加强病历、处方、医嘱等辅助审核,并提出到2030年基本实现建制街道社区卫生服务中心全覆盖的目标。
Groq 正在进行新一轮融资。根据Zach Be在Substack发布于2026年6月2日的文章探讨,HN上有101个点赞。
研华首席运营官兼智能系统事业部总裁刘倩在台北Computex 2026期间接受采访,讨论了公司与Nvidia合作以驱动下一代AI解决方案。她阐述了研华将AI整合进产品与服务背后的战略愿景。
JetBrains 发布开源模型 Mellum2。该模型为 12B 参数的 MoE 架构,在 10.6 万亿个 token 上训练,采用 Apache 2.0 许可,专为多模型 AI 流水线中的快速、专用任务设计。
OpenAI通过Amazon Bedrock提供GPT-5.5、GPT-5.4和Codex模型,价格与OpenAI自有平台一致。这些模型可在商业和政府AWS区域运行,但目前使用范围仅限于美国,用量将计入现有AWS合同。
软银CEO孙正义称,AI革命的规模是互联网泡沫时期的50倍,是“人类有史以来规模最大的科技变革”。软银宣布在法国投资750亿欧元建设AI基建项目,规划总装机容量5吉瓦的数据中心,其中至2031年将在法国北部上法兰西大区落地3.1吉瓦。该项目是软银在欧洲单笔最大AI基建投入,资金主要依靠项目融资。孙正义同时表示,OpenAI仅占软银净资产两成多,Arm占比超50%。
OpenAI CEO 萨姆·奥尔特曼反驳了“企业采用AI后就会裁员”的观点。他指出,采用AI最多的公司实际上招聘也最多,而宣称因AI裁员的公司反而采用AI较少。奥尔特曼认为AI可能被用作裁员的“方便说法”,但在看到公司使用OpenAI编程工具后,他对就业前景的判断变得更加乐观。他同时承认,OpenAI过去发布的某些新闻稿可能加剧了公众焦虑,并澄清了GPT-5.2在44个职业中超过专业人士的说法。
OpenAI AI 研究员加布里埃尔·彼得森认为,年轻科技从业者在职业生涯早期不必害怕“跳槽”,应通过尝试不同团队来积累关于研究项目质量、团队文化及个人市场价值的信息。他直言“年轻人应长期留在一家公司”的传统建议是“愚蠢透顶”,并建议以实习、短期合作等方式快速探索职业道路。彼得森本人在 23 岁加入 OpenAI 前,就曾在 Dataland 和 Midjourney 等公司多次更换工作,每段经历不足两年。他指出,许多顶尖工程师曾将多年时间投入“事后看来并不值得的岗位”,而早早获得巨额财富的案例则极其罕见。
鸿蒙智行智界V9旗舰MPV已整装发运,计划于6月初开启交付。该车售价区间为38.98万-51.98万元,上市48小时大定突破10500台。其具备L3级硬件预埋,并将首批升级华为乾崑智驾ADS 5系统,该系统拥有60EFLOPS云端AI算力,采用面向自动驾驶的WEWA 2.0架构。
截至2026年5月,宇树科技单款双足人形机器人累计生产下线约11000台。该公司于2026年6月1日科创板IPO上会,拟募资42.02亿元用于智能机器人模型研发等项目。财报显示,宇树科技2025年实现营收约17亿元,主营业务毛利率达60.13%,核心部组件自研自产率超过90%。
针对竞争对手Anthropic已秘密提交IPO文件,OpenAI CEO萨姆·奥尔特曼表示,AI行业最激烈的竞争并不在于谁先上市。他认为,竞争的核心是“谁能拿出最好的技术、打造最好的业务”。他同时指出,AI将成为许多领域的关键基础设施,世界应要求其拥有多个提供方以保证稳健性,不会由单一公司主导。目前,OpenAI也在冲刺IPO,目标是今年晚些时候,而Anthropic近期估值直冲1万亿美元。
SK Hynix计划在未来五年内将存储芯片晶圆产能提高一倍。此次大规模扩产旨在缓解AI关键组件的全球供应短缺问题。
腾讯控股股价创下三年多来最大涨幅,原因是有报道称其正在测试一个由AI驱动的智能体原型。该AI智能体与微信相关,这一消息提振了市场对腾讯人工智能努力的乐观情绪。
Arm Holdings CEO Rene Haas表示,公司可能比预期更早实现其品牌芯片销售额150亿美元的目标,这反映了来自AI热潮的需求强于预期。
Intel的Lip-Bu Tan强调了跨行业合作伙伴关系对于维持一个充满活力的科技生态系统至关重要。
彭博财经节目《开盘交易》的分析师们讨论了当日市场的核心主题,其中重点剖析了关于AI生产力提升的论述。节目指出,当前市场对AI将带来的生产力增长预期可能被过度炒作。
国家版权局、工业和信息化部、公安部、国家互联网信息办公室联合启动“剑网 2026”专项行动,时间从 6 月持续至 11 月。这是四部门第 22 次开展此项工作。行动重点关注四大领域:影视剧版权保护、文创版权保护、图书版权保护,以及人工智能领域版权整治。其中,人工智能领域重点推动解决大模型训练语料版权合规问题,并查处利用 AI 工具非法复制、改编、传播作品等侵权行为。
多名用户发现,OpenAI将Codex平台针对免费账号和Go订阅账户的额度重置周期从7天延长至30天。Plus、Pro、Business、Edu和Enterprise等付费订阅用户的额度仍维持每周重置。这一调整意味着免费用户每月可用额度次数从约4次减少为1次,而单次配额数值未变。Codex是OpenAI开发的AI代码生成与智能体平台。
广汽传祺宣布旗下向往 M8 PHEV L 与 E8 PHEV 两款新车将于6月11日正式上市。向往 M8 PHEV L 为中大型MPV,搭载高通骁龙8295芯片与端云一体大模型,提供前驱和四驱版本,CLTC纯电续航分别为248公里和235公里。向往 E8 PHEV 定位稍低,全系标配双大屏与后排娱乐屏,搭载1.5T发动机,匹配磷酸铁锂电池组。
英伟达CEO黄仁勋在台北电脑展上表示,公司现有产能足以支撑CPU与GPU业务的强劲增长,但整体产能依旧受限。英伟达发布了可在个人电脑端原生搭载AI算力的新芯片RTX Spark,定于今年秋季上市。同时,黄仁勋指出Vera系列数据中心CPU的市场热度未来可能超越GPU,成为公司新的核心增长引擎。英伟达当前市值已突破5万亿美元。
英伟达CEO黄仁勋在台北电脑展表示,未来Vera CPU将比自家GPU更受欢迎。Vera CPU已内置在所有英伟达AI机器中,上市即具备软件生态优势。其能效相比现有CPU高3-6倍,速度比x86处理器快1.8倍,专为AI智能体打造。黄仁勋强调,Vera CPU并非为争夺传统CPU市场,而是旨在开辟一个此前规模为零的全新AI智能体市场。
黄仁勋在2026台北国际电脑展主题演讲中表示,智能体AI时代并非软件公司的末日,反而将带来“绝佳时代”。他指出,智能体AI会调用更多工具,软件需求不会消失。未来软件竞争将转向“智能体如何使用软件”,软件公司必须调整产品形态以适应这一变化。
集邦咨询最新研究指出,三大存储原厂将于2027年大幅调高HBM报价,主因是常规DRAM供不应求以及新旧世代HBM制造成本高昂。数据显示,HBM单片晶圆产值已于今年第一季度被DDR5 64GB RDIMM反超。需求方面,AI基础设施建设将持续推动HBM需求:2026年动能来自AI ASICs将HBM容量从96/192GB升级至216/288GB;2027年英伟达Rubin Ultra平台将推动单颗GPU容量达384GB。三大原厂HBM投片量占整体DRAM投片量的比例,预计从2025年的18%增长至2027年的约30%。
意法半导体(STMicroelectronics)因人工智能基础设施需求旺盛,将今年数据中心业务收入预测近乎翻倍,上调至10亿美元。
Arm Holdings可能提前达到其自身芯片销售额150亿美元的目标。该公司CEO表示,来自AI热潮的需求强于预期,使得这一目标有望更早实现。
MCP-Persona是首个专门评估LLM智能体在个性化MCP工具上表现的基准测试,涵盖Reddit、小红书、Lark和Slack等应用。在多个SOTA智能体上的实验表明,当前智能体在个性化工具使用方面仍面临重大挑战。该基准旨在弥合现有评估主要聚焦通用工具、忽视个人社交应用中工具与个人账户或本地数据库交互所带来的实际挑战这一空白。
LongLive-RAG旨在解决自回归(AR)视频扩散模型在长视频生成中面临的错误累积与身份漂移问题。该方法将长视频生成建模为检索增强生成(RAG)问题,不再仅依赖滑动窗口,而是把之前生成的潜在变量视为可检索的动态历史记录。在每个新生成块中,它通过查询嵌入检索相关历史潜在变量,使生成器能够利用非局部上下文。为提升检索效果,框架引入了Window Temporal Delta Loss。实验表明,该框架能提升长视频生成质量,在多个AR骨干和生成长度上于VBench-Long基准取得了最佳平均排名。代码已开源。
在2026年台北国际电脑展期间,英特尔高管尼什·尼拉洛贾南表示,英伟达的 RTX Spark 是值得严肃对待的新对手。他指出,Arm CPU进入市场将面临挑战,但英特尔对自己的产品充满信心,能够提供合适的 CPU 和 GPU 组合来应对游戏、AI推理等多种工作负载。文章指出,英伟达与高通的不同之处在于其 AI 地位和市场号召力,它已推动 Adobe 为 RTX Spark 开发原生 Arm 版 Photoshop 和 Premiere Pro,这是高通入局两年后尚未取得的关键生态进展。
JetBrains 开源了面向软件工程的模型 Mellum2。该模型总规模为 12B 参数,采用稀疏 Mixture-of-Experts 框架,激活参数量为 2.5B。上下文窗口扩展至 131072 Token。Mellum2 支持生成编辑代码、调用外部工具及执行多步骤智能体式工作流。模型基础版、指令版和思考版均以 Apache 2.0 许可证开源。
JAMEL 是一个用于训练智能体在开放环境中进行探索的框架。它通过新颖性驱动的交互,将智能体的记忆模块与探索策略进行联合训练。该框架利用如代码覆盖率等确定性、持久的新颖性信号,为记忆模块提供无需人工标注的监督信号。实验评估表明,JAMEL 成功泛化至未见过的环境,其探索能力超越开源基线,达到与闭源模型相当的深度,同时减少了 token 消耗。相关代码与模型已开源于 GitHub。
Chunk-Level Guided Generation 是一种无需训练的推理时方法,它利用现成的大语言模型(如 Qwen2.5-32B 或 Llama-3.1-70B)作为过程评分器,引导小模型进行数学推理。该方法在每个步骤让小模型生成多个固定长度候选块,由大模型通过似然度评分选择,从而提前引导推理方向,避免错误传播。它包含似然引导选择(LGS)和对比引导选择(CGS)两种规则,其中CGS通过减去小模型似然度来偏好与大模型偏好不同的块。在多个基准测试中,该方法在匹配计算预算下,性能匹配或优于需要奖励模型训练的PRM引导搜索,并且生成的推理轨迹显著更短。
OpenWebRL是一个用于在真实网站上通过在线多轮强化学习训练视觉网页智能体的开源框架,覆盖了完整的训练流程。基于该框架训练的OpenWebRL-4B模型,在仅使用0.4K条监督初始化轨迹和2.2K个开放式RL训练任务的情况下,在Online-Mind2Web基准上达到67.0%成功率,在DeepShop基准上达到64.0%,超越了同规模或更大规模的先前开源智能体,性能可与OpenAI CUA和Gemini CUA等闭源系统竞争。该工作为构建更强、可复现且高性价比的开源网页智能体提供了实践路径。
面壁智能首席科学家刘知远提出“大模型密度定律”,该研究登上《自然·机器智能》封面,发现智能密度每3.5个月翻倍。他认为中国AI需“向外卷”,深入产业场景,而非重复OpenAI路径。刘知远指出中国模型与顶尖仍有差距,DeepSeek-V4尚未超越Claude Opus,原始创新是最大短板,但DeepSeek-R1在未公开路线下的创新值得肯定。他还强调智源研究院作为“中间地带”对原始创新的支持作用。
三星在2026年台北电脑展上展示了全球首款HBM5内存。HBM5是面向高性能计算(HPC)和人工智能(AI)训练需求设计的第八代存储技术,预计于2029年至2031年间推出。该技术采用2nm基础裸片搭配1c nm DRAM制造工艺,并将采用浸没式冷却技术以应对超高功耗。性能方面,其I/O通道提升至4096-bit,以16-Hi(16层)堆叠为标准,预期每个堆叠的带宽将提升至4 TB/s。
英伟达 CEO 黄仁勋在台北记者会上表示,在推出 RTX Spark 后,公司将扩展产品线。作为长线平台架构的 N1X 芯片,其后续的 N2X 与 N3X 均在研发中,同时还会推出更轻量的 N1 芯片。黄仁勋强调,公司将为每条新产品线提供长期的软件栈,打造一个庞大的软件生态系统,以优化 AI PC 使用体验。
星海图发布双足人形机器人 Kengo,拥有三款配色,搭载“运动小脑+具身大脑”,仅用两款核心模组覆盖全身关节,单关节扭矩超 130N·m。演示视频显示,Kengo 可完成空翻踢腿、鲤鱼打挺等高难度动作,并能在家庭场景中执行清洁、搬运物品等任务。官方暂未公布具体参数和价格。
Simon Willison 开发了“粘贴文件编辑器”工具原型,灵感源于 Claude.ai 能将大段粘贴文本自动转为文件附件的功能。该工具支持粘贴文本、直接打开文件(包括图片缩略图显示)以及拖拽文件。它是由 Codex 桌面版协助构建的。
本研究探讨预训练视觉语言模型能否通过生成可执行的Blender程序,直接从单张图像重建为可编辑的3D场景,且不依赖专门的2D/3D基础模型、可微渲染或多视图监督。文章提出了“可执行分阶段逆向图形”(SEIG)智能体框架,该框架在可执行的Blender代码空间中,通过分阶段优化几何、材质、构图与光照等因子来重建场景。实验评估表明,分阶段重建策略显著提升了场景重建的保真度(包括像素级、感知和语义保真度),验证了任务分解对于通用视觉语言模型执行可执行逆向图形的重要性。重建后的可编辑Blender场景可支持多种下游应用。
当前单智能体计算机使用智能体在复杂长时程任务中存在不足。为此,本研究提出了多智能体计算机使用系统。该系统由一个管理器模型将任务分解为有向无环图,并行派遣子智能体执行,并根据新信息动态调整该图。实验表明,该系统在桌面和网页导航基准测试上的性能持续优于强单智能体基线3.4-25.5%,并在长时程网页导航任务上将平均任务完成时间缩短约1.5倍。研究结论是,多智能体协调是扩展计算机使用智能体能力的一个有前景方向。