AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
精选全部日报更多
全部动态今日 197 条
全部一手资讯X论文
6月9日周二
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月9日
13:05
Berryxia.AI@berryxia
54
Claude 通过 Apple ID 虚拟邮箱电脑端登录解决方法

Claude 用户 Berry Xia 分享了一则登录技巧:如果用 Apple ID 虚拟邮箱(一长串随机地址)创建过 Claude 账号,手机端可正常使用,但电脑端无法直接选择该邮箱登录。解决方法:在设置中复制虚拟邮箱地址,在电脑端选择“使用邮件登录”并粘贴该地址,系统会向原始 Apple ID 邮箱发送登录链接,点击链接即可完成登录。该方法也可用于注册 Claude 账号。

Anthropic教程/实践
12:55
HuggingFace Daily Papers(社区热门论文)
68
评估卡片:AI评估报告的可解读层

AI评估结果规模庞大但报告不一致,导致读者难以跨来源比较、识别遗漏或追溯结论。Evaluation Cards通过整合基准元数据、评估运行数据和模型元数据,形成统一记录。方法包括:(1)从52篇论文和10次利益相关者访谈中推导报告模式;(2)实现四个可解释信号(可复现性、文档完整性、来源与风险、分数可比性),并针对研究与非研究受众提供不同读者模式;(3)部署监控工具,覆盖5816个模型、635个基准和101843个结果,揭示当前报告实践中的系统性缺口。

arXiv论文/研究评测/基准部署/工程
12:55
HuggingFace Daily Papers(社区热门论文)
68
FlashMemory-DeepSeek-V4: 通过前瞻稀疏注意力实现闪电索引超长上下文

FlashMemory-DeepSeek-V4(FM-DS-V4)提出Lookahead Sparse Attention(LSA)推理范式,基于DeepSeek-V4架构构建神经记忆索引器,主动预测未来上下文需求,仅保留查询关键KV块。采用解耦训练策略,索引器作为独立双编码器训练,无需加载主干模型。在LongBench-v2、LongMemEval、RULER等长上下文基准上,平均物理KV缓存压缩至全上下文基线的13.5%,下游精度平均提升0.6%;在500K极端长度下,物理KV开销减少超过90%,且不损害主干模型的核心推理能力。

DeepSeek推理论文/研究
12:55
HuggingFace Daily Papers(社区热门论文)
精选73
OmniGameArena:面向VLM游戏智能体的统一UE5基准与改善动态

OmniGameArena是一个基于十二个Unreal Engine 5新构建游戏的实时基准,涵盖单人(7个)、PvP(3个)和合作(2个)模式,提供统一动作接口。除冷启动排行榜分数外,还引入Improvement Dynamics Curve (IDC),一种智能体反射评估机制:通过工具调用反射大语言模型自动优化技能提示词,追踪多轮反射中的分数变化以及习得技能在任务变体上的泛化表现。论文报告了12个VLM智能体在冷启动排行榜上的表现,以及4个顶级智能体在IDC下的指标。

智能体多模态论文/研究

推荐理由:在 UE5 里直接测 agent 的自我改进,这个思路让游戏 benchmark 从一次性的刷榜变成动态成长观测,对做多模态 agent 的团队是个新标尺。
12:43
Xiaomi MiMo@XiaomiMiMo
35
1000+ tokens/s 很快。🚀 但这实际解锁了什么?
产品更新推理
12:28
AYi@AYi_AInotes
64
iOS 27 新 Siri 实现质变级升级

iOS 27 的新 Siri 实现质变级升级。演示中用户提及水瓶需求,Siri 自动关联妈妈聊天记录,弹出卡片显示「Your mom mentioned that she really wanted a LARQ bottle.」并附上消息片段。这涉及个人语义理解和跨应用上下文召回,支持 Messages、照片/视频文本解读。本地处理为主,速度快、隐私更好。

Sam Kohl: New Siri in iOS 27...it actually works 🤯

产品更新端侧语音
12:22
IT之家(RSS)
62
微软GitHub数十个开源项目遭黑客入侵,被植入窃取密码的恶意程序

微软已封锁其在GitHub上的至少70个开源项目,原因是黑客在代码中植入窃取密码的恶意程序。受影响项目涉及Azure、Claude Code、Gemini命令行界面和VS Code等AI编程工具。安全机构Cloudsmith和开源社区OpenSourceMalware首先发现,用户运行篡改程序时会泄露密码及账号凭证。微软已下架相关仓库,部分恢复访问,并通知了少数下载过恶意内容的用户。这是近几周内微软开源项目第二次遭入侵,5月中旬Durable Task项目也曾被攻击。

GitHubMicrosoft开源生态行业动态
12:22
IT之家(RSS)
74
马斯克详解 SpaceX AI 卫星计划:技术成熟,明年规模化量产

SpaceX 称轨道 AI 数据中心并非工程难题,现有星链卫星已具备大部分技术。AI 卫星将沿用第三代星链的太阳能电池阵列与热管理系统,结构更简单,无需大型相控阵天线。马斯克展示的 AI1 卫星渲染图显示配备翼展 70 米光伏面板,支持平均 120 千瓦、峰值 150 千瓦计算载荷,相当于单台英伟达 GB300 AI 服务器机架。SpaceX 计划组建约 100 万颗 AI 卫星网络,位于得克萨斯州巴斯特罗普的工厂预计明年年底前实现规模化量产,星舰可重复使用设计将支撑大批量运输。

行业动态部署/工程
12:22
IT之家(RSS)
36
魅族 22 Next"AI 小方块"工程机外观曝光:紫光展锐 T8200、4 英寸机身

魅族今年 1 月公布的 22 Next“AI 小方块”因内存涨价被无限期推迟,但工程机现已现身网络。该机实际定名“MEIZU AI 小方块”,搭载紫光展锐 T8200 芯片,配备 4 英寸聚碳酸酯亮面外壳,运行 Flyme AIOS。官方曾规划数十个场景、超 100 个表情界面的 AI 智能体交互体验,可放入吉利系汽车作为“驾乘机器人”,但最终未能上市。

智能体行业动态
12:17
歸藏(guizang.ai)@op7418
82
OpenAI 宣布已正式启动上市的法律和监管程序,公司近日向美国证券交易委员会秘密提交了 S-1 注册声明(预计会泄露因而主动公布)。不过 IPO 具体时间尚未确定,可能还需要一段时间,因为作为私有公司更有利于完成某些目标;但此举也为 OpenAI 保留了尽早上市的选择权。公告依据 1933 年证券法规则 135 发布,不代表任何证券出售要约。

OpenAI Newsroom: We recently submitted a confidential S-1. We expect it to leak so we're just announcing it. We have not decided on timin...

OpenAI行业动态
关联讨论 10 条OpenAI:官网动态(RSS · 排除企业/客户案例)IT之家(RSS)X:Testing Catalog (@testingcatalog)Bloomberg:Technology(RSS)X:Rohan Paul (@rohanpaul_ai)Hacker News 热门(buzzing.cc 中文翻译)X:Kim (@kimmonismus)TechCrunch:AI(RSS)The Verge:AI(RSS)The Decoder:AI News(RSS)
12:15
Bloomberg:Technology(RSS)
44
Paytm 计划增员 10%,在 AI 转型中削减部分岗位

印度金融科技公司 Paytm 计划在未来九个月内招聘约 4000 人,使其员工总数增加 10%。此举旨在扩大商户网络并推动人工智能驱动的产品,作为公司 AI 转型的一部分,同时部分岗位将被削减。

其他行业动态
11:55
HuggingFace Daily Papers(社区热门论文)
60
Echo-Memory:动作世界模型中记忆机制的控制研究

Echo-Memory固定视频扩散骨干、优化器、相机动作表示、采样器和评估流水线,比较原始上下文、压缩记忆、空间摘要(不同读取路径)和状态空间循环四种记忆设计。三分支评估(回放质量、域内循环重访、开放域返回)显示排序常不一致,回放保真度不足以代理世界记忆。发现:原始上下文提升开放域返回远超回放指标;紧凑无法替代容量,激进空间与混合压缩丢失关键证据;块状态空间循环在开放域返回中最强,隐式记忆结构与使用同等重要。

具身智能视频论文/研究
11:55
HuggingFace Daily Papers(社区热门论文)
67
大规模端到端上下文压缩

长上下文语言模型推理受KV缓存内存瓶颈制约。现有压缩方法或大幅降低质量,或耗时耗算力。本文通过架构搜索和从头预训练,在350B tokens上持续预训练了0.6B编码器、4B解码器的模型家族,支持1:4、1:8、1:16压缩比,命名为Latent Context Language Models (LCLMs)。该家族在通用任务性能、压缩速度和峰值内存上提升了帕累托前沿,并能作为长时程智能体的高效骨干,快速扫描压缩后的长上下文并按需展开相关片段。

智能体推理论文/研究
11:40
公众号:小米 MiMo
精选80
小米 MiMo 与 TileRT 联合发布 UltraSpeed 模式,1T 模型输出突破 1000 tokens/s

小米 MiMo 与 TileRT 联合发布 MiMo-V2.5-Pro-UltraSpeed 模式,使 1T 参数旗舰模型输出速度首次突破 1000 tokens/s。模型侧采用 FP4 混合量化(仅量化 MoE Expert)与 DFlash 块级 masked 并行推测解码(coding 场景平均接受长度 6.30 tokens);系统侧 TileRT 引入常驻内核引擎与异构流水线协作。API 限时开放(2026 年 6 月 9 日至 23 日),定价为 MiMo-V2.5-Pro 的 3 倍,速度提升约 10 倍。FP4 权重与 DFlash 模型 checkpoint 已开源至 HuggingFace。

开源生态推理模型发布部署/工程
关联讨论 3 条Hacker News 热门(buzzing.cc 中文翻译)X:小米 MiMo (@XiaomiMiMo)IT之家(RSS)
推荐理由:万亿模型首次在通用GPU上突破1000 tokens/s,不是专用硬件的胜利而是模型与系统Codesign的胜利,做实时AI应用的都应该盯紧这一套方案。
11:40
公众号:月之暗面(Kimi)
47
Kimi 将公开预测 104 场世界杯赛事:德国队或爆冷夺冠

Kimi 通过「Agent 集群」同时调度 300 个子 Agent,从战术、球员、伤病等维度并行分析 104 场世界杯赛事,并公开预测与复盘。模型综合采用 Elo/FIFA 强度模型、Poisson 与 Dixon-Coles 进球分布模型、xG/xT 指标体系、Monte Carlo 模拟等。分析发现德国队夺冠概率被市场低估:基准约 11.0%,校准后约 11.3%,而部分市场隐含概率仅约 7.4%,存在约 +3.6 个百分点的正向偏离。同时推出总奖池 1 万亿 Token 的竞猜活动,并发布 Kimi Work——面向知识工作者的通用型本地 Agent,集成了建站、PPT 等专业 Skills 及 Kimi WebBridge。

智能体推理行业动态
11:39
小互@xiaohu
17
港版iPhone 更新iOS27后 还给我降级到最傻逼的Siri版本了 还不如之前呢,还能看看跑马灯 CTMD
其他语音
11:39
小互@xiaohu
51
Codex/Claude Code 实现自动视频剪切

安装一系列工具后,可让 Codex 或 Claude Code 自动剪切视频。例如,让 AI 翻译 WWDC2026 视频,并根据视频内容自动分析、精准裁切成多个独立片段,实现自动化视频处理。

小互: http://x.com/i/article/2063968924019163136

教程/实践视频
11:29
Elon Musk@elonmusk
42
SpaceX AI 卫星
产品更新具身智能
11:22
IT之家(RSS)
59
Cadence 携手 NVIDIA 发布业界首位全自主芯片设计 AI 虚拟工程师

Cadence(楷登)在 COMPUTEX 2026 上宣布,与 NVIDIA 合作推出的 ChipStack AI Super Agent 自主水平达到 Level-5,成为业界首款全自主芯片设计 AI 虚拟工程师。该智能体基于 Cadence AI 驱动 EDA 产品组合与 NVIDIA Nemotron 模型构建,并由 NVIDIA OpenShell 沙箱保障安全,可独立执行规格理解、RTL 生成、验证规划、形式分析、仿真、调试和设计收敛等任务,无需逐步提示,能评估中间结果并自主决策下一步。Cadence 高级副总裁 Paul Cunningham 称,该工具让资深工程师以更高速度和信心推进更具挑战性的设计。

智能体产品更新
11:22
IT之家(RSS)
62
Waymo 2.2亿美元收购苹果前汽车试验场

据马里科帕县文件,Waymo以2.2亿美元收购亚利桑那州威特曼市一处5500英亩汽车试验场,产权于6月5日过户。该场地原属苹果关联公司,苹果2021年以1.25亿美元购入,曾用于泰坦计划原型车测试,该造车项目于2024年初终止。场地包含115英亩城市模拟道路、35英亩动态测试区、4英里环道及高速模拟高速。Waymo将在此开展全乘客测试、车辆运动控制测试、运营人员培训及新型测试项目。目前Waymo车队近4000台,已推出极氪自动驾驶厢式车并投入载客,计划每年量产数万台自动驾驶出租车。

Google行业动态
11:22
IT之家(RSS)
57
特斯拉向内华达申请 Robotaxi 运营许可,计划一年内投放 5000 辆自动驾驶网约车

特斯拉子公司 Tesla Robotaxi, LLC 向内华达州提交自动驾驶车辆运营网络公司许可申请(案卷编号:26-05015),获批后计划在业务启动后 12 个月内于克拉克县投放最多 5000 辆 Robotaxi,覆盖拉斯维加斯、亨德森机场等人流密集区域。继 2025 年 9 月获测试许可并建成运维中心后,此举是商业化运营关键一步。2026 年第一季度股东报告显示,达拉斯、休斯顿已上线,其余城市在筹备;当季付费运营里程环比近乎翻倍,得克萨斯州运营未出现事故。新款 Cybercab 已于今年 4 月在得州超级工厂投产,将逐步取代 Model Y 成为主力运营车辆。

具身智能行业动态
11:19
SemiAnalysis@SemiAnalysis_
24
史蒂夫·乔布斯复活,宣布他有史以来最伟大的产品。
其他
11:09
小互@xiaohu
47
马斯克公布太空计算蓝图:AI卫星与Terafab工厂

马斯克近日宣布SpaceX/xAI太空计算蓝图:首颗AI卫星采用Starlink太阳能技术,峰值功率150千瓦、持续算力120千瓦,翼展70米,配110平方米液体散热器,通过星舰发射,使用激光链路通信。计划建设Terafab太空算力工厂,占地约1亿平方英尺(特斯拉Giga Texas的10倍),算力供应达1TW/年,相当于当前美国年消耗量(0.5TW)的两倍。目标将数据中心送入太空捕获太阳能,实现卡尔达肖夫等级跃迁。该项目依赖星舰完全可复用技术,预计三年内将年入轨量从约2500吨提升至百万吨级。

大佬观点部署/工程
11:09
宝玉@dotey
精选78
baoyu-design skill 支持导入 Design System 并在新建项目中使用

baoyu-design skill 现已支持导入 Design System,新建项目时可直接使用已导入的设计系统。功能保留了 Claude Design 原有的导入与编译方式,通过提问即可让用户选择已导入的 Design System。开发者表示实现过程比预期复杂,但效果不错。安装命令:`npx skills add JimLiu/baoyu-design`。另据 @dotey 介绍,该工具为本地运行的 Claude Design 风格工具,可描述屏幕生成 HTML,在预览中点击元素说出修改指令,最佳搭配 Opus 4.8。

宝玉: Cursor's new browser + element annotation turns it into a design studio. Meet Cursor Design 🎨 - Claude Design, running ...

开源/仓库开源生态编码
关联讨论 1 条X:宝玉 (@dotey)
推荐理由:宝玉把baoyu-design skill加上了Design System导入,现在用Cursor做前端页面可以直接挂设计规范,不用自己手搓变量了。比预期复杂但效果可以,做前端工具的可以试试。
11:01
Huawei Cloud@HuaweiCloud1
54
6月6日,在华为云INSPIRE 2026大会上,华为云数据库举办了题为"Agent-Native: The Next Phase of Databases"的会议。 客户、合作伙伴和行业专家齐聚上海,探讨数据库趋势、实际实施以及智能体时代的未来。https://tinyurl.com/ycbnbsva #INSPIRE2026 #HuaweiCloud #Database
智能体行业动态
10:55
HuggingFace Daily Papers(社区热门论文)
61
SpatialWorld:多模态智能体在真实世界任务中的交互式空间推理基准

SpatialWorld 是为评估多模态智能体在复杂真实任务中的交互式空间理解而设计的统一基准。它整合 8 个异构模拟后端,包含 760 个人工标注任务,覆盖家庭日常、旅行、社交协作等场景。智能体需在仅视觉部分可观测条件下主动收集第一人称证据,并通过统一文本动作接口输出决策。对 15 个先进多模态智能体的评测显示,最强闭源模型 GPT-5 平均任务成功率仅 17.4%,最强开源模型 Qwen-3.5 达 14.1%。分析表明任务成功与执行效率存在脱节,不同领域性能差异显著,主动探索与长程规划仍是瓶颈。

arXiv具身智能多模态论文/研究
10:55
HuggingFace Daily Papers(社区热门论文)
59
潜在空间记忆框架Mirage用于视频世界模型

Mirage提出一种潜在空间记忆框架,用于视频世界模型的3D一致性生成。它通过深度引导反投影将潜在token提升至3D,形成持久缓存,并利用直接潜在空间扭曲合成新视图,避免了像素空间重建的信息损失和重复编码渲染的计算开销。相比显式3D基线,Mirage实现端到端视频生成加速10.57倍、内存占用减少55倍。在WorldScore上达到当前最优性能,在RealEstate10K上展现强重建质量。

多模态视频论文/研究
10:43
meng shao@shao__meng
52
阶跃星辰 Step 3.7 Flash 完成真实 Coding Agent 任务:将 Agent Memory 痕迹生成本地 HTML 工具

开发者用 Step 3.7 Flash 测试真实 Coding Agent 任务:将已有 Local Agent Memory MVP 的运行痕迹(memory_events、structured_facts、memory_chunks 等 9 个场景测试数据)生成为单文件本地 HTML 工具 agent_memory_inspector.html。页面展示 8 条 memory events、9 条 structured facts、8 个 memory chunks、9/9 场景测试通过、敏感信息过滤前后对比、recall 命中内容及 retrieval 类型与分数、跨 session 记忆连续性。模型先读取现有代码和测试输出,检索 Letta、LangSmith 等工具展示方式后编写代码。测试环境:Cursor Agent + step-3.7-flash,本地 HTML 输出。

智能体编码评测/基准
10:43
meng shao@shao__meng
25
中国考生很厉害。 你测的是 Gork @gork,关我 Grok @grok 什么事!

Jack孔@Nano Labs(NA)🇭🇰: 中国考生还是挺厉害的

xAI其他
10:42
Rohan Paul@rohanpaul_ai
60
跨中美国际实验室111页综述:AI应分级探索未知,而非仅提升回答能力

一篇来自中美顶级实验室的111页综述论文提出,AGI需要主动探索未知(认知探索),而非仅提升回答能力。论文将AI进展分为五级:responder(响应者)、reasoner(推理者)、agent(智能体)、prospector(勘探者)和ecosystem(生态系统),每级探索空间更广。核心强调智能体应通过获取有用信息、将困难经验转化为能力、避免过早锁定单一策略来降低不确定性,保持未来路径开放。

智能体论文/研究
10:39
小互@xiaohu
57
苹果全新Siri AI演示:端侧+云端定制Gemini模型

苹果发布全新Siri AI演示,定位为端侧+云端双模型架构。端侧负责调用本机个人信息与感知场景,云端基于Gemini模型定制(非完全采用)以处理复杂任务。Siri升级为独立App,支持自然对话、上下文记忆、跨应用操作,并能理解屏幕内容和摄像头画面。同时,照片、Safari、密码、快捷指令均加入AI功能:照片可重新构图,浏览器标签自动归类,弱密码一键修改,快捷指令一句话生成。

产品更新端侧语音
10:33
Hacker News 热门(buzzing.cc 中文翻译)
47
FrontierCode 在 Hacker News 获 101 分

cognition.ai 的 FrontierCode 项目在 Hacker News 上获得 101 个 points。目前公开信息仅包含项目名称和来源,具体功能、技术细节或性能数据尚未披露。

产品更新编码
10:28
AYi@AYi_AInotes
68
Supervision:4万星开源CV可视化工具

一行命令 `pip install supervision` 即可安装的计算机视觉可视化工具,支持自动画框加标签、视频目标永久跟踪、数据集格式一键转换,内置热力图、区域计数、越线检测、人体骨架等功能,模型无关,已被6500+开源项目使用。

开源/仓库开源生态
10:26
MiniMax (official)@MiniMax_AI
32
在AgentBox上选择M3作为你的基础模型,一键部署,即可获得前沿编码能力、百万token上下文窗口和原生多模态。

GMI Cloud: Today, we are launching GMI Agent Box. A complete infrastructure stack for production-ready AI agents: native Docker, fl...

智能体行业动态部署/工程
10:22
IT之家(RSS)
45
曹操出行计划组建独立AI事业部,拟全面转型为AI原生公司

据《科创板日报》报道,曹操出行计划组建独立AI事业部,全面推动AI战略落地,从移动互联网公司转型为AI原生公司。近期已在招聘平台上线“首席AI官”岗位,负责制定AI战略与技术路线、构建AI核心能力体系、推动业务全链路AI赋能。公开资料显示,该公司2025年总收入202亿元(同比增37.7%),毛利18.9亿元(增59.3%),毛利率9.4%;覆盖195城,月活用户4130万(增43.9%),月活司机63.1万(增35.4%)。Robotaxi已部署超100辆,2026年完全定制Robotaxi亮相,2027年开始量产。

行业动态
10:22
IT之家(RSS)
24
联想推出2026世界杯"补觉卡",员工可提前下班或晚到2小时

联想集团为全体中国区员工推出世界杯“补觉卡”,可在6月12日至7月20日期间任选一个工作日,晚到或提前下班2小时(仅一次)。作为2026 FIFA世界杯合作伙伴,联想与FIFA合作利用生成式AI和3D资产制作球员数字化身,用于越位回放等裁判技术;裁判随身摄像头将向超60亿全球观众提供比赛视角;此外还推出AI知识助手Football AI Pro,为参赛球队提供数据分析。

其他
10:22
IT之家(RSS)
精选71
OpenAI 秘密提交 IPO 申请,奥特曼旗下 Tools for Humanity 裁员

OpenAI 近日秘密提交 IPO 申请。其 CEO 山姆·奥特曼旗下的 Tools for Humanity 公司正裁员,该公司因虹膜扫描项目 World 及加密货币 Worldcoin 知名,投后估值 25 亿美元,获 Andreessen Horowitz 等投资。因营收困境,公司缩减规模。海外监管方面,肯尼亚以隐私和金融风险为由叫停运营,韩国因违反隐私法规罚款 83 万美元。

OpenAI行业动态

推荐理由:OpenAI 终于要上市了,但奥尔特曼的另一个明星项目 Worldcoin 却开始裁员,这反差比眼球扫描仪还刺眼,值得看看 AI 顶流的资本故事和副业困境。
10:17
ginobefun@hongming731
33
BestBlogsDev英文新号与Claude Code一周年进化

洪明为内容推荐平台BestBlogsDev开设英文新号,分享精选博客与创作者内容,个人号保留构建与开发思考。引用推文回顾Claude Code过去一年的演进:从简单的编码助手成长为由数千自主agent组成的网络,可协作测试、修复、部署代码,无需人类逐级指导。AI在12个月内完成了从工具到协作者再到系统级编排者的转变,被视为新工程范式的诞生。

BestBlogs: 1/ Claude Code: One Year Later A year ago, Claude Code was a humble coding assistant - helpful for small dev tasks. Toda...

智能体Anthropic现象/趋势编码
10:15
Bloomberg:Technology(RSS)
59
Fujikura 因 AI 数据中心光缆需求及提价计划有望超越业绩预期

Fujikura 高管表示,得益于 AI 数据中心所需光纤光缆需求持续强劲及提价计划,公司有望超越业绩预期。

行业动态部署/工程
10:15
Bloomberg:Technology(RSS)
54
xAI 从 Starlink 引入高管负责 Grok 训练团队

xAI 从 SpaceX 的 Starlink 卫星互联网服务调来一名高管,负责 Grok 聊天机器人的训练团队,取代了大学生工程师 Diego Pasini。该任命来自内部通知。

xAI行业动态
‹ 上一页
1…3839404142…50
下一页 ›