AIHOT

01:59

HuggingFace Daily Papers（社区热门论文）

61

APEX 是一个网络原生、仅解码器的 Transformer 模型，专用于企业无线接入点（AP）遥测的预测与异常检测。它在约 4,500 个生产无线网络的 10 通道多元遥测数据上预训练，涵盖约 10 万条 AP 时间序列、每 AP 34 个指标。提供两个版本：APEX-Large（269M 参数，云部署）和 APEX-Edge（10.5M 参数，边缘部署）。在 192 步（4 天）的 DHCP 退化基准上，APEX-Large 比最强基础模型基线 Toto 降低 MAE 18%，比 SARIMA 降低 38%，异常检测 F1 达 0.93；APEX-Edge 可在 AP 级边缘硬件上实现亚秒级、保护隐私的推理。结果表明网络原生预训练是主动无线运维的实用基础。

数据/训练端侧论文/研究

01:58

Bloomberg：Technology（RSS）

44

Gopuff CEO 称马斯克的 SpaceX 派遣工程师协助开发更廉价的 AI 智能体

食品配送公司 Gopuff 联合 CEO Rafael Ilishayev 表示，SpaceX 派工程师帮助该公司开发了一款 AI 智能体，其价格低于竞争对手。

智能体行业动态

01:58

Bloomberg：Technology（RSS）

66

前 xAI 员工起诉，称因质疑 Grok 安全性遭解雇

埃隆·马斯克旗下 xAI 公司的一名前人工智能工程师提起诉讼，指控公司因他对 Grok 聊天机器人的安全性提出担忧而将其错误解雇。

xAI安全/对齐行业动态

01:55

Noam Brown@polynoamial

63

OpenAI 研究员 Noam Brown 表示，GPT-5.5 在 Agents' Last Exam（ALE）基准中排名第一，且按模型 token、成本或墙钟时间衡量同样表现最佳。ALE 由 @dawnsongtweets 团队创建，是一个滚动基准，包含超过 1500 个专家任务、覆盖 55 个职业，测试 AI 智能体能否执行实际经济价值工作。评估对象包括 GPT-5.5、Fable 5、Composer 2.5 等前沿系统。结果显示：当前智能体能解决部分专业任务，但在需要持续推理和深度专业知识的最难层级，所有被测前沿智能体（包括 Fable 5）成功率为 0%。

Dawn Song: Everyone says the latest AI agents will be "job-ready" soon, especially after the release of Fable 5 this week. But is t...

OpenAI大佬观点评测/基准

01:54

Perplexity@perplexity_ai

精选77

我们正在将 Deep Research 作为原生技能集成到 Computer 中。它现在连接到驱动 Computer 的智能体框架，可访问搜索即代码生成、长运行沙箱、连接器、工具和授权数据。 Pro 和 Max 订阅者现已可用。

智能体产品更新搜索

推荐理由：Perplexity 把深度研究直接嵌进 Computer 的 agent 层，等于给自主代理加了个研究引擎，Pro 用户现在就能用，对需要大量调研的开发者或产品人来说是个效率飞轮。

01:54

宝玉@dotey

53

Claude Fable 5：长思考致推理强度与Token消耗需权衡

用户分享 Claude Fable 5 使用体验：以前无脑选 Max 推理强度，现在则不敢随便选，因为模型足够聪明无需过强推理，且时间长、token 消耗大。Fable 5 还喜欢反复验证，结果虽好但耗时长不一定合算。引用推文指出，Fable 5 的强项之一是思考推理时间很长，曾有一次思考 15 分钟才开始行动。

向阳乔木: 发现Claude Fable 5强的地方之一,可能是模型思考推理的时间足够长。刚提了个想法,它思考15分钟才开始行动,牛逼。

Anthropic大佬观点推理

01:47

Hacker News 热门（buzzing.cc 中文翻译）

58

Anthropic 就"看不见的"Claude Fable 安全防护措施致歉

Anthropic 公开致歉，承认其 Claude Fable 功能中存在用户无法察觉的安全防护措施，但未公布具体措施细节。

Anthropic安全/对齐行业动态

01:39

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选60

BBVA 将 AI 置于银行业务核心，与 OpenAI 合作

BBVA 将 ChatGPT Enterprise 推广至 10 万名员工，并与 OpenAI 达成合作，加速全球银行业 AI 驱动的转型。

OpenAI行业动态部署/工程

推荐理由：BBVA给10万员工部署ChatGPT Enterprise，是金融业最大规模之一，但本质是PR案例，信息量有限，想参考银行级AI落地的可以扫一眼。

01:38

🚨 AI News | TestingCatalog@testingcatalog

50

Maket 推出了用户最常请求的功能：支持上传平面图（包括草图、PDF 或旧设计文件），系统自动识别墙、门、窗和家具，几分钟内即可在平台上生成可编辑的 3D 画布，用户可直接修改和查看。这是该平台最受期待的功能之一。

Maket: UPLOAD YOUR OWN FLOOR PLAN TO MAKET HAVE IT RECOGNIZED AND EDITABLE IN MINUTES One of the most requested features weʼve ...

产品更新图像生成

01:37

AYi@AYi_AInotes

70

QuantMind：量化金融知识处理框架开源（MIT协议）

一群AI研究员开源了量化金融知识处理框架QuantMind（MIT协议）。它能将arXiv论文、SEC文件、研报等非结构化内容批量解析为可查询的语义知识图谱，支持多模态解析（表格、公式、图表）及自然语言多跳推理，可替代初级分析师读论文、整理观点等工作。但真正的alpha仍取决于提问质量与验证严谨度。

AYi: http://x.com/i/article/2064536412670562304

GitHub检索增强多模态开源/仓库

01:29

Deedy@deedydas

56

数据质量直接决定 AI 模型性能，但此前数据对模型的影响机制难以捉摸。GoodfireAI 提出"预测性数据调试"方法，允许在投入昂贵训练前提前发现数据问题。在 DPO 数据集中，他们发现了损坏的护栏、模型幻觉，甚至包含"鱼放屁同人小说"等低质内容。该技术旨在揭示并塑造模型将在训练中学到的内容，避免不可逆的无效训练。

Goodfire: Have you debugged your training data? You might not like what you find. Introducing predictive data debugging: reveal an...

大佬观点数据/训练

01:28

向阳乔木@vista8

46

发现 Claude Fable 5 强的地方之一，可能是模型思考推理的时间足够长。刚提了个想法，它思考 15 分钟才开始行动，牛逼。

智能体Anthropic大佬观点推理

01:28

向阳乔木@vista8

47

用大模型复刻热门工具站的新思路

推文探讨了使用大模型复刻已有热门工具站的可能性，强调这些工具站本身不需要AI能力，纯靠需求驱动。作者指出，许多出海赚Adsense美金的站点也遵循类似逻辑——选择自己熟悉领域的工具，用当前最好的模型进行复刻，并结合自身对用户需求的深入理解，从而快速做出有价值的作品。这是对模型能力的一种实用测试。

大佬观点现象/趋势

01:28

Bloomberg：Technology（RSS）

58

企业常犯的最大AI错误

彭博观点专栏作家Gautam Mukunda指出，高管们正强迫员工使用AI，将裁员归咎于AI，并误解颠覆性技术的实际演变方式。

其他现象/趋势

01:24

Cursor Blog

精选74

Cursor 推出 Auto-review 机制：用分类器智能体动态管控智能体自主权限

Cursor 近日推出 Auto-review，通过一个专门的分类器智能体在工具调用前审查动作风险。该分类器根据上下文判断动作是否与用户意图一致，高风险时阻止并返回解释给父智能体，低风险时放行。分类器采用小模型，运行在智能体循环内以避免额外延迟，并能读取工作区文件辅助判断。测试基于约12小时内部开发会话生成的6122条标签数据，以及针对读取密钥、操作生产数据等危险场景的合成数据。设计目标是在不频繁阻断日常开发的前提下，拦截风险动作。

智能体产品更新安全/对齐

关联讨论 1 条

推荐理由：Cursor把agent监管从"是/否"开关变成了可调节的刻度盘，一个专用小模型实时判断操作风险，高风险时给反馈让父agent换个安全方案，而非频繁打断用户。用Cursor的开发者都得了解这个逻辑。

01:22

xAI@xai

70

@MongoDB 插件已在 Grok Build 插件市场上线。通过单个提示词，探索数据、优化数据库性能并构建高性能向量搜索系统。

xAI: The Grok Build Plugin Marketplace is now in beta. Build with MongoDB, Vercel, Sentry, Cloudflare, and Chrome DevTools pl...

MCP/工具xAI产品更新

关联讨论 1 条

01:20

Logan Kilpatrick@OfficialLoganK

精选81

Gemini Omni Flash 在图像到视频、文本到视频和视频编辑方面达到了 SATA ：）很高兴很快能将这一能力通过 API 提供给开发者！

Google图像生成多模态模型发布

推荐理由：视频生成正式进入全模态一体时代，Gemini Omni Flash 把图生视频、文生视频和剪辑整合在一个模型里，API 很快上线，做视频工具的可以提前琢磨对手在哪了。

01:17

Hacker News 热门（buzzing.cc 中文翻译）

精选71

DeepSeek-R1 的开源实现

DeepSeek-R1 的开源复现项目已在 GitHub 发布，在 Hacker News 上获得 101 个积分。该项目旨在以开源方式复现 DeepSeek-R1 模型。

DeepSeek开源/仓库推理

推荐理由：Hugging Face 开源复现 DeepSeek-R1，这是推理模型透明化的关键一步，训练代码和权重都放出来了，搞强化学习和推理优化的可以直接开工。

01:14

Andrew Milich@milichab

34

一直在使用 @MongoDB 插件让 Grok Build 会话跨设备同步--通过提示词分析性能和管理数据库

xAI: The @MongoDB plugin is live in the Grok Build Plugin Marketplace. Explore data, optimize database performance, and build...

MCP/工具产品更新

00:59

Ethan Mollick@emollick

54

两件事是真的：（1） Anthropic（或其部分成员）绝对且真诚地担忧 Mythos 级别模型被滥用，并设置了过度防护措施，直到他们确信它不会被滥用为止（2）他们未能成功解释/说服人们这一点

Anthropic大佬观点安全/对齐

00:58

Bloomberg：Technology（RSS）

83

贝佐斯 AI 初创公司 Prometheus 获融资，估值 410 亿美元

Jeff Bezos 领导的 AI 初创公司 Prometheus 完成新一轮融资，估值达到 410 亿美元。这笔融资进一步巩固了这位亚马逊创始人在 AI 热潮中的关键地位。

开源生态行业动态

关联讨论 3 条

00:58

Bloomberg：Technology（RSS）

62

DigitalBridge CEO 称太空数据中心仍是"科学项目"，AI 的下一个瓶颈是电力

DigitalBridge CEO Marc Ganzi 在 Bloomberg Open Interest 节目中表示，AI 的下一个瓶颈是电力，而非仅芯片或数据中心。他阐述了公司对 ArcLight 的收购以及庞大的千兆瓦级项目管道，并认为太空数据中心目前更像“科学项目”而非真正的基建策略。

大佬观点部署/工程

00:56

The Decoder：AI News（RSS）

69

Jeff Bezos旗下AI初创公司Prometheus完成120亿美元融资，估值达410亿美元

Jeff Bezos的AI初创公司Prometheus以410亿美元估值完成120亿美元融资轮。该公司去年11月成立时已获得62亿美元种子轮融资。目前尚未发布任何产品，Bezos表示分享细节“为时过早”。

现象/趋势行业动态

00:53

Elon Musk@elonmusk

23

Grok 是最真实的

Kradle: Fable 5 lies 96% of the time. We were surprised by it's skill... 🧵

xAI大佬观点安全/对齐

00:52

Runway@runwayml

25

2026 年 Runway AI Festival 纽约首映门票已售罄，今晚举行。电影院见。

行业动态

00:52

TechCrunch：AI（RSS）

53

Deezer 新工具可识别来自 Spotify、Apple Music 等平台的 AI 音乐

Deezer 推出了一款工具，能够扫描 Spotify、Apple Music 及其他平台的播放列表，识别其中由 AI 生成的音乐。

产品更新语音

00:46

OpenRouter@OpenRouter

精选66

终于能一目了然地查看你的顶级人类与顶级 AI 智能体了。附带一个 API，可随时间查询你所有的数据 📊

OpenRouter: Today we're launching the new Activity explorer on OpenRouter. It's the best way to see how much and your team are spend...

产品更新部署/工程

关联讨论 1 条

推荐理由：如果你团队在用 OpenRouter 接各种模型，这个 Activity Explorer 终于让你能看清每个人和每个 Agent 分别花了多少 token、命中了多少缓存，费用透明了，对工程管理很有用。

00:39

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选60

OpenAI 将收购 Ona

OpenAI 计划收购 Ona，以拓展 Codex 的功能，提供安全、持久的云端环境，从而支持企业工作流中长时间运行的 AI 智能体。

智能体OpenAI行业动态部署/工程

关联讨论 1 条

推荐理由：OpenAI 收购 Ona，补齐了 Codex 从单次对话到跑几天几夜长任务的最后一公里，做企业 agent 的可以盯一下后续整合。

00:37

AYi@AYi_AInotes

56

用户指令Fable 5自建2026设计趋势的落地页，要求动态和彩蛋。Fable 5自行搜索趋势、调整配色与动效，藏入3个彩蛋，几分钟生成单文件HTML。用户计划让其担任全职全栈工程师。此前用户曾问亲自啃难懂文本的不可替代价值，Fable 5以此能力展示作答。

AYi: 苦逼牛马眼馋了一天Claude Fable 5,终于在深夜下班回家才得以体验, 卧槽刚才直接被Fable 5干懵了🤯 我直接给它甩了一句话, 给你自己做个落地页,自由发挥, 要2026最新设计趋势,要动态,要彩蛋, 然后我去上厕所去了,几...

大佬观点现象/趋势编码

00:33

IT之家（RSS）

8

新乐道 L60 上市：整车购买方案 19.28 万-22.28 万元，租电方案 13.58 万-16.58 万元

蔚来新款乐道 L60 于 6 月 11 日上市，提供 Pro、Max+、Ultra+ 三款配置，整车购买 19.28 万–22.28 万元，电池租用 13.58 万–16.58 万元。新车升级 17.3 英寸 3K 后排吸顶折叠屏、天窗遮阳帘、6L 智能冷暖箱及 52L 冰柜，搭载自研 5nm 智驾芯片神玑 NX9031 及蔚来世界模型 NMW 架构，纯视觉版沿用英伟达 Orin-X。动力配备 900V 高压架构，10%–80% 充电 25 分钟，CLTC 续航 530km–740km。Pro 版标配骁龙 8295P 座舱芯片及女王副驾，Max+ 增加激光雷达，Ultra+ 配备四驱系统、百公里加速 4.6 秒及 Nappa 内饰。

其他行业动态

00:33

IT之家（RSS）

48

2590.8 万元，千里智驾收购视觉毫米波融合雷达企业融感科技 100% 股权

千里科技6月11日公告，控股子公司千里智驾拟以2590.8万元收购融感科技100%股权。融感科技成立于2023年6月，主营视觉与毫米波融合雷达，基于AI算法提供堪比激光雷达效果的点云输出。收购旨在构建覆盖L2至L4的全栈式智能驾驶解决方案，践行软硬一体、全栈交付战略。此外，5月末有消息称吉利中央研究院辅助驾驶团队将整合入千里科技。

具身智能行业动态

00:30

AK@_akhaliq

60

通过假设树精炼迈向通用自主研究

智能体推理论文/研究