AIHOT

全部动态

全部一手资讯 X 论文

6月10日周三

6月9日周二

6月10日

00:00

OpenRouter：Announcements（RSS）

精选72

Gemini 2.5 Flash API：定价、快速入门与提供商对比

Gemini 2.5 Flash API 的定价与快速入门指南，指导用户配置 thinking budgets、比较不同提供商，并在 5 分钟内完成首次 API 调用。

Google教程/实践部署/工程

关联讨论 1 条

推荐理由：OpenRouter 这篇把 Gemini 2.5 Flash 的 quickstart 和供应商价格表打包了，5 分钟跑通，价格对比部分尤其实在，想省钱的可以对着选。

6月9日

23:45

Rohan Paul@rohanpaul_ai

Crowdreply 推出 Searchmaxxing，一种让品牌在所有 AI 搜索平台都可见的新策略。Rohan Paul 称这基本上是营销领域的 Claude。

CrowdReply: Introducing Searchmaxxing. The new discipline for being visible everywhere AI looks. Across all platforms. This is how b...

其他大佬观点

23:38

Noam Brown@polynoamial

自 @OpenAI o1 以来，我们就知道 LLM 测试时计算缩放。然而两年后，实验室仍在报告模型的标量评测；安全组织仍对某个脚手架通过 100 倍推理表现更好感到惊讶；而 RSP 在决定关键阈值时仍忽略推理预算。

Noam Brown: http://x.com/i/article/2057694226981257216

OpenAI大佬观点安全/对齐评测/基准

23:26

IT之家（RSS）

WWDC26 苹果推出全面改造的 Siri AI，IDC 称其为 AI 可信度测试

彭博社记者古尔曼报道，苹果在 WWDC26 推出全面改造的 Siri AI，覆盖 iOS 27、macOS 27、watchOS 27 和 visionOS 27。IDC 分析师称 WWDC26 是苹果的 AI 可信度测试，需让 AI 在生态中可信、有用且不打扰用户。发布会期间苹果股价下跌 1.9%。Siri AI 初期仅支持英语，秋季以测试版面向消费者，中国和欧盟用户暂无法使用。IDC 分析师表示这些功能将推动 iPhone 14 及更早机型用户升级。

现象/趋势语音

22:50

SemiAnalysis@SemiAnalysis_

DeepSeek V4 1.6T 第0天至第43天性能随时间变化 - 华为， GB300 NVL72， MI355X， B200 第0天在InferenceX上的推理性能 26天内100倍性能提升每百万Token成本华为950DT推理追踪分析 https：//semianalysis.substack.com/p/deepseekv4-16t-day-0-to-day-43-performance

DeepSeek推理评测/基准部署/工程

22:30

OpenAI Developers@OpenAIDevs

23，000+ 篇 ChinaRxiv 论文现已免费提供，并带有更完整的英文翻译，源于一位开发者用 GPT-5.5 替换了复杂的 OCR 管道。

0.005 Seconds (3/694): http://x.com/i/article/2059815427484655622

OpenAI多模态教程/实践

22:20

The Verge：订阅版科技（RSS）

Apple 的 AI 最佳创意类似氛围编程

Apple 在 Safari 和 Shortcuts 中推出的 AI 功能比 Siri AI 或 Image Playground 更实用，允许用户用自然语言总结网页、编排自动化，带来“氛围编程”体验。

现象/趋势编码

22:20

The Verge：订阅版科技（RSS）

苹果的 AI 承诺终于姗姗来迟

苹果正在全面投入AI智能体，但其迟来多年的承诺能否在当下的AI市场竞争仍是疑问。

智能体现象/趋势

22:13

Ethan Mollick@emollick

纽约时报发布了一场圆桌讨论，参与者包括@DAcemogluMIT、@deanwball、@clarashih和我本人，讨论AI的未来以及谁会在工作中胜出。我认为这是对该话题核心辩论的一个很好的概述，并且包含一些有趣的例子。https：//www.nytimes.com/2026/06/09/magazine/ai-jobs-workforce-labor.html

大佬观点现象/趋势

22:11

小互@xiaohu

苹果Siri自研模型实为Gemini蒸馏产物

苹果Siri由自研基础模型驱动，但该模型通过Google Gemini蒸馏训练而来。Gemini本身不直接驱动Siri，仅在Apple iCloud上提供额外定制支持，且不接入Google搜索，世界知识由苹果自有服务提供。

小互: http://x.com/i/article/2064329494736011265

Google数据/训练行业动态

22:06

Hacker News 热门（buzzing.cc 中文翻译）

为AI明星开发者收拾残局

文章探讨AI明星开发者在快速推进项目后，留下的混乱需要由团队或后续开发者清理的现象，聚焦于技术债务与协作困境。

现象/趋势编码

22:05

Berryxia.AI@berryxia

乔帮主公开X增长秘籍：100到11万粉丝数据分析

乔帮主（@vista8）复盘三年X运营增长，从100粉丝做到11万，基于全量X帖子用Codex进行数据分析，并分享完整PPT。Berry Xia推荐操作步骤：先下载X账户数据（需24小时），再交给Claude或Codex分析，最后结合乔帮主的PPT解读增长路径。PPT下载链接已公开，供用户自行学习。

向阳乔木: 把自己三年来的 X 运营增长做了复盘,做了线下分享。如何从100做到11万关注,基于全量 X 帖子,用 Codex 做的数据分析。有些结论,甚至自己都没有意识到。果然分享才是最好的学习,完整的PPT见评论区。

教程/实践

21:42

The Verge：AI（RSS）

Apple的AI押注成败取决于其隐私承诺

昨日WWDC主题演讲几乎全部围绕AI展开。苹果将其晚入局转化为卖点：不急于发布，是为了做得更正确——即比任何厂商都更注重隐私。新Apple Intelligence功能和更新版Siri AI横跨iPhone、iPad、Mac、Apple Watch和Vision Pro，拥有专属Siri AI应用和类似ChatGPT的聊天体验，新增AI相机和照片编辑功能，并开始引入智能体体验。尽管将云处理扩展到谷歌的服务器上运行，苹果仍声称其云处理与设备端处理一样私密。

安全/对齐现象/趋势

关联讨论 8 条

21:39

Cloudflare Blog

对抗前沿网络模型：Cloudflare 作为"客户零"的架构实践

Cloudflare 在 Project Glasswing 一文中提出，漏洞周围的架构比补丁速度更重要。本文详细阐述了这一架构的设计、它防御的威胁类型，以及 Cloudflare 如何以自家产品作为“客户零”（customer zero）来实际运行这套防御体系。

安全/对齐部署/工程

21:35

DogeDesigner@cb_doge

Sam Altman 非常想成为 Elon Musk。

OpenAIxAI大佬观点

21:20

The Verge：订阅版科技（RSS）

苹果的AI宣传将生死取决于其隐私承诺

苹果的AI能力并非业界最前沿，但其最大的差异化优势在于隐私保护，可能成为市场上最注重用户隐私的AI方案。

安全/对齐现象/趋势

21:11

小互@xiaohu

苹果WWDC 2026发布Siri AI：五个AFM 3模型，端侧200亿参数MoE

苹果在WWDC 2026发布全新Siri AI，由第三代Apple Foundation Models（AFM 3）驱动，共五个模型：端侧AFM 3 Core（30亿）和AFM 3 Core Advanced（200亿MoE，每次激活10-40亿）；服务器AFM 3 Cloud、ADM 3 Cloud（图像）、AFM 3 Cloud Pro（Agent/推理）。核心创新将200亿参数模型塞入手机：权重存闪存，自研Instruction-Following Pruning技术按Prompt路由专家而非逐Token，大幅降低搬运次数。最强算力依赖Google和NVIDIA。

多模态现象/趋势端侧语音

19:55

Hugging Face：Blog（RSS）

精选76

一个Agent如何通过链式调用两个HuggingFace Space构建3D巴黎画廊

一个编码Agent调用HuggingFace上的两个Space，从零构建了展示巴黎地标3D高斯散点图的交互式画廊。Agent先用ideogram-ai/ideogram4生成每个纪念碑的黑色背景图像，再通过VAST-AI/TripoSplat从单张图像重建3D高斯散点（.ply），自动完成坐标系校正、取景、压缩为.ksplat（体积缩小约3倍），并构建基于Three.js的滚动切换、拖拽旋转查看器，最终部署为静态Space。整个过程无需客户端库，每个Space通过`agents.md`暴露可调用API。

智能体Hugging FaceMCP/工具多模态

推荐理由：Hugging Face 把 agents.md 做成每个 Space 的标准说明书，agent 能直接读懂并链式调用图像和 3D 模型，这篇用 3D 巴黎画廊 demo 告诉你这事儿已经跑通了，做 AI 工具链的可以立刻照着试。

19:51

Tencent Hy@TencentHunyuan

精选67

腾讯混元发布UniRL：统一多模态强化学习基础设施

腾讯混元推出UniRL，一个支持统一多模态模型的强化学习基础设施，并发布两个新算法DRPO和Flow-DPPO。UniRL通过单个后训练循环（生成→评分→优势→更新→同步）覆盖扩散/流匹配模型、LLM/VLM及统一多模态模型（如Hunyuan-Image 3和Bagel）。模型与算法作为独立轴，可实现模型×算法的组合覆盖。框架支持可插拔rollout引擎（训练侧/SGLang/vLLM-Omni）、FSDP2分片和三种部署模式。FlowDPPO针对流/扩散模型引入基于精确散度的信任域策略优化；DRPO为LLM RL提供平滑的优势加权二次正则化方法。代码已开源。

多模态开源/仓库论文/研究部署/工程

关联讨论 1 条

推荐理由：UniRL把扩散和LLM的强化学习塞进同一个训练循环，外加两个新算法，多模态对齐的研究者可以立刻fork代码试起来。

19:40

Tibo@thsottiaux

像指挥管弦乐队一样使用 Codex。一次一个 /goal。

Charlie Marsh: Since my last post, I reduced ty's retained memory by another 15% with Codex. We're now at a ~25% memory reduction overa...

OpenAI教程/实践编码

19:40

Tibo@thsottiaux

你是偶尔使用 codex /goal，还是把它作为完成工作的主要方式？

OpenAI其他

19:26

IT之家（RSS）

前钉钉副总裁马锐拉发文《置身钉外》告别阿里

前钉钉副总裁、AI产品负责人马锐拉（汪佳敏）5月15日办完离职手续，告别三年阿里生涯。他在文中提及钉钉内部7.5万字长文《置身钉内》，该文由“ONE”项目核心产品经理滕雅辛执笔，复盘了AI产品从立项、冲高至300万DAU再到收缩的全过程。马锐拉心疼那些认真挣扎过的同事，坦言自己越来越难确认是在创造产品还是消耗身体，曾长期一周工作7天、每天9点到凌晨2点。他称对钉钉爱得深沉，阿里仍是伟大公司，唯一遗憾是无法陪它走完下一个十年。

大佬观点现象/趋势

19:16

Bloomberg：Technology（RSS）

AI公司崛起与日本企业震荡引发泡沫回忆

AI相关公司的崛起与早期互联网泡沫相似，日本企业经历的震荡令人联想起当年的泡沫与破裂。

现象/趋势行业动态

18:46

Bloomberg：Technology（RSS）

机器人浪潮或将缓和美中紧张

美中两国在即将到来的机器人浪潮中各自拥有关键技术，或有助于化解两国间的紧张局势。

具身智能现象/趋势

18:16

Bloomberg：Technology（RSS）

贝莱德 Wei Li 关注 AI 盈利可持续性，称应"有选择且主动"布局

贝莱德首席全球投资策略师 Wei Li 认为，关于 AI 盈利的可持续性存在“值得进行的健康辩论”，并将 AI 相关交易视为一个“需要保持选择性和主动性的领域”。

行业动态

17:55

Hugging Face：Blog（RSS）

精选68

NeuroBait：微调AI助手，为ADHD大脑点燃多巴胺火花

NeuroBait是基于Google gemma-3-12b-it微调的AI对话助手，旨在帮助ADHD患者克服“知道该做什么但无法开始”的执行功能障碍。采用16-bit LoRA（r=16, alpha=16）在Unsloth上训练3个epoch，学习率2e-4，最大序列长度2048，使用单张H100 80GB GPU。数据集为基于真实ADHD场景手工合成的少量数据。部署于Hugging Face Space（ZeroGPU），使用Gradio和标准transformers+peft，运行时以4-bit NF4加载基础模型并应用LoRA适配器。NeuroBait不生成待办清单，而是根据用户上下文给出3-6句温暖流畅的回复，引导用户找到一件微小可立即执行的动作，从而激发多巴胺、降低启动阻力。

Hugging Face教程/实践数据/训练

推荐理由：对ADHD群体来说，这是一次真正从需求出发的AI尝试。它不做计划列表，而是用一个温暖的动感火花打破僵局，让AI从理论走向陪伴。如果你或身边人容易'卡住'，可以试试这个Space。

17:40

公众号：通义实验室（千问）

精选67

仅凭一份文档，Qwen3.7-Max 从 0 交付双端应用

在无设计稿和后端代码的条件下，Qwen3.7-Max 仅凭一份约 15 万字的产品调研文档，于隔离环境中全自动完成移动端与 Web 端两套真实应用从 0 到 1 交付，单端耗时约 4 小时，中途无人工接管。模型不具备图像理解能力，通过像素坐标反推布局约束实现界面还原。实验采用“分阶段注入约束→逐层验收→带错纠正”的闭环控制系统：任务拆分为规划、架构、编码等阶段，验收覆盖静态检查、编译自检（0 error）、路由完整性（Web 端 34 条路由全部可达）、功能扫描及真机冷启动冒烟。失败时错误文本自动注入下一轮重试，使模型数小时内收敛。移动端产出可安装 APK，Web 端 typecheck 与构建均通过。

智能体教程/实践部署/工程

关联讨论 1 条

推荐理由：通义实验室没有炫技分数，而是把 Agent 逼到了长程交付的极限，约束闭环这套方法论比模型本身更值钱，所有做 Agent 开发的都该读一遍。

17:19

Artificial Intelligence News（RSS）

自主AI智能体在DevOps中的数据丢失风险：构建高效防御

自主AI智能体在加速软件交付的同时，也大幅缩短了从失误演变为灾难的时间，给安全策略造成盲区。威胁不再仅来自外部勒索软件或恶意内部人员，而是来自被授权的内部工具本身。文章探讨了在DevOps中针对这一风险构建有效防御的做法。

智能体安全/对齐部署/工程

17:18

歸藏(guizang.ai)@op7418

最近 Skill 做多了，感觉对于 skill 有点新的领悟，找时间写个文章聊聊。

智能体其他

17:05

Berryxia.AI@berryxia

瑞幸咖啡推出CLI/Skills/MCP服务

瑞幸咖啡（Luckin Coffee）近日开放CLI、Skills和MCP服务，用户可通过安装地址（open.lkcoffee.com）体验。此前“饺子馆的Skills”已引发关注，瑞幸紧随其后提供一整套开发者工具，支持命令行下单等操作。目前具体功能细节尚未完全披露。

MCP/工具现象/趋势

16:42

MarkTechPost（RSS）

精选70

NVIDIA cuTile Python 教程：在 Colab 中构建用于向量加法、矩阵加法和矩阵乘法的 Tiled GPU 内核

该教程基于 NVIDIA cuTile Python 实现了分块 GPU 内核编程工作流，在 Colab 环境中配置 GPU、驱动、CUDA 及 cuTile 可用性后，分别构建了 tiled 向量加法、矩阵加法和矩阵乘法核函数，并以 PyTorch 作为回退保持 notebook 可执行。每一步均通过 PyTorch 验证结果正确性，并基准测试了各阶段的中位运行时间。

教程/实践编码

推荐理由：NVIDIA cuTile把GPU tiled kernel编程的门槛拉低到Python，这个Colab教程从环境搭建到矩阵乘法全链路，想自己写算子的人可以跟着跑一遍。

16:10

向阳乔木@vista8

Vista 用 Codex 复盘 X 运营增长经验

运营者 Vista 复盘自己三年间 X 账号从 100 关注增长至 11 万的全过程。基于全量 X 帖子，使用 Codex 进行数据分析，得出一些甚至自己都未意识到的结论。分享被视为最好的学习方式，完整 PPT 置于评论区。

教程/实践数据/训练现象/趋势

16:05

Berryxia.AI@berryxia

向阳乔木: X 上两个好友的新书,京东都有售卖,推荐! 宝玉老师 @dotey 王树义老师 @wshuyi 三年前因为AI开始在推特活跃,能快速到1w关注,主要靠 @HiTw93 和宝玉老师的转帖分享。近两年在天津时间多,有幸跟王树义和丁师傅 @d...

其他

15:05

Berryxia.AI@berryxia

Berry Xia在书店咖啡馆观察到，约80%的大学生使用苹果电脑或iPad，其中一半人正在用AI工具学习或工作，少数人使用ChatGPT纯聊天模式，但无人使用Claude或Codex等更专业的AI工具。他指出"豆包高效学习"成为热门，但整体AI应用仍处于早期阶段。

Berryxia.AI: 刚刚去书店呆了一会,喝了杯咖啡。 Vibe Coding了一会,发了一会呆。找了点灵感~ 转头看到这里面很多的大学生或者附近上班or OPC的人,80%的人使用的苹果电脑或者iPad ! 对一半的人在使用AI工具进行学习或者工作,有几个...

现象/趋势

14:46

Bloomberg：Technology（RSS）

黄仁勋力挺英伟达供应商为何令人担忧

英伟达CEO黄仁勋针对公司供应商提出的投资建议过于乐观，Bloomberg Opinion专栏作者Shuli Ren认为，市场需要的是具体指引，而非这种过度乐观的表态。

现象/趋势

14:08

Tibo@thsottiaux

每月提醒：你不应再手动提示编码智能体了，而应设计循环来驱动它们。有人已经在写嵌套循环了吗？

Peter Steinberger 🦞: Here's your monthly reminder that you shouldn't be prompting coding agents anymore. You should be designing loops that p...

智能体教程/实践

14:05

Berryxia.AI@berryxia

Loop Engineering：AI系统各环节环环相扣

设计真正的AI系统涉及大量工程细节，提示词工程、上下文工程、记忆模块、skills等环节缺一不可，彼此环环相扣形成了一个完整系统。Berry Xia引用了一篇关于Loop Engineering的清晰阐述，强调这些组件的系统性整合才是关键。

Cell 细胞: http://x.com/i/article/2064143847765020672

大佬观点部署/工程

13:22

数字生命卡兹克@Khazix0918

苹果WWDC 2026：AI为主轴，Siri AI发布，与Gemini深度合作

苹果WWDC 2026落幕，核心仍是AI。Apple Intelligence新架构：与Google Gemini合作开发5个模型；端侧分AFM 3 Core（3B）和AFM 3 Core Advanced（20B MoE）。新Siri正式命名Siri AI，基于系统编排器融合上下文理解、App Actions、屏幕感知等能力，支持连续对话、跨平台同步及独立App，但未展示自主Agent能力。视觉智能、全系统听写、写作工具等同步更新。目前仅支持英语，国区不可用，可用时间未知。

MCP/工具多模态大佬观点语音

13:07

Noam Brown@polynoamial

Noam Brown：大规模测试时计算对LLM评估的影响

Noam Brown指出，LLM基准性能日益依赖测试时计算，当前标准评估因忽略推理预算而低估模型能力。以GPT-5.5与GPT-5.4为例：控制测试时计算后，5.5表现远超5.4。Karpathy的自动化实验和AISecurityInst的网络评估均显示，即使消耗超1亿token，强模型性能仍持续提升。Brown建议改用性能-测试时计算曲线评估，安全评估也应计入推理预算，如Gemini 3 Deep Think发布时未配套风险说明，关键在于业界未统一考虑测试时计算。

OpenAI大佬观点安全/对齐推理

13:05

Berryxia.AI@berryxia

Claude 通过 Apple ID 虚拟邮箱电脑端登录解决方法

Claude 用户 Berry Xia 分享了一则登录技巧：如果用 Apple ID 虚拟邮箱（一长串随机地址）创建过 Claude 账号，手机端可正常使用，但电脑端无法直接选择该邮箱登录。解决方法：在设置中复制虚拟邮箱地址，在电脑端选择“使用邮件登录”并粘贴该地址，系统会向原始 Apple ID 邮箱发送登录链接，点击链接即可完成登录。该方法也可用于注册 Claude 账号。

Anthropic教程/实践