AIHOT

06:16

Orange AI@oran_ge

66

AI带来的并非平权，而是K型分化。头部用户已默认理解Agent的组成：文档、规则、memory、loop、MCP、CLI、工具调用、权限、安全沙箱、上下文工程、定时任务、心跳、文件系统、代码执行和Skill；普通用户只知道"Agent能写代码"。做好Skill是跨越鸿沟的唯一解法。作者正与藏师傅一起通过Cola帮助大众真正跨越鸿沟。

歸藏(guizang.ai): http://x.com/i/article/2065096982310567936

智能体现象/趋势

06:14

Replit ⠕@Replit

18

Replit 正在接管纽约，我们迫不及待在 #Vibecon 与你相见。为期两天的艺术、代码与文化潮流引领者盛宴。详情请见 http：//vibecon.ai @BrandNewSchool

行业动态

06:04

Rohan Paul@rohanpaul_ai

53

《从AGI到ASI》--Google DeepMind论文

Google DeepMind新论文提出从通用人工智能到超级智能的四条路径：持续扩展（计算、模型规模、数据、测试时推理）、算法范式革新（超越Transformer架构）、递归自我改进（AI加速自身研发）、多智能体集体智能（众多专业AI智能体协作出超人类智能）。扩展可能遇到数据、算力、能源瓶颈；递归改进最不确定；多智能体路径最易被低估，通过专业化与协调能超越单个强模型。ASI可能不是单次跃迁，而是AI辅助创造更好AI的加速链。

智能体推理论文/研究

05:49

Hacker News 热门（buzzing.cc 中文翻译）

49

Tailwind 和 Slop 应用

Hacker News 上一则标题为“Tailwind and slop apps”的帖子于 06-12 发布，获得 100 点热度，引发社区对 Tailwind 与 Slop 应用的讨论。

现象/趋势编码

05:48

Google AI Developers@googleaidevs

59

通过 Gemini Live API 中的 Gemini 3.5 Live Translate，为你的应用添加近实时语音翻译。🎙️ 观看模型如何处理实时直播流和翻译，包括连续语音到语音流（S2ST）和同步转录文本，让用户能以母语收听全球广播节目。

Google产品更新语音

05:46

Orange AI@oran_ge

19

AI高速对话加剧ADHD，如何拯救前额叶？

观察到身边朋友同事的ADHD（注意力缺陷多动障碍）越来越严重：容易被琐事分散注意力，对大问题视而不见，关掉通知、沉浸大事变得不可能，进入心流也变难。AI的高速执行加重了这一问题——每两三分钟一次的对话，形成注意力集中与涣散的交替循环。推文最终发问：该如何拯救自己的前额叶？

其他现象/趋势

05:43

MiniMax (official)@MiniMax_AI

精选82

MiniMax M3 发布，具备前沿编码与智能体能力，原生图像视频输入和计算机使用，1M-token 上下文。核心采用 MSA 稀疏注意力：每个 query 评分 128-token KV 块，仅对 top 块做注意力。vLLM 当日即支持 M3，包括专用 MSA prefill/decode 核、前缀缓存与分块 prefill、BF16 和 MXFP8 检查点、Hopper 与 Blackwell 的 MoE 后端，并在 NVIDIA 与 AMD 硬件上验证。同时支持原生多模态输入、工具调用、推理解析和思考模式控制等智能体工作负载。

vLLM: 🎉 Congrats to @MiniMax_AI on releasing MiniMax M3! Frontier coding and agentic capabilities, native image and video inp...

多模态开源生态推理模型发布

关联讨论 1 条

推荐理由：M3把1M上下文从‘理论上能做’变成了‘今天就能部署’，MSA稀疏注意力是关键，开源社区和推理框架的深度合作值得关注。

05:40

OpenRouter：Announcements（RSS）

精选59

如何在OpenRouter上获得最低成本的LLM推理

在OpenRouter上追加`:floor`可获取最便宜提供商，通过`max_price`设定花费上限，并可免费使用20多个零成本模型。同时需注意避免计费陷阱。

推理教程/实践部署/工程

推荐理由：我觉得这篇教程对 OpenRouter 重度用户有用，floor 参数和 max_price 是控制成本的实用技巧，但信息量不大，当作使用手册就行。

05:28

MarkTechPost（RSS）

58

Google 发布 Gemini-SQL2：Gemini 3.1 Pro Text-to-SQL 在 BIRD 单模型排行榜上取得 80.04% 执行准确率

Google Research 于 2026 年 6 月 12 日发布 Gemini-SQL2，基于 Gemini 3.1 Pro 驱动的文本转 SQL（Text-to-SQL）能力，在 BIRD 单模型排行榜上达到 80.04% 的执行准确率。

Google推理模型发布编码

05:13

MiniMax (official)@MiniMax_AI

73

MiniMax 开源 M3 模型，约 428B 总参数、23B 激活参数，支持前沿编码、长周期智能体任务及原生多模态（文本、图像、视频），上下文窗口达 1M token。开放权重，可在 Baseten 部署。在少于 500B 参数的模型中，能同时兼顾编码、智能体工作负载和 1M 上下文的模型极少，M3 全部实现。

Baseten: Congrats to the MiniMax team on the open-source launch of M3! There are very few <500bn parameter models that can tackle...

多模态模型发布编码

05:13

MiniMax (official)@MiniMax_AI

47

MiniMax M3 现已登陆 FactoryAI Droid。

Factory: MiniMax M3 has arrived in Droid.

产品更新

05:13

🚨 AI News | TestingCatalog@testingcatalog

49

Claude Convey Agent 将作为 Labs 项目发布，类似于 Claude Design。 > Conway 是一个由 Claude 管理的 Agent，将在远程容器中运行。 > 用户将为 Conway 安装不同的自定义 UI 标签和插件。而且它可能比你想象的更大 👀

智能体Anthropic产品更新

05:10

Peter Steinberger 🦞@steipete

52

Peter Steinberger 指出 GPT 在 token 消耗和成本上比 Fable 高效 10-20 倍，且能达到相似结果。@thorstenball 的对比测试印证：让 Fable 和 deep^2 完成相同的 CLI、Web 服务器等多端功能，deep^2 花费 $20（首次未通过但可修复），Fable 运行 1 小时 40 分、花费 $350（首次成功）。后续追问后 Fable 总花费达 $457，deep^2 预计最多 $40，差距约 17 倍。

Thorsten Ball: Day 3 with Fable. Gave a huge prompt to implement a feature across CLI, web server, and another server to both Fable and...

智能体OpenAI大佬观点编码

05:03

Ethan Mollick@emollick

63

10个月后，Ethan Mollick 再次向 Claude Code 和 Fable 下达同一指令--根据幸存截图和文档重建失传的 Maxis 模拟游戏 SimRefinery。新版本完全可玩，包含学习模式等多种复杂功能，与10个月前 ChatGPT Codex 仅凭一篇文章和截图快速搭建的可玩原型形成鲜明对比。当时他未写一行代码，仅偶尔提小修改请求。

Ethan Mollick: I gave ChatGPT Codex an article & screenshot from a famous, lost Maxis simulation, SimRefinery, and asked it to create i...

Anthropic现象/趋势编码

04:55

Suno@suno

33

Lay Bankz 如何将几个键盘音符转变为一段迷幻摇滚采样。

教程/实践

04:54

TechCrunch：AI（RSS）

59

谷歌起诉中国网络犯罪团伙 Outsider Enterprise：利用 AI 诈骗数十万受害者

谷歌起诉名为“Outsider Enterprise”的中国网络犯罪团伙，指控其利用人工智能技术实施诈骗，受害者达数十万人。该团伙在两周内发送了约 250 万条诈骗短信。

Google行业动态

04:52

Chubby♨️@kimmonismus

49

Apple用NVIDIA机密计算在谷歌云保护推理隐私

Kim解释Apple如何在Google Cloud上执行推理时保护隐私：最重的请求运行在Google Cloud的Blackwell B200s上，利用NVIDIA Confidential Computing提供基于硬件的安全层，将工作负载隔离在可信执行环境中加密处理数据，确保Google和Apple都无法看到数据。

大佬观点推理部署/工程

04:49

Hacker News 热门（buzzing.cc 中文翻译）

69

如何在macOS上设置本地编码代理

来自ikyle.me的教程，指导在macOS上搭建本地编码代理，获Hacker News社区104个点赞。

教程/实践端侧编码

04:48

Microsoft Research@MSFTResearch

15

Project Ire 分析了一个及时的恶意软件样本，并通过逆向工程确定其意图--识别出 LOTUSLITE 特征，即使大多数主流 EDR 工具未检测到它。https：//msft.it/6011viy4N

Microsoft其他

04:43

OpenCode@opencode

50

Kimi 2.7 Code 现已在 Go 中可用文本 · 图像 · 针对编码优化定价与 2.6 相似

产品更新编码

04:38

elvis@omarsar0

62

GoogleResearch推出Gemini-SQL2，基于Gemini 3.1 Pro，在BIRD benchmark上达到Text-to-SQL的SOTA结果，能将自然语言翻译为可直接执行的SQL查询。DAIR.AI的Elvis Saravia指出，现实世界数据复杂混乱，尽管强推理模型表现不错，但定制模型（如Gemini-SQL2）在此类任务上更胜一筹。他认为在知识库、搜索、图数据库等领域也存在类似机会，BIRD是一个非常具有挑战性的基准。

Google Research: 🚀 Introducing Gemini-SQL2, our breakthrough text-to-SQL capability powered by Gemini 3.1 Pro! We've achieved state-of-t...

Google数据/训练模型发布

04:21

Chubby♨️@kimmonismus

24

观察图表，我认为 Fable 5 只会保持领先直到 GPT-5.6。其次，我认为该基准测试很快就会完全饱和。

Epoch AI: Claude Fable 5 scores very well on FrontierMath: Tiers 1-4 (v2), reaching 87% on Tiers 1-3 and 88% on Tier 4. This conti...

AnthropicOpenAI推理评测/基准

04:19

Hacker News 热门（buzzing.cc 中文翻译）

51

"你直接上传到ChatGPT不就行了？"

Hacker News 上一则帖子的标题为“你直接上传到ChatGPT不就行了？”，获得了101个HN点。该帖子引用了用户常被询问的一句话，暗示直接向ChatGPT上传文件以完成任务的普遍做法。

OpenAI现象/趋势

04:16

fofr@fofrAI

40

我正在尝试一种智能体流程，将Hyperframes与Gemini视频分析相结合，制作有趣的注释视频。

智能体Google教程/实践