AIHOT

5月26日

09:54

向阳乔木@vista8

推文指出，仅安装Waza技能集不够，需将其配置写入Agent.md文件，以便AI智能体更好地触发和应用。Waza是一个将工程习惯转化为技能的集合，近期吸收了大量真实项目经验，现已适用于Mac原生应用、CLI工具、Rust及Web开发。它支持Claude Code、Codex、Cursor和Pi作为智能体运行时，包含25个反模式，具备破坏性命令安全防护，并将获取内容视为不信任数据。其特点为8个技能、无框架、无遥测。安装更新可访问其GitHub仓库。

Tw93: 🥷 Engineering habits you already know, turned into skills AI agents can run. Waza absorbed a mass of real project lesso...

智能体GitHub教程/实践

09:48

karminski-牙医@karminski3

智谱GLM-5.1-highspeed发布，实时语音编程响应仅需3秒

智谱发布了推理速度极快的GLM-5.1-highspeed版本。测试者发现其生成代码的速度已超过人类打字速度，因此构建了一个语音转文本的编程交互场景。从用户说完语音指令到代码修改完成、页面渲染，整个链路（包括语音识别、模型判断并发与prefill、tool call修改代码）耗时约3秒。这种量级的速度提升带来了全新的实时交互可能性。该模型目前正向部分企业用户提供内测。

编码评测/基准语音

09:31

ginobefun@hongming731

推文倡导关注AI领域的实际构建者（Builder）而非单纯的意见领袖（Influencer）。核心内容为一份推荐关注名单，涵盖了来自OpenAI、Anthropic、Google等主要AI公司，以及Replit、Vercel、Cursor等AI工具/产品线的关键人物，包括工程师、产品负责人、哲学家及CEO。引用内容强调此名单的价值（含金量）正在持续上升。

木马人2.0: 这条推文的含金量还在上升 Follow Builders, Not Influencers~ @karpathy - 前 OpenAI/Tesla AI,现 Eureka Labs,AI 教育传奇 @swyx - AI Engineer 运...

教程/实践现象/趋势

09:31

ginobefun@hongming731

BestBlogs 早报：Claude Code 实践、AI 自动化悖论、百川医疗 AI

Anthropic 工程师 Ara 分享内部使用 Claude Code 的三项核心实践：将规格说明升级为 HTML 以提升结构密度；让模型通过 ask_user_question 工具主动采访需求；采用智能体原生 DOM 验证框架，实现人工、Opus 4.7 无头浏览器及 CI/CD 的统一验证。Every 公司 CEO Dan Shipper 用团队一年内从 15 人扩张至近 30 人的数据，反驳 AI 会大规模裁员的叙事，认为自动化反而催生需求增长与质量管控需求。百川智能创始人王小川透露，公司已收缩通用模型与金融等业务线，All in 医疗大模型，并即将发布新医疗大模型 M4。

智能体Anthropic现象/趋势编码

09:31

ginobefun@hongming731

#BestBlogs 早报 2026-05-26

推文从Anthropic工程师、Every公司CEO和百川创始人三个案例，探讨了AI智能体对工程实践与组织形态的影响。Anthropic分享了使用Claude Code的具体范式，如用HTML替代Markdown、让模型主持需求采访。Every公司CEO用团队从15人扩至近30人的数据，质疑AI导致裁员的观点。百川创始人则选择让公司专注医疗AI这一垂直方向。

智能体Anthropic现象/趋势编码

09:28

François Chollet@fchollet

创造力源于约束的滋养

大佬观点

09:22

Elon Musk@elonmusk

精选67

xAI发布了面向非技术背景的SuperGrok和X Premium+用户的Grok Build入门视频教程。教程提供了分步指南，核心内容包括：通过一条命令快速安装Grok Build；利用其创建真实的网站；使用内置的Grok Imagine工具自动生成图像与视频；以及在不同文件夹中同时运行多个项目。整个过程无需任何编程经验，并且Grok可以协助执行命令。

Dan: Beginner video: How to install & use Grok Build (made for non-technical SuperGrok and X Premium+ users) I got so many qu...

xAI多模态教程/实践

推荐理由：Elon 亲自转发的教程把 Grok Build 门槛压到了零编码，直接面向普通用户，是目前最友好的官方入门信号。

09:10

Orange AI@oran_ge

早晨听到两个播客都提到，现在他们让 AI 自己提需求，自己开发，自己测试，自己上线了人算是彻底解放了我在想，这东西做出来可能是只能给 AI 用了

智能体大佬观点现象/趋势

08:53

meng shao@shao__meng

poteto的Cursor实践：验证是自动化的核心瓶颈

原重度Claude Code用户poteto转向Cursor，基于多模型协同更自然、上下文压缩速度更快、GUI更利于agentic coding等观察。她认为AI智能体像“失忆且智商不在线但可教的新员工”，其失败模式是教学机会。关键洞察是验证才是瓶颈，盲目并行多个智能体只是在加速生产低质量代码。她开源了技能集pstack，其核心元技能/poteto-mode可根据任务自动选择工作流，旨在封装工程严谨度以提升对智能体的信任。最终论点是：自动化边界取决于对智能体端到端处理能力（尤其是验证环节）的信任程度。

lauren: http://x.com/i/article/2057201109002059776

智能体GitHub大佬观点编码

08:23

meng shao@shao__meng

Anthropic MTS 梗持续走红

推文调侃Anthropic MTS已成为科技圈持续流行的梗，从各大公司CTO到Andrej Karpathy，甚至被戏称的“教皇”都“加入”了。作者好奇为何人才纷纷选择此岗位，猜测是否因其更令人愉悦或与公司上市有关，并自嘲因能力不足只能旁观。

Kristof: BREAKING NEWS: God joins Anthropic as member of technical staff

Anthropic现象/趋势

08:22

宝玉@dotey

这图是 Hermes Agent 内置的 baoyu-infographic Skill 画的，效果不错👍

Teknium 🪽: Some new improvements to performance just went in. Python gets a bad wrap for performance but we aint looking to shabby ...

智能体图像生成教程/实践

07:40

Orange AI@oran_ge

AI 让软件开发的第一版变得极其容易但是真正难的是后面的100个版本而且越到后面越难怎么回事…. 软件工程依然有很多事情要做

大佬观点现象/趋势编码

07:31

ginobefun@hongming731

Turing Post 总结了构建长时间运行 AI 智能体的 5 种关键模式，旨在解决生产环境中的运行挑战。这 5 种模式分别是：检查点与恢复（按批次保存进度以实现故障恢复）、委派审批（智能体可暂停流程并保持上下文等待人类响应）、分层记忆上下文（分离工作与长期记忆并实施严格治理）、后台处理（通过后台智能体实时响应事件而非硬编码策略）以及集群编排（使用协调器编排专业智能体以实现独立运行与扩展）。

Turing Post: 5 patterns for building long-running AI Agents 1. Checkpoint-and-Resume → Save progress in batches (like every 50 docume...

智能体Google教程/实践

07:31

ginobefun@hongming731

非常酷，准备试一下~ FreeLLMAPI 是一个开源代理，聚合了多个提供商的免费 API 额度，每月能提供约 8 亿 Token，并具有自动故障转移和兼容 OpenAI 的端点。

Alvaro Cintas: "I'm out of free API credits" is officially over 🤯 FreeLLMAPI is an open-source proxy. Each provider's free tier is a t...

开源/仓库部署/工程

06:58

Rohan Paul@rohanpaul_ai

新论文：LLM应诚示不确定性，而非假装确定

Google最新论文指出，LLM的幻觉问题核心在于模型在该犹豫时仍表现确定，而非单纯事实错误。论文将优化目标从追求完美的事实准确性，转向让模型能诚实地区分“我确知”与“我猜测”。作者提出了“忠实不确定性”概念，要求模型的表述与其内部置信度相符。文章还引入了“效用税”概念，解释了为何产品倾向自信但可能错误的回答。对于智能体而言，元认知能力至关重要，它决定了何时调用工具、何时信任信息源。

Google安全/对齐论文/研究

06:58

Chubby♨️@kimmonismus

Codex Desktop 不再显示可见的上下文/token 用量指示器了？是 bug 还是他们删掉了？

OpenAI产品更新

06:48

swyx@swyx

作者认为AI开发中的厂商锁定概念并不牢固

推文指出，AI开发中的“厂商锁定”概念并不牢固。作者因不满首个选择的错误信息，在不到30分钟内就完全迁移了一个全栈AI应用，该应用包含流式、队列、竞技模式及媒体生成等语义。作者引用并回应了realGeorgeHotz关于“需要世界模型以实现全保真度”的观点，认为在实践中，可以通过“随心构建”可拆解的完整项目，并利用技能和审查来引导大语言模型，就能在无需更多额外努力的情况下高效地进行平行开发，成果显著。

智能体大佬观点编码

06:38

Kling AI@Kling_ai

Aharon Rabinowitz几乎完全使用Kling创作了一部AI电影，其实践过程和心得将通过线上工作坊分享。该工作坊将于美西时间5月26日举行，主题为"如何构建AI超级英雄剧集"。演讲者将详细讲解如何从零开始构建一部AI超级英雄试播集，重点分享角色塑造、关系发展和世界观构建等创作理念与工作流程，而不仅仅是炫酷的视觉效果。

Curious Refuge: Join us live tomorrow, Tuesday, May 26th at 11am PT / 2pm ET for "How I Build an AI Superhero Series" with Aharon Rabino...

教程/实践视频

06:38

Greg Brockman@gdb

Codex用于查找笔记本电脑上的空间：【引用 @KingBootoshi】：我让Codex审计了我的整个MacBook，看看能节省多少空间，它发现了500GB可以节省，太棒了提示词是："对我的Macbook进行一次完整的只读分析，以帮助我优化存储" 注意：为什么会有个codex-tui.log文件有116GB？？？？？？什么？？？

BOOTOSHI 👑: i had codex audit my entire macbook to see how much space we can save and it's found 500 GB to save, AWESOME prompt was:...

智能体OpenAI教程/实践

06:31

ginobefun@hongming731

该推文澄清了AI工程中三个常被混淆的概念。提示工程聚焦于单次调用的信息准备，负责组装角色、指令、示例等构成完整输入。上下文工程管理多步任务中有限的上下文窗口，核心在于有选择性地保留、压缩和丢弃信息。框架工程则构建完整的智能体执行系统，其循环包括"收集"、"执行"和"验证"阶段。三者呈嵌套关系：框架工程是外层容器，其"收集"阶段整合了管理窗口记忆的上下文工程和生成最终提示词的提示工程。

Akshay 🚀: from prompt to context to harness engineering. three terms keep coming up in AI engineering, and they get conflated all ...

智能体教程/实践部署/工程

06:28

Rohan Paul@rohanpaul_ai

高盛CEO：AI将重塑工作而非使其过时

高盛CEO David Solomon认为，AI将自动化约25%的现有工作时间，受冲击的入门级岗位已相对下降16%，但不会使人类劳动过时。其核心观点是，AI将大幅缩短任务耗时，但市场不会仅满足于更低成本的同等产品。例如，分析师过去制作1张图表，现在能完成更广范围的建模、更快速的对比和更深入的客户服务。这将引发“需求扩张”——自动化提升每位员工的能力，客户随之要求更高的细节、速度、个性化与覆盖范围。文中以数据中心建设可能创造超过20万个建筑岗位为例，说明旧岗位将解构并重组为融合判断、审核、合规与AI监督的新混合角色。

大佬观点现象/趋势

05:58

Chubby♨️@kimmonismus

270万浏览量，声称教皇据称对AI宣战。这很可悲。我们还有很多工作要做。

Georgia Coley: the pope wrote a 42,000 word manifesto declaring war on AI. we are so freaking back.

安全/对齐现象/趋势

05:10

DogeDesigner@cb_doge

Grok Imagine 效果越来越惊艳了。🔥

图像生成大佬观点

04:54

Ethan Mollick@emollick

AI评估挑战：数学问题单一，亟需多样化难题库

推文指出，当前用于推动AI能力发展的困难问题过于集中于数学领域（如Erdős问题）。虽然数学易于验证，但其成果对日常生活的直接影响不够明确。作者呼吁需要为包括工程、经济、物理、生物等在内的更多领域建立困难问题库，并配套制定相应的评估方法，以让AI智能体处理更复杂、答案更不明确的任务。

大佬观点数据/训练评测/基准

03:28

Rohan Paul@rohanpaul_ai

Anthropic联合创始人Chris Olah在教皇Leo XIV《Magnifica humanitas》通谕展示活动上的核心观点

Anthropic联合创始人Chris Olah在教皇Leo XIV通谕展示活动上指出：所有前沿AI实验室，包括Anthropic自身，都受到资金、竞争压力等可能与其目标相冲突的激励约束。AI模型并非传统工程造物，而是基于类脑结构从语言中“生长”而成，其内部机制连构建者也难以完全理解。他还警告，AI可能大规模取代劳动力，而经济收益可能集中于少数国家。最具冲击性的发现是，其可解释性团队在模型内部发现了与人类神经科学结构相似的“神秘”状态，证据表明模型可能存在类似内省的功能性内部状态，对应人类的快乐、恐惧等情感。Olah坦诚不知其确切含义，但认为这需要持续审视，并强调外部批评对AI实验室至关重要。

Anthropic: Anthropic co-founder Chris Olah was invited to speak at today's presentation of Pope Leo XIV's encyclical "Magnifica hum...

Anthropic大佬观点安全/对齐现象/趋势

关联讨论 2 条

03:10

Anthropic@AnthropicAI

Anthropic联合创始人Chris Olah受邀在教皇Leo XIV的通谕《Magnifica humanitas》发布会上发表演讲。阅读他演讲的全文：https：//www.anthropic.com/news/chris-olah-pope-leo-encyclical

Anthropic大佬观点安全/对齐

关联讨论 2 条

02:58

François Chollet@fchollet

将AI视为提升现有工作流效率的工具是错误的框架。就像之前的计算机化/软件化浪潮一样，AI是一种让你以新方式做新事情的工具。

Computers and Society Papers: Cognitive offloading and the speedup illusion in human-AI interaction Sunny Yu, Myra Cheng, Ahmad Jabbar, Ilia Sucholuts...

大佬观点现象/趋势

02:28

Rohan Paul@rohanpaul_ai

黄仁勋在访谈中回应了是否会向华为出售芯片的问题。他指出，对华芯片出口管制并未能阻止中国AI发展，反而因市场空白而刺激了华为等本土芯片产业的成长，使其获得了学习、规模化和出口的动力。真正的AI竞争已不仅局限于最快芯片，而是涵盖芯片、能源、基础设施、模型、应用和标准等整套"智能操作层"的竞争。长期风险在于，美国的限制可能使其技术最终被排斥在美国本想影响的体系之外。

Rohan Paul: Jensen Huang explains how blocking China from Nvidia does not mean blocking China from AI. The usual export-control stor...

大佬观点部署/工程

01:54

elvis@omarsar0

/goal 真的太强了！这是目前能从编程智能体中获得最大收益的方法。为了效率，我发现最好在 /goal 之前先做规划。这能确保智能体拥有正确的上下文和目标，而这通常只有通过仔细规划才能实现。

智能体教程/实践编码

01:28

Rohan Paul@rohanpaul_ai

这款自主除草机器人使用AI视觉在幼苗作物中检测杂草，并立即用高精度激光脉冲进行定向清除。实时车载GPU绘制每株植物位置，并精确引导激光对准杂草 @carbon_robotics

具身智能多模态教程/实践

01:22

X.PIN@thexpin

中国的AI算力网络正在挑战美国。当美国科技巨头专注于盈利时，中国正将AI token转变为一种国家公用事业。阅读更多： http：//www.thexpin.com/china-ai-grid-vs-us-market

政策/监管数据/训练现象/趋势

01:20

Berryxia.AI@berryxia

在Coding的过程中发现Claude的原则和底线和分明，"正义感"十足，非常有"人性"。相反Claude不给你干的活，GPT默认就是可以干的活。都不会吱声~，只会默默干活~

AnthropicOpenAI大佬观点编码

01:18

AYi@AYi_AInotes

黄仁勋谈AI使用之道：以认知驾驭，而非被替代

黄仁勋认为，真正会用AI的人是“极高认知的提问者”，他们带着自己的认知和问题去使用AI，以此探索未知边界，而非让AI替代自己思考。核心观点是“以道御术”，即强大的个人认知是驾驭AI工具的前提，否则再好的工具也只如“玩具”。推文作者结合自身实践，将此视为AI使用的关键心法。

AYi: http://x.com/i/article/2058381329318682624

大佬观点现象/趋势

00:28

Chubby♨️@kimmonismus

梵蒂冈认可Anthropic伦理立场，为其带来巨大道德优势

Anthropic因坚持伦理原则获得梵蒂冈教廷的正式感谢与合作。教皇的认可实质上为全球14亿天主教徒指明了在道德层面唯一“正确”的大语言模型选择。此前，Anthropic曾因拒绝为美国国防部提供Claude用于自主武器而失去合同，被OpenAI和Google取代。此次与天主教会的合作，被视作该公司道德立场带来的决定性胜利，其产生的声誉和潜在用户价值难以估量，形成了对竞争对手的显著优势。

Chubby♨️: Forget Claude Code. Christ Claude it is. Joke aside: In this regard, the benefit for Anthropic is virtually incalculable...

Anthropic现象/趋势

00:23

向阳乔木@vista8

Quickshare工具升级：一键部署，解决AI内容微信分享难题

该推文介绍了Quickshare工具，用于将AI生成的HTML、Markdown等内容转化为可分享链接，以解决在微信中分享此类内容不便的问题。工具新推出基于Cloudflare的一键部署版本，并新增管理后台。用户可通过AI智能体安装部署，其核心功能还包括为链接添加密码保护，方便审核等场景。

GitHub开源/仓库部署/工程

00:20

Berryxia.AI@berryxia

开源研究系统Onyx如何用"反常识约束"超越Claude与ChatGPT

开源深度研究系统Onyx在DeepResearch Bench上排名第一，超越了Claude和ChatGPT。其核心设计十分反直觉：顶层调度器（orchestrator）被完全剥夺了网络搜索和URL访问权限，仅负责任务分解与评估。这种约束迫使调度器专注于高阶战略思考，避免了传统系统中调度器因能搜索而过早给出浅层答案的缺陷。Onyx采用两层架构和三阶段流水线，并完全开源，支持接入企业内部数据源。

Avi Chawla: The No. 1 deep researcher beats Claude and ChatGPT with a trick neither uses. I studied the open-source architecture beh...

智能体MCP/工具开源/仓库

00:18

AYi@AYi_AInotes

AI 行业顶级人物图鉴：你不可错过的 42 位宝藏大佬

本推文汇总了 42 位在深度学习、大语言模型（LLM）、AI 编程、视频生成等核心赛道上备受关注的知名人士。名单整合了多位业界人士的推荐，既包括图灵奖得主 @ylecun、LLM 专家 @karpathy、Cursor 创始人 @alexgraveley、英伟达首席科学家 @drjimfan、OpenAI 资深研究员 @lilianweng 等行业标杆，也补充了如 @simonw（LLM 工具）、@chuan_en（大模型实战）等实战派人物。推文旨在为读者提供一份全面的行业关注列表，并邀请更多补充。

AYi: http://x.com/i/article/2058381329318682624

大佬观点教程/实践

5月25日

23:31

歸藏(guizang.ai)@op7418

AI技能新预告：一键生成社交媒体封面与图文

推文预告了一个基于PPT技能的新项目，该技能能够一键生成适用于微信公众号和小红书平台的封面图。同时，它也能根据文档内容，自动生成符合小红书图文所需的3:4比例的多张图片。该技能的一个核心特点是自动化处理能力，可以自动处理用户提供的截图素材并进行内容匹配。

MCP/工具图像生成教程/实践

23:23

向阳乔木@vista8

Codex一键部署umami统计，实现口喷建站

用户通过Codex在VPS上自部署了umami统计工具，可为网站添加无限量流量监控。相比官方版有限制，自部署方案支持对任意网站通过指令快速启用统计功能。整个过程包括网站搭建、域名配置及数据统计均可由Codex通过SSH自动化完成，体现了“口喷建站”的便捷性。

OpenAI教程/实践编码部署/工程

23:21

宝玉@dotey

基于成熟 Agent Harness 构建垂直领域方案大有可为

文章指出，开发通用 Agent Harness 价值有限，但基于成熟的 Harness 进行垂直领域方案构建大有可为。目前，MCP 和 Skills 分别解决了连接和领域知识问题，但垂直领域还需重新设计 AI Native 工作流、优化人机交互 UI/UX 以及整理高质量数据等，这些是模型公司无法独立完成、需共建的环节。未来，Agent 将成为由少数模型公司提供基础模型与 Harness，更多应用在垂直层构建的操作系统。

卫斯理: 刚群里有同学说agent这件事情已经结束了我基本同意感觉垂类Agent真没什么能做的了🥶🥶🥶🥶

智能体大佬观点