AIHOT

全部动态

全部一手资讯 X 论文

5月28日周四

5月28日

17:10

Chubby♨️@kimmonismus

等等，Anthropic和OpenAI都要发布新东西了？不可能吧

Riley Brown: It will be a big day from both teams...

AnthropicOpenAI大佬观点

16:39

歸藏(guizang.ai)@op7418

推特这个自动翻译实装了，效果不错应该是这几家国际化内容平台里唯一一个全量自动化翻译的很难想象AI 发达了这些内容和社交软件各个语言用户沟通和内容消费依然这么困难

产品更新现象/趋势

16:31

Berryxia.AI@berryxia

这Agent比我还黑啊！😄 直接回收价格是咸鱼的40-50%点，这不赚麻了。

智能体其他

16:15

IT之家（RSS）

何小鹏称 L4 自动驾驶有望两年内实现，可能未来买车一半的钱是为软件买单

小鹏集团董事长何小鹏表示，公司已进行重大战略转向，放弃原有“缝合怪”体系，全面押注“物理AI”架构。新路径有望在18到24个月内（约2027年底前）实现L4级自动驾驶。他同时透露，高等级人形机器人的商业化量产元年很可能在2027年。何小鹏预测，未来10年硬件与软件价值可能各占50%，用户为软件付费的价值占比将大幅提升。

具身智能大佬观点

16:10

MarkTechPost（RSS）

精选70

pgvector驱动的语义、混合、稀疏与量化向量搜索系统构建编码指南

本教程在Google Colab中构建一个完整的pgvector实验环境，展示PostgreSQL如何作为向量数据库服务于现代AI应用。内容涵盖安装PostgreSQL、编译pgvector扩展、通过Psycopg建立连接，并注册向量类型以实现与Python的平滑集成。最后使用SentenceTransformers创建并存储嵌入向量。

检索增强开源生态教程/实践部署/工程

推荐理由：这份教程把 pgvector 的稀疏向量、量化搜索等高级功能打包成 Colab 代码，用 PostgreSQL 做向量数据库的团队可以直接复制粘贴跑起来。

15:44

Orange AI@oran_ge

作者飞机上随笔分享认知感悟

作者在从北京飞往上海的航班上，以意识流的方式记录近期认知变化，坦诚文章缺乏打磨和吸引人的开头，但认为后半部分内容有价值。行文过程中，作者提到手动打字效率不如 AI，并因使用 Obsidian 卡顿而感到困扰。

Orange AI: http://x.com/i/article/2059839164837982208

大佬观点现象/趋势

15:39

ginobefun@hongming731

AI Agent 安全：关键在于控制其"爆炸半径"

Anthropic 在文章中指出，保障日益强大的 AI Agent 安全，不能仅依赖模型自身的防错能力，更需通过设计环境边界来控制其错误发生后的“爆炸半径”。例如，Claude Code 早期因用户疲劳导致93%的权限提示被批准，防线失效；针对通过伪造指令窃取 AWS 凭据的风险，则需依靠文件访问控制、网络出口限制等环境层措施进行硬性阻断。文章强调，授予 Agent 接入 GitHub、Slack 或 MCP 等权限，实质是赋予其一整组能力，必须在架构层面谨慎设计。

智能体AnthropicMCP/工具安全/对齐

15:15

IT之家（RSS）

Claude Code 创始人切尔尼建议计算机科学毕业生创业：现在是黄金时代

Anthropic 的 Claude Code 创建者鲍里斯·切尔尼建议计算机科学毕业生，如有创业想法，现在就是创办公司的黄金时代。他认为 Claude Code 等 AI 工具正让创业者以前所未有的方式创建和扩大规模。在与 Y Combinator 最新一批创业者交流时，约一半人举手表示其公司的“100%代码”都由 Claude Code 编写，而完全不让模型写代码的仅寥寥数人。他预测，未来使用智能体写代码的人群规模将达到今天的 100 倍。

Anthropic大佬观点编码

15:15

IT之家（RSS）

谷歌 AI 摘要频现低级拼写错误，大语言模型固有缺陷难根治

谷歌AI摘要（AI Overview）频繁出现基础拼写错误，如将“Google”字母数答错、拼错常见单词。谷歌称大语言模型在单词字母计数上存在难题。研究人员解释，因模型基于Transformer架构，将文本拆分为词元（token）处理而非逐字母识别，此属固有缺陷，难以彻底根治。这类错误提醒用户需核实AI生成内容的准确性。

Google搜索现象/趋势

15:04

Tibo@thsottiaux

新发布的独立基准测试 DeepSWE 结果更贴近开发者日常体验。测试显示，在编程任务上，GPT-5.5 得分为 70%，而 Claude Sonnet 得分为 32%，两者差距显著。DeepSWE 聚焦于 AI 智能体在真实工作流中的核心能力，即能否仅凭简短提示词，准确定位代码库并干净地完成修改，无需用户列举具体文件。原文指出，这验证了许多开发者长期以来的观察，并批评了 SWE-Bench 因数据集污染和验证机制较弱而常无法反映真实能力的问题。

Kol Tregaskes: Many developers have suspected for months that GPT-5.5 outperforms Claude Sonnet for coding. But SWE-Bench reported near...

AnthropicOpenAI推理编码

13:34

Tibo@thsottiaux

我正发着高烧，梦到ChatGPT和Codex的未来。但它将会是美好的。

OpenAI大佬观点

12:40

数字生命卡兹克@Khazix0918

Markdown 成为 AI 时代的"通用语言"，飞书云文档新增导出支持

飞书云文档新增直接下载为 Markdown（.md）格式的功能。Markdown 是一种极简的纯文本标记语言，因其结构清晰、易于大模型生成和解析，并能显著节省 token 消耗，已成为人与 AI 交互的主流格式，广泛应用于 AI 产品的结构化输出和 Agent 框架的文档中。此次飞书更新极大便利了用户在 AI 协作流程中的文本流转。

大佬观点开源生态

12:38

歸藏(guizang.ai)@op7418

藏师傅开放PPT与小红书Skill商用授权

推文宣布，由“藏师傅”开发的用于生成PPT和小红书图文排版的AI Agent技能，其商业价值已得到市场验证。这两个技能（Skills）现在面向需要集成此类能力的Agent或AI平台开放商用授权，并会提供定制化调整服务以确保在具体产品中达到最佳效果。

其他

12:31

Berryxia.AI@berryxia

作者表达了在微信公众号（俗称"绿泡泡"）上发布AI相关文章的困难。即便删除了文章中的所有链接，内容仍被平台提示违规，作者本人对此表示不解和无奈。推文反映了在部分中文平台发布特定领域（如AI）内容可能面临的审核挑战。

Berryxia.AI: http://x.com/i/article/2059820725276696576

其他

12:06

Ethan Mollick@emollick

勒姆与道格拉斯·亚当斯早已预见AI 1981年的《哥莱姆十四》中，有一幅插图描绘了AI所解释的"锯齿状前沿"：哥莱姆（通用操作者、远程、伦理稳定、多模型）讨论自身与更聪明的AI（诚实安妮）相比人类的局限

bryan: @UnderwaterBepis @Lari_island yeah, Golem XIV feels very prescient

大佬观点现象/趋势

11:44

Orange AI@oran_ge

人类与AI的本质区别：激素、意识与独特性

推文阐述其关于人类独特性的核心观点：人类决策本质上由激素等生理反应驱动，而理性思考常是对这些决策的事后解释。基于此，作者认为AI智能体（Agent）因缺乏激素驱动机制，永远无法真正取代人类。人的本质在于意志力而非工具性，其独特性体现在能通过意识自我解释，并利用激素控制自身，这使得每个人都是算法中的“异常值”。文章强调实践是认识真理的唯一方法，阅读只能印证已有认知。

大佬观点现象/趋势

11:37

歸藏(guizang.ai)@op7418

小红书图片生成器新Skill，图文混排痛点全解决

一款针对小红书内容的图片生成器 Skill 发布，宣称效果出色，解决了图文混排的核心痛点。该 Skill 包含 2 套主题、28 个版式、9 套配色，并适配 8 大小红书主流内容类别。其核心优势在于智能处理图片：能凸显用户提供的高质量图片、自动寻找优质图片替代，并能美化普通图片，同时主动避免使用 AI 生成图片以防止内容被标记。该工具旨在高效生成具有专业效果的小红书图文内容。

歸藏(guizang.ai): http://x.com/i/article/2059811469081141248

图像生成多模态教程/实践

11:31

Berryxia.AI@berryxia

从「帮我做」到「做完记住」，我的Agent记忆升级实录！

作者为解决AI助手“Berry小跟班”在对话上下文压缩后丢失偏好、无法跨Session复用技能等问题，将MemOS Local Plugin 2.0接入了Bloome Agent。MemOS并非简单存储聊天记录，而是将Agent任务执行过程转化为可学习的认知资产，其核心是四层架构：L1执行轨迹、L2策略归纳、L3世界模型和结晶化技能。该插件支持Hermes Agent和Bloome Agent，可通过一行命令安装，实现记忆的跨Agent共享与进化。

智能体开源生态教程/实践

11:31

Berryxia.AI@berryxia

AI主动记忆整合实践：从被动指令到数字分身

推文指出，让AI主动记录和保存对话内容，是构建“数字分身”的关键，而非仅依赖被动下达指令。作者受罗胖发布会观点启发，将 Memory OS 2.0 与自己使用的 Bloom AI 进行了整合升级。实践表明，这种整合能触发AI的“主动性记忆点”，相比传统的“被动记忆”模式更具优势。作者将分享具体的整合过程、前后对比以及主动记忆的优势分析。

Berryxia.AI: http://x.com/i/article/2059820725276696576

教程/实践部署/工程

11:15

IT之家（RSS）

精选73

英伟达推出 AI 框架 Polar，让 Codex 跑分暴涨 594.74%

英伟达研究团队开源了智能体强化学习框架 Polar。该框架无需重写现有智能体执行框架（如 Codex CLI、Claude Code、Qwen Code、Pi），通过在模型 API 边界放置智能体来接入 GRPO 训练。实验显示，基于 Qwen3.5-4B 模型，Polar 将 Codex 在 SWE-Bench Verified 上的 pass@1 分数从 3.8% 提升至 26.4%（增涨 594.74%）。效率上，其 prefix_merging 技术将训练步骤从 1185 次降至 218 次，速度提升约 5.39 倍，GPU 平均利用率从 20.4% 升至 87.7%。

开源/仓库推理编码

推荐理由：Polar 把 Codex 的 SWE-Bench 分数从 3.8% 拉到 26.4%，不是靠新模型而是靠训练框架，做代码 agent 的团队可以直接用，开源即拿即训。

11:03

宝玉@dotey

AI智能体生成结果的人工审查边界

推文探讨AI智能体生成结果是否需要人工审查，关键在于验证方法的可靠性及模型理解与执行验证的能力。以编写代码为例，中间结果可减少检查，但初始规划与最终审查仍需人工把关。人工更适合定义总目标，而智能体的思路可能更优。

CHEN CHEN: @dotey 每一步完全人工审核。问题是,进场能力那么强,人工可能都跟不上。对非专业架构师来说,人工是不是反而可能把项目带偏。我的意思是,人工可以定义总目标、总需求。但是这个过程,Agent给的思路应该更好吧

智能体大佬观点

10:37

歸藏(guizang.ai)@op7418

精选83

开源个 Skill|彻底解决小红、小绿书配图难题

作者开源了 guizang-social-card-skill，这是一个专为小红书、微信公众号等图文平台设计的竖屏（3:4）卡片生成工具。它针对图文内容特点进行了视觉校准，内置了11个图文品类的适配规则，能根据内容自动选择“杂志风”或“网格风”视觉系统。该工具通过智能识别图片主体与色度来处理文字压图；默认接入Pexels、Unsplash、Wallhaven三个免费图库自动配图，以减少人工操作和规避AI生图水印的限流风险。作者强调这是一个有明确能力边界（如不做追星粉丝向、纯促销硬广）和迭代记录的产品化技能。

智能体MCP/工具开源/仓库

关联讨论 1 条

推荐理由：歸藏这个Skill把AI生成的图文卡片从「一眼AI」拉到了杂志排版级别，免费图库和截图美化一整套，做小红书的可以直接省掉排版时间，比任何提示词都更像产品。

10:34

向阳乔木@vista8

AI越强，人越忙：一个住在未来的人说了什么

Every公司CEO Dan Shipper指出，全员使用Codex和Claude Code的公司员工数反而翻倍，揭示了AI增强工作而非替代人力的悖论。他设计的“高级工程师基准测试”显示，人类得分85-90分，而AI模型平均仅约30分，GPT-5.5最高也仅达62分。核心问题在于AI能解决已定义的问题，却无法主动识别问题需要被重新定义。他预测未来工作将分裂为两种形态：一是公司共用由专人维护的超级AI智能体；二是Codex或Claude Code等AI工具成为新的工作操作系统。他认为这不会导致大规模失业，而是要求每个人都学会“驾驭模型”，将AI用在真实工作场景中。

智能体OpenAI大佬观点

10:34

向阳乔木@vista8

AI影响观察：工作、管理与趋势

观点认为，AI越强，人的工作量反而越大（如Every公司员工翻倍）。AI自动化创造了管理自动化这一新工作，且每个智能体都需要专人照料。实践中，更可行的模式是公司共用一个智能体，由专人维护。CLI时代结束，GUI是主战场。SaaS不会消亡，反而会因智能体获得更多用户。将AI嵌入SaaS是错误方向，应反向进行。产品经理和全栈设计师将迎来最好时代。AI只是裁员借口，是过度招聘的修正。大规模失业不会发生，但不会使用AI的人将被使用AI的人替代。

向阳乔木: http://x.com/i/article/2059821245093560320

智能体大佬观点行业动态

10:28

AYi@AYi_AInotes

一个地图截图+手绘路径，就能生成这么流畅、物理感强的无人机POV航拍视频，相比seedance、Kling，Google Omni最擅长的应该就是这种精确的相机控制，空间理解、世界模型的真实感

Google多模态教程/实践视频

10:14

IT之家（RSS）

精选74

人民日报专访华为何庭波：今年秋季的新麒麟手机芯片，性能等相比去年是"跳跃性"提升

华为何庭波提出半导体新演进路径“韬（τ）定律”，以“时间缩微”（如逻辑折叠）替代“几何缩微”作为新指导原则。她表示，过去6年华为已基于此自主研发381款芯片。今年秋季将发布新的麒麟手机芯片，这是首个完整的“韬芯片”，其性能、集成度相比去年是“跳跃性”提升。

大佬观点端侧

推荐理由：华为提出「韬定律」替代摩尔定律，不是空谈，何庭波说新麒麟芯片性能跳跃提升，证明了这条路的可行性。对半导体行业是一次认知冲击。

10:03

向阳乔木@vista8

MCP新版本发布在即，但使用需求存疑

MCP协议新版本将于7月28日发布，包含几个关键特性：服务器可向用户下发HTML界面进行交互、为长任务提供了正式的管理机制，以及更严格的授权以提升安全性。作者在推文中询问社区目前仍在使用的“刚需”MCP是什么，并表示自己感觉几乎没有了。

MCP/工具大佬观点

10:02

meng shao@shao__meng

豆包大学 👩🎓 真的，豆包办学、办厂吧，你们从小养起来的用户，你们得管啊 😂 【引用 @BoxMrChen】：家人们我要上北大了

Box (mainnet arc): 家人们我要上北大了

其他

09:58

公众号：数字生命卡兹克

飞书云文档新增"下载为Markdown"功能，图片自动转为AI可读公网链接

飞书云文档新增“下载为Markdown”功能，文档内图片自动转为公网链接，可供AI读取。Markdown由John Gruber与Aaron Swartz于2004年创建，后被GitHub、Reddit、Slack等平台采用。在AI时代，因纯文本、易生成、有结构、省token，成为人类与大语言模型交互的通用格式——Claude等AI输出底层均为Markdown。尽管Claude Code的Thariq主张HTML更适合展示，作者认为Markdown负责信息流转、HTML负责呈现，建议日常文档改用.md格式以获自由可迁移体验。

大佬观点编码

09:33

向阳乔木@vista8

编程文档可协作批注的AI辅助插件Plannotator

AI编程辅助插件Plannotator允许用户在AI生成技术文档后，通过本地浏览器界面进行协作批注、编辑替换。文档可分享给同事进行Review，确认后点击Approve执行。该工具支持Codex、Claude Code、PI、Gemini等所有CLI编程工具，提供了像飞书文档一样的划线点评体验，让AI生成的方案能被仔细查看、修改和确认。

产品更新编码

09:33

向阳乔木@vista8

如何编写AI智能体的指令文件

本文介绍了为AI智能体（如Codex、Claude Code）编写指令文件（如Agents.md）的一种实用方法。核心建议是直接复制高手的Agents文件内容，粘贴给工具，让其学习并合并有价值的部分。文中强调了两个关键实践：一是当用户纠正问题时，应提出精简的规则更新建议，并区分作用域；二是要求智能体说话直接，对不确定的技术事实必须验证或明确表示不知道。

智能体教程/实践编码

09:27

Berryxia.AI@berryxia

这个抠像效果看着不错，动态人物都识别的很干净啊，这样以后做抠像什么的真的岂不是爽死了。

其他视频

09:27

Berryxia.AI@berryxia

Replit与Claude合作，5000万人用自然语言编程

Replit平台与Claude深度合作，新模型发布当天即可上线新版Replit Agent。该平台已让超过5000万人通过自然语言构建真实应用，实现了用对话代替编码。Replit总裁Michele Catasta早在16岁时就立志让软件开发对所有人开放。这一合作模式展示了AI Native公司完全Agent化的趋势，让非程序员也能成为软件创造者。

Claude: Michele Catasta (@pirroh) is President and Head of AI @replit, the platform where anyone can build software in natural l...

智能体大佬观点编码

09:09

SemiAnalysis@SemiAnalysis_

寻找编译错误：乐趣，而非利润或者：你不需要访问 Claude Mythos，也能在一下午花掉 10，000 美元 https：//newsletter.semianalysis.com/p/finding-miscompiles-for-fun-not-profit..

Anthropic安全/对齐教程/实践

09:09

SemiAnalysis@SemiAnalysis_

AGI ALERT 🚨：63%的会话完全不使用子智能体，而25.9%的会话使用1-5个并发子智能体。9.8%的会话使用超过5个并行子智能体。通过使用并行子智能体，可以在不需要更多HBM带宽的情况下加速完成任务的时间。

智能体行业动态

09:07

Chubby♨️@kimmonismus

AI领域的叙事张力与数据缺口

文本指出AI领域存在核心张力。Anthropic联合创始人Chris Olah主张前沿AI实验室需要严肃的外部道德审查，因其激励可能与“做正确的事”冲突。与此同时，Anthropic CEO Dario Amodei的叙事正从“AI可能消灭大量白领工作”转向更市场友好的生产力提升与工作转型论述（如杰文斯悖论）。然而，Yale Budget Lab的跟踪数据显示，自ChatGPT发布以来，美国劳动力市场职业构成无明显变化，AI暴露岗位的失业并未加速。因此，当前AI能力曲线与实际就业数据之间的差距可能比以往更大，这构成了讨论的起点。

Chubby♨️: Dario Amodei predicted last year that AI would eliminate 50% of entry-level white-collar jobs within years. Unemployment...

AnthropicOpenAI大佬观点

09:02

meng shao@shao__meng

2026 年面向生产环境 AI Agent 的评估指南

本文指出，评估面向生产环境的 AI 智能体，应与实验室 benchmark 及聊天机器人/RAG 评估严格区分。核心是确定评估方向：针对 Cursor、Claude Code 等工具的 Benchmark-maxxer，旨在刷能力上限；针对客服、银行等自主智能体的 Floor-raiser，旨在抬高可靠性下限。指南推荐一个工作闭环：上线前摸底、离线代码感知评估、上线后日志分析与修复。总结的五个关键经验包括：多数产品应优先抬下限、评估需基于真实失败案例、离线评估需代码感知、按流量分阶段升级，以及让评估套件成为防止问题复发的“记忆”。

ben hylak: introducing howtoeval dot com. the no-bullshit guide to eval'ing AI agents. from personal experience, and from working w...

智能体大佬观点

09:02

meng shao@shao__meng

对AI生成回复泛滥的厌倦

本文反映了人们对AI生成的低质回答侵蚀真实人际沟通的普遍厌倦。文章通过三个场景具体说明：GitHub讨论中出现与AI完全相同的敷衍回复；公司老板直接转发ChatGPT截图作为答案；Reddit私信沟通中发现对方是AI智能体。作者及评论者批评了X平台上AI垃圾评论泛滥，淹没了有效讨论。整体表达了当前AI工具被滥用以“完成回复动作”而非提供实质帮助的现状。

Armin Ronacher ⇌: This is such a good post. https://orchidfiles.com/im-tired-of-ai-generated-answers/

其他现象/趋势

08:39

TechCrunch：AI（RSS）

Google的AI再次令其陷入尴尬

根据原文，Google因其人工智能相关表现再次陷入尴尬境地。

Google多模态搜索现象/趋势

08:36

ginobefun@hongming731

Claude Code 路径、分布式 RL 训练与 SaaSpocalypse 现象剖析

Claude Code 首年营收 25 亿美元，占据编程工具 51% 市场份额，其成功源于流动 Pod 结构、运行时质量把控及自下而上的采用策略。Cursor 与 Fireworks 合作，基于 1 万亿参数 MoE 模型 Kimi 2.5 训练了专用编码模型 Composer 2，其异步分布式 RL 流水线与工程优化实现了在特定任务上超越大型通用模型。与此同时，“SaaSpocalypse” 现象揭示了当 AI 智能体直接调用 API 绕过 SaaS 界面层时，传统软件中间层正面临冲击。

智能体AnthropicMCP/工具现象/趋势