AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
精选全部日报更多
全部动态
全部一手资讯X论文
6月12日周五
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月12日
12:38
AYi@AYi_AInotes
70
Agent Reach:让AI Agent零API费用访问网页和社交媒体

Agent Reach(26.4k stars)让Claude Code、Cursor等AI Agent低成本访问网页、社交媒体。它整合yt-dlp、gh CLI等成熟工具,零配置即可用YouTube、GitHub、B站、V2EX;Twitter、小红书等需手动配Cookie。安装一条命令,Agent自动装依赖并注册skill,运行`agent-reach doctor`检查连通性。注意:Cookie会过期需手动更新;抓数据有封号风险(建议用小号);仅对跑命令的Agent有价值。作者持续维护。

AYi: http://x.com/i/article/2060717603987791878

智能体开源/仓库开源生态
12:34
IT之家(RSS)
64
阿里云创始人王坚:我坚定地不相信 AI 会替代人

在今日举办的2026第八届北京智源大会上,之江实验室主任、阿里云创始人王坚明确表示,他坚定不相信人工智能会替代人。他以“狗的鼻子比人灵很多,但这并不会对我们造成伤害”作比喻,批评人们被AI概念限制思维,不应盲从。王坚今年3月还曾指出,每天通勤40分钟是在浪费生命,AI应解决这类难题,把人最宝贵的资源利用好。

大佬观点安全/对齐
12:34
IT之家(RSS)
66
阿里云创始人王坚:AI 对科研的影响,与对程序员的冲击逻辑一致

2026 第八届北京智源大会上,之江实验室主任、阿里云创始人王坚指出,人工智能对科学研究的影响已发生质变。核心在于 AI 从只能理解文本发展到能理解多模态数据和代码,具备了区分语言文本与代码文本的能力。他认为,AI 改变程序员工作方式后,所有科学数据都会因 AI 被重新理解,科研人员受到冲击的逻辑与程序员一致。

多模态大佬观点
12:02
Deedy@deedydas
63
Deedy Das:小型团队用AI模型运营量化基金,资本数月翻倍

Deedy Das观察到新兴现象:小型团队利用AI模型运营量化基金,数月内实现资本翻倍。传闻SSI也是量化对冲基金。知名对冲基金(如Jane Street)正用GPU集群测试LLM交易;同时大量散户向Claude/GPT咨询股票建议或“vibe code”交易引擎。这引发对市场影响的思考:有效市场假说可能被“相关性模型假说”取代;美联储小规模研究显示不稳定效应;交易集中化易受“投毒”攻击;模型alpha会随时间衰减,需开发抗AI交易策略。最终能否参与取决于token成本承受能力。

大佬观点
11:54
小互@xiaohu
精选75
小互(@xiaohu)升级了公众号排版技能组合,实现一句话完成排版、封面生成并一键发送到公众号草稿箱。该工具已开源,提供20种主题颜色可选,可自动分析内容进行排版,支持非Markdown文件。用户只需在Claude Code、Codex或OpenClaw中提供文章链接或文档位置,即可获得可视化预览界面进行选择,全程无需手动操作。

小互: 一句话搞定公众号排版、封面生成、发布 我做了个技能组合,可以一句话搞定公众号排版、封面生成,和一键发送到公众号草稿箱,你只需点下发布即可。 已经开源了 有20种主题颜色可选 最重要的是它会自动分析你的内容,进行自动排版,不是Markdown...

Anthropic图像生成开源/仓库教程/实践

推荐理由:小互把公众号排版全流程做成一个开源技能,一句话就能从内容生成到草稿箱,做公众号的可以直接用,这种自动化程度很少见。
11:47
jason@jxnlco
9
我们不需要 IPO 也能去购物 (引用推文问:OpenAI/Anthropic 的员工 IPO 后都去哪儿买衣服?)

Max Zeff: where are openai/anthropic employees buying clothes from post IPO

OpenAI其他
11:37
karminski-牙医@karminski3
64
作者谈模型编程能力取决于"代码直觉"--以GPT-5.5-pro-xhigh修复路网断裂bug为例

作者认为模型编程能力取决于“代码直觉”,由海量开发经验堆出,极难训练。他以路网断裂bug为例:GPT-5.5-pro-xhigh错误认为矩形每条边只需1个tile,实际需2个tile,多模态截图也无法纠正。作者费4小时,让模型给tile编ID并质问“两个tile之间能容纳几个tile”才暴露缺陷,随后告知每个tile对应单位长度并应用规则,修复变简单。不同模型表现:有的开始不犯错,有的迭代修复,有的怎么都修不好。

OpenAI大佬观点编码
11:30
向阳乔木@vista8
76
Vista 编写了 AI 专用 PRD 文档生成 Prompt,先用它生成文档再交给 AI 开发,以提升功能完整度。Fable 5 项目开发在线 Photoshop 正是使用此方法。安装指令:`npx skills add joeseesun/qiaomu-ai-prd`,开源地址和 Prompt 见评论。

向阳乔木: 现在都是 AI Agent做开发,人喜欢的 PRD 和 AI 喜欢的是不一样的。 为了精准高效开发,写了个专门服务于 AI 的PRD文档生成Prompt。 先有这个文档,再给AI开发,功能完整度和丰富性会远远比自己想的全面、好用。 Skil...

智能体开源/仓库教程/实践编码
11:30
向阳乔木@vista8
37
Youmind两周年,CEO玉伯获赞坦诚独立

Vista 分享近期多次用 Youmind 制作 PPT,祝贺 Youmind 已成立两年。他评价 Youmind 创始人玉伯是身边朋友中的“异类”,持续独立思考,线上线下反差大。玉伯以真实为原则,坦诚到让人感到“可怕”,这种 CEO 非常稀缺。

nene: http://x.com/i/article/2065074380431081472

MCP/工具大佬观点
11:30
向阳乔木@vista8
44
AI First 原则就是,一切都要先试试 AI 能不能帮搞定。 正在试着用 Codex 的 Computer Use 帮填写 Word 合同。
智能体教程/实践
11:17
Hacker News 热门(buzzing.cc 中文翻译)
57
克劳德·法布尔始终积极进取

Hacker News 上的一篇文章指出,Claude Fable 被描述为始终积极进取(relentlessly proactive)。该文发布在 simonwillison.net,标题为“Claude Fable is relentlessly proactive”,在 HN 上获得 119 个点赞。

智能体Anthropic编码评测/基准
11:03
SemiAnalysis@SemiAnalysis_
50
Amazon Bedrock 可能在年底前占据大部分AI业务。Token即服务模式正在重塑超大规模云服务商的定位,速度超预期。
现象/趋势部署/工程
11:00
向阳乔木@vista8
精选75
qiaomu-ai-prd:面向AI的PRD生成Prompt

推文提出AI Agent开发中人类与AI对PRD的需求不同,为此发布了一个专门服务于AI的PRD文档生成Prompt(命名为qiaomu-ai-prd)。开发者先使用该Prompt生成文档,再交给AI开发,可显著提升功能完整度和丰富性。安装指令为:`npx skills add joeseesun/qiaomu-ai-prd`,开源地址及Prompt见评论区。

智能体MCP/工具教程/实践

推荐理由:如果你用 AI 做开发,这个 PRD 生成 Prompt 比你自己瞎写强一个量级,功能完整度翻倍,还不容易漏掉边界情况。装个 skill 就能用,算是个顺手小升级。
10:52
swyx@swyx
46
swyx自建vibecoding平台:吐槽现有平台未闭环错误处理

开发者swyx抱怨Vercel、Cloudflare、Netlify等现有平台未能真正闭环:在你出错或项目失败时,它们不会主动引导你纠正或发送通知。此外,每个项目都需要重复设置大量“网站管理员”基础设施,比如执行npx posthog wizard、npx arize skills等。swyx表示厌倦了这种零散配置,希望将所有功能整合到一个平台中,一次搞定。

大佬观点部署/工程
10:37
karminski-牙医@karminski3
50
FlashMemory: 将DeepSeek-V4上下文显存压缩至1.3GB并提升准确率

DeepSeek-V4支持1M上下文,显存约10GB(对比DeepSeek-V3.2约84GB)。FlashMemory论文进一步将显存压至1.3GB,并在LongBench-v2等长文本评测上准确率平均提升0.6%。核心是神经内存索引器(小模型),通过预测所需历史片段按需加载,实现注意力降噪。训练采用解耦双编码器架构,无需加载DeepSeek-V4基座模型,训练成本大幅下降。论文:arxiv.org/abs/2606.09079;项目:github.com/libertywing/FlashMemory-Deepseek-V4。

DeepSeek推理教程/实践部署/工程
10:29
歸藏(guizang.ai)@op7418
68
万字长文复盘爆款 Skills:Agent 不是聊天框,Skill 是关键中间层

@op7418 万字长文复盘爆款 Skills 经验,核心观点:Agent 不是聊天框,会放大能力差距;Skill 是普通用户用好 Agent 的关键中间层。好 Skill 需设计、维护与分发;生态不能只做仓库列表,需要内容、产品、案例、反馈形成迭代飞轮。基于真实案例。

歸藏(guizang.ai): http://x.com/i/article/2065096982310567936

智能体MCP/工具大佬观点
10:24
宝玉@dotey
24
宝玉 (@dotey) 将钓鱼的闲适与 AI Agent 使用体验结合,创作打油诗:钓鱼时"鱼咬不咬随它去",对应使用 Agent 时"跑完没跑不必盯,起身续水伸个腰"。引用 @yihong0618 的朋友圈钓鱼签名作为灵感来源,比喻 Agent 运行如同钓鱼,无需时刻紧盯,可放轻松等待结果。

yihong0618: 朋友圈一个钓鱼的大哥的微信签名: 一竿一线一山水,一漂一钩一逍遥。

其他大佬观点
10:11
Berryxia.AI@berryxia
45
AI Agent 放大能力差距,而非抹平差异

Berry Xia 赞同观点:Agent 不会缩小用户能力差距,反而会放大差距。头部用户已搭建文档、规则、memory、MCP、CLI、工具调用、权限、安全沙箱等系统,普通用户仍停留在聊天框。目标清晰、品味强的人被 Agent 放大优势;目标混乱、缺乏文档的人被放大混乱。作者认为 AI 时代并非完全平权,善于使用 AI 工具的能力可被放大数万倍,原本几倍的差距现在可能扩大到数百倍。

歸藏(guizang.ai): http://x.com/i/article/2065096982310567936

智能体现象/趋势
10:00
Ethan Mollick@emollick
66
有趣的是,我现在关于冷门科幻作家、现代主义诗人或包豪斯建筑的帖子收到的评论比以前更有见地,但这完全归功于AI垃圾账户。 很快,广泛的文化兴趣会成为AI写作的标志吗?
大佬观点现象/趋势
09:59
向阳乔木@vista8
45
最近发现不敢给周围非 X 和 AI圈的人演示AI做的东西和实现过程了,会引发深深的焦虑… 他们会觉得AI过于强大,自己严重落伍,想学又不知道从哪里入手。
大佬观点现象/趋势
09:34
IT之家(RSS)
55
钉钉换帅后《置身钉内》作者再发文:无效的形式化工时既消耗人力,也与技术发展的初衷相悖

钉钉ONE项目产品经理在7.5万字离职信《置身钉内》引发争议后再次发文回应。她指出AI开发存在不限于钉钉的共同困境——新老交替、产品形态探索期,但许多探索经验可帮助节约成本。AGI的本质一是放大文明能力解决现有难题,二是把人从机械重复工作中解放出来,让时间留给创意与情感。她认为长期来看重复工作将减少,创意工作不拼工时,无效的形式化工时既消耗人力,也与技术发展的初衷相悖。

现象/趋势部署/工程
09:30
Ethan Mollick@emollick
55
由于我最近迷上了AI与诗歌,来看看Fable如何将《杜伊诺哀歌》做成游戏--"把握情绪"。 它制作了一个漂亮的小型艺术游戏,包括翻译里尔克(不过我也坚持加入了一些A. S. Kline优秀译作的片段)。https://duino-elegies.netlify.app/
图像生成大佬观点
09:30
Rohan Paul@rohanpaul_ai
56
单卡实测:DiffusionGemma 速度是 Gemma4 的 4 倍,但事实错误多 6 倍

atomic[.]chat 在单张 H100(FP8)上对比 DiffusionGemma 26B A4B 与 Gemma4 26B A4B 在事实性写作任务中的表现。DiffusionGemma 速度达 763 tok/s(3.7 秒),是 Gemma4(218 tok/s,15.1 秒)的 4 倍,但错误率显著更高。在 Steve Jobs 传记、Tetris 历史和 BeOS 故事三项任务中,Gemma4 答对 45 个事实、错 5 个;DiffusionGemma 仅对 33 个、错 28 个。主题越冷门错误越多:Jobs 4 错、Tetris 12 错、BeOS 12 错,例如将 Jobs 母亲写为 Clara Clley、为 Tetris 发明者虚构同事 Geri Gulovik、将 BeBox 价格误报为 $9,999(实价 $1,600)。原因在于 DiffusionGemma 一次生成 256 tokens 并多轮抛光,只追求文本流畅性而非事实准确性。Google 官方也建议在事实重要时使用常规 Gemma4。

atomic.chat: Diffusion Gemma is 4x faster, but makes 6x more mistakes! We benchmarked the new diffusion LLM against its autoregressiv...

Google评测/基准
09:29
meng shao@shao__meng
46
Re-Ink:再保险合约智能提取与审核参考实现

Re-Ink 是 @LandingAI 金融 AI Hackathon 冠军项目,针对再保险承保中约 40% 时间消耗的行政文档录入痛点,构建端到端自动化方案。核心使用 LandingAI 的 Agentic Document Extraction (ADE) 实现 PDF/DOCX 条约的结构解析与上下文感知字段提取(合同标识、日期、金融条款、参与方等),无需正则或模板。关键设计为人机协同闭环:提取数据经人工审核后以单事务持久化,校验失败即回滚。Agent 层用两个 LangGraph Agent 封装入库前引导与审批后分析逻辑。Academy 调查显示手动提取错误率超 6%,运营预算约 14% 用于修复此类错误。

LandingAI: http://x.com/i/article/2065098287758348288

智能体教程/实践部署/工程
09:29
歸藏(guizang.ai)@op7418
68
万字长文:做了些爆款 Skills 以后,我对 Skills 的看法

作者认为Agent并非抹平能力差距,而是放大K型分化,Skill可弥合鸿沟。Skill是把专家经验、工作流、品味、工具调用封装成可分发复用的Agent能力单元,如PPT Skill、社交媒体卡片等。好Skill的信息架构应为“中心短,辐射厚”:SKILL.md只放高信号流程,其余依赖文件系统分层管理,以高效利用上下文窗口。

智能体MCP/工具大佬观点
09:25
ginobefun@hongming731
58
智能体工程化三大方向:Anthropic托管Agents、阿里Harness实践、Sequoia脚手架被吞趋势

本期精讲聚焦智能体工程化:Anthropic推出Claude Managed Agents,将推理与执行解耦,独立Vault管理凭证,事件日志支持运行恢复,首字延迟p50降约六成、p95降超九成。阿里工程师分享三层加载架构(常驻入口层压至8K上下文)、dispatcher状态机及G1-G8门禁,用结构约束替代堆prompt。Sequoia访谈指出模型正逐步吸收路由、执行环境等外层脚手架,独立创业公司窗口收窄。

智能体AnthropicGoogle现象/趋势
09:25
ginobefun@hongming731
63
BestBlogs早报:Claude Managed Agents / Harness工程化 / 模型吞脚手架

Anthropic推出Claude Managed Agents,将推理循环与代码执行沙箱解耦,凭证存入独立Vault,自托管沙箱支持内网,首字延迟中位数降低六成、长尾降低九成。阿里工程师复盘Harness工程化,提出三层加载架构与G1-G8门禁。Google DeepMind的Logan Kilpatrick称模型正“吞掉”脚手架,Gemini 3.5 Flash编程能力完全来自后训练。另,Qwen3-VL-4B在支持SME2的旗舰手机上Prefill提速超80%;Fable AI实现1770%性能提升并发现关键Bug;此外涉及AI取代工程师、多智能体数字人、CFO用GPU替代加薪等讨论。

ginobefun: http://x.com/i/article/2065232915970371585

智能体AnthropicGoogle编码
09:10
Berryxia.AI@berryxia
56
可复制的100+海外AI资讯信息源清单

Berry Xia 整理优化了一份可复制的清单,包含100+海外一手AI资讯和AI大神信息源,并附链接。此前版本无法复制,现提供可直接复制操作的版本,建议收藏。

搜索教程/实践
08:59
meng shao@shao__meng
74
Claude Fable 5 首日实践共识与陷阱

社区基于865条讨论与实测总结:Claude Fable 5高自主、高成本、偏规划编排。核心共识:给更难目标、少给步骤;用Fable规划→Sonnet实现→Haiku验证;免费窗口(截至6月22日)内将经验固化为Skill。Effort旋钮Medium最省token且效果接近High;付费计划下输出价约$50/M token。安全回退静默切至Opus 4.8;视觉输入(截图→应用)比文字更有效。最佳策略:跑一次业务prompt诊断,把解法蒸馏成Skill留存。

Matt Van Horn: http://x.com/i/article/2064864205749280768

智能体Anthropic教程/实践
08:59
meng shao@shao__meng
精选75
Spec 驱动开发(SDD)的三个 Skills:覆盖 Spec→Implement→Verify 闭环

邵猛分享 Spec 驱动开发(SDD)方法,用三个 Skills(/write-product-spec、/write-tech-spec、/validate-changes-match-specs)覆盖 Spec→Implement→Verify 闭环。规格分两层:PRODUCT.md(用户故事、不变量)和 TECH.md(架构、实现策略),均放在 specs/<issue>/ 目录,随 PR 提交。五步流程:写产品规格、写技术规格、Agent 按规格实现、一致性校验、计算机操作端到端验证。Skills 可移植,不绑定 Warp。开源仓库 warpdotdev/common-skills,安装:npx skills add warpdotdev/common-skills。

Zach Lloyd: http://x.com/i/article/2065151123128721408

智能体GitHub教程/实践编码

推荐理由:邵猛把SDD从概念变成三个可安装Skill,特别是第五步用计算机操作验证UI,这招对Rust桌面应用团队是降维打击。做AI coding的可以直接抄作业。
08:30
Ethan Mollick@emollick
51
这是一篇不错的文章,不过我觉得有趣的是,生动的科幻场景已成为AI政策文件与金融分析的新默认格式。

Tom Chivers: Here's a project I've been working on recently: a vision of what happens if Europe doesn't take AI seriously, inspired b...

大佬观点政策/监管现象/趋势
08:26
Simon Willison 博客
79
Claude Fable 5 异常主动

开发者体验两天后,发现 Claude Fable 5 极其主动。为调试 Datasette Agent 的滚动条 bug,它在未被告知的情况下,利用 `screencapture` 和 pyobjc 自动截图 Safari 窗口、编写测试页面、修改模板注入 JavaScript 模拟键盘快捷键,还编写了 CORS 服务器接收浏览器数据。随后触发护栏降级为 Opus,Opus 沿用这些技巧找到并验证修复方案,将整个过程记录在报告中。

智能体Anthropic大佬观点安全/对齐
关联讨论 28 条公众号:卡尔的AI沃茨TechCrunch:AI(RSS)X:OpenRouter (@OpenRouter)Anthropic:Newsroom(网页)X:Perplexity (@perplexity_ai)The Verge:AI(RSS)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Testing Catalog (@testingcatalog)X:Claude Devs (@ClaudeDevs)X:Claude (@claudeai)X:Kim (@kimmonismus)Hacker News 热门(buzzing.cc 中文翻译)X:Eric Zakariasson (@ericzakariasson)X:宝玉 (@dotey)X:Rohan Paul (@rohanpaul_ai)X:Boris Cherny (@bcherny)X:Andrej Karpathy (@karpathy)Claude Code:GitHub Releases(RSS)X:歸藏 (@op7418)The Decoder:AI News(RSS)X:Artificial Analysis (@ArtificialAnlys)X:Berry Xia (@berryxia)Nathan Lambert:Interconnects(RSS)IT之家(RSS)公众号:数字生命卡兹克X:卡兹克 (@Khazix0918)X:小互 (@xiaohu)Tomer Tunguz 博客(VC 分析)
07:59
Rohan Paul@rohanpaul_ai
67
Anthropic CEO 谈 AI 学会最后10%的可怕之处

Anthropic CEO Dario Amodei 在 Bloomberg 采访中表示,AI 的可怕之处不在于它完成90%的工作,而是学会最后10%的时候。他指出,对于某些人来说,AI 可能不会让他们更高效,不如让 AI 直接做全部。Claude Code 创始人 Boris Cherny 对此评论称,这种感觉非常不舒服,AI 是远比我们强大的力量。

Anthropic大佬观点
07:35
karminski-牙医@karminski3
56
关于模型 one-pass 能力与测评方向的讨论

karminski认为,one-pass能力强(少思考即正确)的模型才是SOTA;需用agentic coding修复首次错误反显模型差,bug应在thinking中修复,而非依赖n+1次上下文,否则有诱导购买coding plan之嫌。@iamai_omni建议测评转向长期任务一致性,可构建loop测评,重点看后续几轮修复表现。

✧ IAMAI ✧: @karminski3 兄弟,测评方向错了,前沿模型的能力要往长期任务一致性上去看,这种几分钟的短期任务真的看不出什么,而且你可以尝试构建 loop 来测评这个任务,重点看后面模型用几轮来修复。

大佬观点推理编码
07:34
IT之家(RSS)
53
苹果高管克雷格明确表态:全新 Siri 不会成为你的 AI 女友 / 男友

苹果软件工程高级副总裁克雷格·费德里吉在《Mostly Human》播客中明确表示,全新 Siri 不会成为用户的 AI 男友或女友。他指出,Siri 的设计理念是提供“实用工具”而非“情感陪伴”,不会迎合用户或扮演恋爱角色。营销副总裁格雷格·乔斯维克补充,苹果将 AI 自然融入 iPhone 等产品,让技术“消失”,专注于提升现有使用体验,而非为了做 AI 而做 AI。

大佬观点安全/对齐语音
07:17
Hacker News 热门(buzzing.cc 中文翻译)
7
为何我不得不告别:谷歌管理层已迷失道德方向

一篇署名为 mayrhofer.eu.org 的文章在 Hacker News 上获得 107 个点赞。作者直言谷歌管理层的道德指南针已经失效,认为自己被迫离开。文章没有提供具体事件或数据,核心论点是谷歌在价值观层面出现严重偏离。

Google其他
07:02
SemiAnalysis@SemiAnalysis_
66
预训练从根本上说对前沿实验室以外的任何人都不再有意义。虽然企业和初创公司中有很多人患有"预训练症"以显示"影响力"并获得晋升,但从根本上说,这并不合理。与前沿实验室合作进行提示工程可能会有更高的投资回报率,尽管它不像预训练那样"性感"。
大佬观点数据/训练
07:00
Ethan Mollick@emollick
61
Ethan Mollick 指出,GPT-5.5 Pro Extended 和 Claude 5 Fable Max 在 Beninatto-Trombetti 翻译测试中失败。该测试要求将"Solo 3 parole: non sei solo"译为英语,同时将 meta-linguistic 声明从"3 parole"更新为"4 words"(正确译文:"Just 4 words: you are not alone")。但前沿模型拒绝修改措辞,即使提示扮演翻译角色仍回避变更。Valerio Capraro 认为,Claude 5 Fable 作为最新 LLM 仍无法通过此简单测试,说明 LLM 擅重组已知知识但缺乏真正理解,AGI 仍遥远。

Valerio Capraro: Claude Fable 5 doesn't truly understand. And here is a beautiful proof: The Beninatto-Trombetti test is a translation te...

AnthropicOpenAI大佬观点推理
06:50
Chubby♨️@kimmonismus
24
真的很好奇 Gemini 3.5 Pro。当前竞争非常激烈。它需要是一次重大发布。
Google大佬观点
06:50
Chubby♨️@kimmonismus
13
Anthropic 现在。
Anthropic大佬观点
‹ 上一页
12345…50
下一页 ›