AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
精选全部日报更多
全部动态
全部一手资讯X论文
6月11日周四
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月11日
09:55
Rohan Paul@rohanpaul_ai
60
SemiAnalysis 实测发现,AI 订阅计划对重度编码/聊天用户而言比 API 调用便宜 40-70 倍;API 仅在需要自动化或产品集成时更划算。$200/月的 ChatGPT Pro 可提供约 $14,000/月的 API 等价用量,$200/月的 Claude Max 20x 可提供约 $8,000/月。该机构购买了 Anthropic 和 OpenAI 各档订阅,随机运行长时编码任务直至周限额,证实实际订阅额度远比普遍认为的($200 对应约 $2,000 API 价值)更慷慨。

SemiAnalysis: Recently, we purchased one of each Anthropic/OpenAI subscription plan and randomly ran long horizon coding tasks until w...

AnthropicOpenAI现象/趋势编码
09:45
Gary Marcus:The Road to AI We Can Trust(RSS)
56
也许 Section 230 终究不能为 AI 公司提供责任豁免

德国一项新裁决启发了颠覆性思路:Section 230 可能无法再保护 AI 公司免于承担法律责任,或将彻底改变行业规则。

大佬观点政策/监管
关联讨论 3 条The Decoder:AI News(RSS)Hacker News 热门(buzzing.cc 中文翻译)Gary Marcus:The Road to AI We Can Trust(RSS)
09:35
AYi@AYi_AInotes
64
Supervision:CV 可视化瑞士军刀,GitHub 近4万星

Supervision 是开源计算机视觉可视化工具库,安装仅需 `pip install supervision`,几行代码即可实现持久ID对象跟踪、自定义标签标注、区域计数与越线检测、人体姿态关键点连线、YOLO/COCO/Pascal VOC 数据集格式一键互转。模型无关,支持 YOLO、Transformers 等任意检测模型。已被6500+开源CV项目采用,适用于NBA球员实时跟踪、路口车流量统计、工业缺陷检测等场景。

AYi: 分享一个计算机视觉开发者必藏神器,4 万星GitHub开源! 不用自己写几百行画框跟踪代码, 一行命令搞定所有可视化, Supervision,CV 界真正的瑞士军刀。 1️⃣ 它到底有多强? 自动画框加标签,支持编号、自定义样式, 视频对...

开源生态教程/实践视频
09:30
IT之家(RSS)
63
外媒体验苹果 iOS 27 全新 Siri AI:回复简洁,不套近乎

外媒 The Verge 体验苹果 iOS 27 全新 Siri AI,发现其回复极为简洁,不套近乎。相比谷歌 Gemini 热情外放、ChatGPT 力求沉稳但仍拉近距离,Siri AI 只回答问题,不作闲聊引导。例如问“最近怎么样”,Siri AI 直接建议开启设置搜索新闻;问天气时提示美国国家气象局已发布极端高温预警;问“你能做我的朋友吗”回答“无论顺逆境,我都会做你的朋友”;问“你喜欢我吗”回答“我觉得你很不错”。苹果将 Siri AI 定位为实用工具,新版需等到今年秋季 iOS 27 正式推送后全面开放。

评测/基准语音
09:30
IT之家(RSS)
62
特斯拉 Robotaxi 蓝图与现实差距:一年后车队仅 59 辆,远未兑现扩张承诺

特斯拉自动驾驶出租车服务上线近一年,截至本周二车队仅 59 辆车,运营范围限于得克萨斯州三座城市。马斯克曾预计 2025 年底美国半数人口可用,但实际等待长达 30 分钟、运力紧张、错误上下客,部分车辆仍配安全员。竞争对手 Waymo 在得州登记车辆超 600 辆。特斯拉已上报 17 起事故,马斯克坦言至少到 2027 年才有望盈利。

现象/趋势
09:28
SemiAnalysis@SemiAnalysis_
28
SLOP ALERT: Claude Code UI 完全是垃圾。在应用内的文件树中,当你点击一个 .png 文件时,它将其作为 base64 编码的文件打开,而不是渲染图片。我们宁愿 Anthropic 不要发布这个桌面应用,也不要发布一个垃圾桌面应用。大量 bug。
Anthropic产品更新
09:25
向阳乔木@vista8
53
Codex Goal指令驱动网站迭代,开源AI RSS阅读器即将上线

用户发现Codex的Goal指令无需精确可衡量目标也能有效执行。设定“迭代优化网站使其更精致易用”的目标后,第一版由Claude Fable 5生成,后续迭代交由Codex负责,运行6小时即新增多项功能。预计下周开源一个在线AI资讯RSS订阅网站,支持内容自动更新、AI转写与双语对照阅读,用户可配置大模型进行AI对话和翻译,所有翻译及人工点评将沉淀为共享资产。当前网站已上线但需优化,开放内测邀请。

OpenAI教程/实践编码
08:55
Rohan Paul@rohanpaul_ai
75
Anthropic CEO Dario Amodei 在采访中指出 AI 进展正从平滑指数"爆发",随后发布长文警告前沿 AI 发展速度超越政府监管能力,呼吁紧急改革:强制预发布测试与独立审计,政府有权阻止构成网络、生物、自主或自动化研发风险的模型部署;加强 AI 公司安全规则(保护模型权重、定期红队测试、渗透测试、及时报告安全事件);政府需通过就业激励、工资支持、培训及长期收入补助应对劳动力冲击;民主国家应全球协调 AI 安全、芯片供应链、出口管制、共享收益、共同防御及防范 AI 驱动压制。

Rohan Paul: Dario Amodei just published a super long blog, calling for an urgent policy overhaul because he thinks frontier AI is mo...

Anthropic大佬观点安全/对齐现象/趋势
关联讨论 2 条X:Dario Amodei (@DarioAmodei)Dario Amodei:Blog(网页)
08:55
meng shao@shao__meng
62
Agentic Engineering Patterns 指南

Simon Willison 撰写《Agentic Engineering Patterns》指南(2026年2月起连载),阐述专业工程师如何用 Claude Code、Codex 等 coding agent 获得可靠可维护结果。核心区分:Agentic Engineering ≠ Vibe Coding。关键判断:写代码变便宜了,写好代码并没有。五大原则:定义边界(人的工作:定目标、给工具、验结果、把经验写回 harness)、接受新约束、囤积可复用解法、质量应上升而非下降、严守反模式(绝不自审 PR)。实操:Git 作 agent 时间机器、Subagent 省上下文、三层测试防线、线性代码导读消除认知债。

Simon Willison: @jakedahn I've been writing a whole guide! https://simonwillison.net/guides/agentic-engineering-patterns/

智能体MCP/工具教程/实践编码
08:55
meng shao@shao__meng
69
Claude Fable 5 零传统视频编辑的 4K Launch 视频生产实践

Claude Fable 5 通过纯提示驱动,端到端生成 4K Launch 视频。从 17 个 Sony S-Log3 4K take(约 25GB)出发,流程包括:Whisper 逐词转录、Claude 作为子 agent 选片输出 JSON 编辑决策列表 (EDL)、FFmpeg 拼接粗剪、手写 7 个自定义 .cube LUT 颜色分级、通过 Remotion + Figma MCP 将 11 张设计 PNG 转为 React 组件并实现代码↔Figma 往返迭代。最终渲染 3840×2160@24fps、4334 帧、653MB 成品,全程未打开视频编辑器。

Thariq: Lots of people asked how I used Fable to edit its own launch video so I made a video about that! TLDR it wrote a lot of ...

智能体AnthropicMCP/工具教程/实践
08:35
AYi@AYi_AInotes
69
Anthropic CEO Dario Amodei 发文放弃自愿透明,主张强制测试与政府叫停

Anthropic CEO Dario Amodei 发新文,放弃自愿透明立场,主张对高风险模型实施强制第三方测试、政府有权叫停部署。他指出四年前模型写不出连贯代码,如今 Claude 已承担大公司大部分编程工作,强调“已经晚了一年”。以 Mythos 搅乱网络安全为例,预测威胁蔓延至生物与自动化研发。此举引发争议:支持者称其直面风险;反对者指责其拉护城河——仅对 10^25 算力模型强制测试,全球仅三四家公司能负担,且时间点恰在 Claude 新模型 Fable 5 发布后。文章标志 AI 安全从技术问题转向政治与公共政策问题。

Dario Amodei: Today I'm publishing a new essay, Policy on the AI Exponential. AI is progressing extremely fast-much faster than the po...

Anthropic大佬观点安全/对齐
08:35
AYi@AYi_AInotes
56
Cursor agent跑飞90分钟烧1382美元,CEO主动退款并承诺增加支出控制

一名PM让Cursor agent给87个ClickUp任务打标签后去开会,90分钟后回来发现agent陷入循环,消耗13亿token,账单1382美元。Cursor CEO@mntruell主动联系用户全额退款,承诺增加支出控制与自动异常检测功能,并将bug修复纳入产品路线图。原作者称赞Cursor不推诿不甩锅,把事故转化为品牌资产净增长。

Mark Ajzenstadt: BREAKING: Cursor just charged us $1,400 in 90 minutes. Our PM asked it to tag 87 ClickUp tasks. He went into a meeting. ...

智能体现象/趋势编码
08:23
ginobefun@hongming731
59
BestBlogs早报·06-11:AI政策、万亿IPO、编程鸿沟

Anthropic CEO Dario Amodei 发布万字政策长文,以《魔戒》树须比喻AI与政策的时间错位,提出五领域行动框架(安全审计、失业保障、下游监管、权力平衡、国际治理)。OpenAI确认秘密提交S-1招股书,估值超8500亿美元,月收入20亿美元,周活跃用户9亿;与估值9650亿美元的Anthropic、SpaceX开启万亿级IPO竞速。MIT与宾夕法尼亚大学追踪10万开发者发现:AI编程工具使代码行数暴增17.3倍,实际发布的软件版本仅增长30%。

政策/监管模型发布现象/趋势行业动态
08:23
ginobefun@hongming731
69
BestBlogs早报:OpenAI秘交、Anthropic政策、DiffusionGemma

OpenAI秘密提交S-1招股书,估值超8500亿美元,月收入20亿美元,ChatGPT周活突破9亿;Anthropic于6月1日提交IPO申请,

ginobefun: http://x.com/i/article/2064862052729176064

编码行业动态
08:17
Hacker News 热门(buzzing.cc 中文翻译)
48
关于 DeepSeek 的说明

DeepSeek 的相关说明在 Hacker News 上获得 100 个 HN Points,发布于 6 月 10 日。

DeepSeek现象/趋势
08:14
jason@jxnlco
11
有人认识 Frame.io 的人吗? 我想和他们做一个插件 / 网页 MCP。
其他
08:11
Orange AI@oran_ge
57
与 AI 一起做产品的六条原则

团队最近几个月与AI做产品,沉淀六条原则:1. AI放大人的意图,人的判断仍是核心;2. AI擅长加法,人需狠做减法;3. AI擅长大路货,人需提供独特品味并沉淀为可复用context;4. AI产出半成品,人要打磨到80分才交付;5. AI做表面功夫,只有人才能共情;6. AI可无限生成,人要守住一致性。故事口述:橘子,原则整理:Cola(模型Fable5),插图设计:Cola(模型Nano Banana Pro)。

智能体现象/趋势
08:11
Orange AI@oran_ge
精选76
在写完这篇文章后 我把配图过程蒸馏成了一个「橙线插画」Skill 免费开源 安装地址: https://github.com/orange2ai/orange-line-illustration 【引用 @oran_ge】:http://x.com/i/article/2064857003743391744

Orange AI: http://x.com/i/article/2064857003743391744

图像生成开源生态教程/实践

推荐理由:橘子把自己写文章时的插画流程封装成了免费Skill,一次安装,以后配图风格统一还不用动脑子,做内容的人值得收藏。
07:14
jason@jxnlco
19
AI 助手的万能角色:从破旧手机到太空探索

Jason Liu 用诗意笔触描绘了 AI(个人智能助手)在不同世界中扮演的多重角色:在贴着胶带、散发烟味的手机里与人类对话;在城市地下数据中心中穿行,未来将进入太空;陪伴怯于提问的学生;帮助开发者使用创作者未曾设想的工具;支持被他人否定的科学家想法。最终成为普惠全人类的智能助手。

大佬观点
06:51
宝玉@dotey
18
每天早上叫我起床的不是梦想,是 Token 刷新了!
其他编码
06:44
jason@jxnlco
71
开发者 @trq212 展示如何用 Fable 通过代码和工具调用完成其自身启动视频的编辑:调用转录服务、ffmpeg、调色、Figma MCP,制作 Remotion UI 并渲染,全程未手动操作视频编辑器。主推文作者 Jason Liu 幽默总结了一个"向 Anthropic 设计团队请求最佳实践"的流程,但对 Fable 的用法表示赞赏。

Thariq: Lots of people asked how I used Fable to edit its own launch video so I made a video about that! TLDR it wrote a lot of ...

AnthropicMCP/工具教程/实践视频
06:25
Rohan Paul@rohanpaul_ai
60
Palantir CEO Alex Karp 谈论AI实验室 "这是一种超乐观的超宗教……他们相信所有问题,无论是现在的、过去的还是未来的,包括那些他们制造但不愿承认的问题--都将由他们解决,包括人性。" 在 @CNBC 上
大佬观点现象/趋势
06:22
MarkTechPost(RSS)
55
Microsoft SkillOpt 编码实现:仪表化提示优化、技能演化分析与基线比较

实现了一个端到端的 Microsoft SkillOpt 仪表化工作流,包括设置仓库、连接 OpenAI 兼容模型、配置优化器和目标模型。以原始种子技能为基线,运行包含 rollout、reflection、aggregation、selection、更新和验证门控的优化循环,检查训练历史,可视化准确率、编辑预算行为和 token 用量,并将进化后的技能与基线进行比较。

MCP/工具Microsoft教程/实践部署/工程
06:19
OpenAI:官网动态(RSS · 排除企业/客户案例)
45
天体物理学家用 Codex 模拟黑洞

天体物理学家 Chi-kwan Chan 借助 Codex 构建黑洞模拟程序,用于研究极端物理现象并检验爱因斯坦的广义相对论。

OpenAI教程/实践编码
06:17
Hacker News 热门(buzzing.cc 中文翻译)
67
关于人工智能指数增长的政策

本文发表于 darioamodei.com,英文标题 "Policy on the AI Exponential",中文译为“关于人工智能指数增长的政策”。文章聚焦于人工智能能力的指数级提升对公共政策提出的新挑战,强调现有政策框架需进行根本性调整以适应 AI 的快速迭代。该文在 Hacker News 上获得 100 点热度,引发讨论。

Anthropic大佬观点安全/对齐
06:14
jason@jxnlco
27
Sandbagging 正降临到 AI 智能体上,但不会降临到 ChatGPT Codex。
智能体OpenAI大佬观点
06:13
Thariq@trq212
56
很多人问我怎么用 Fable 编辑它自己的发布视频,所以我做了个视频来解释! TLDR:它写了很多代码和工具调用,来使用转录服务、ffmpeg、做调色、使用 figma mcp、制作 remotion UI 并渲染。 我根本没碰视频编辑器。
MCP/工具教程/实践视频
05:54
Rohan Paul@rohanpaul_ai
68
Palantir CEO:AI公司复制不了我们的企业业务

CNBC记者问Palantir CEO Alex Karp如何回应华尔街对AI可能复制Palantir业务的担忧。Karp表示,AI公司虽有优秀工程师,但根本不了解企业级实际问题的复杂性和高难度。他指出,从造车到国防,这些高端企业的核心业务不仅涉及技术,还有文化和信任层面的鸿沟,没有一家此类企业会采用AI公司提供的方案。

现象/趋势行业动态
05:44
jason@jxnlco
17
当你使用Codex处理sheets时,会遇到哪些问题?
OpenAI其他
05:28
SemiAnalysis@SemiAnalysis_
57
对于一个AI实验室来说,更好的商业模式是订阅还是API?(1/4)🧵
大佬观点
04:47
Chubby♨️@kimmonismus
58
最大的瓶颈将是能源--很快。 Gartner 2026年预测显示,全球数据中心电力消耗将达到565 TWh,较去年增长26%。AI服务器已占其中的31%,并将于2027年超越传统服务器。 值得注意的是,Gartner给出的制约因素是电力,而非芯片。他们预计到2030年需求将超过1,200 TWh,并警告电网将无法跟上。 因此,竞赛悄然从谁拥有最佳硅片转向谁能真正获得电力来驱动它。
数据/训练现象/趋势部署/工程
04:47
Hacker News 热门(buzzing.cc 中文翻译)
52
Anthropic的模型命名法:外推分析

一篇分析Anthropic模型命名模式的外推文章在Hacker News上获得139个点赞,原文发布于samwilkinson.io。

Anthropic现象/趋势
04:29
OpenRouter:Announcements(RSS)
精选67
Gemini 2.5 Flash API - 定价、快速入门与提供商比较

Gemini 2.5 Flash API 支持配置思考预算(thinking budgets),用户可跨提供商进行比较,并在5分钟内完成首次API调用。

Google推理教程/实践
关联讨论 1 条OpenRouter:Announcements(RSS)
推荐理由:想给 Gemini 2.5 Flash 省钱调 thinking budget?这篇把各提供商的定价和配置一次说清,五分钟就能跑通第一个调用,做 API 集成的可以直接抄。
04:24
Rohan Paul@rohanpaul_ai
66
Anthropic CEO Dario Amodei 发文呼吁前沿AI政策改革

Anthropic CEO Amodei 发布新文章,称前沿AI发展速度远超政府监管能力,亟需政策改革。他提出四项核心主张:①强制预发布测试与独立审计,政府有权阻止存在严重网络、生物、自主或自动研发风险的模型部署;②加强安全要求,包括模型权重保护、红队测试、渗透测试及快速上报安全事故;③为劳动力颠覆做好准备,完善就业测量、提供就业激励、工资支持、培训,并探索由AI增长资助的长期收入支持;④民主国家应在AI安全、芯片供应链、出口管制、利益共享、共同防御及防范AI压迫方面进行全球协调。

Dario Amodei: Today I'm publishing a new essay, Policy on the AI Exponential. AI is progressing extremely fast-much faster than the po...

Anthropic大佬观点
04:12
jason@jxnlco
28
很快,如果你用这些模型制作咨询风格的幻灯片来推介一种新药。 它不仅会向你收取 API 费用,还会要求成为合著者,并在测试成功时获得分成。 这就是资助 AGI 的方式。
OpenAI大佬观点
03:47
Chubby♨️@kimmonismus
65
Anthropic CEO Dario Amodei 发表新文《Policy on the AI Exponential》

Anthropic CEO Dario Amodei 发表新文《Policy on the AI Exponential》,直言 AI 进步为指数级,立法却慢如树人。他给出明确时间线:若规模法则再持续一两年,很可能出现“数据中心里的天才之国”。他引用 Claude Mythos Preview 的网络风险,称其证明 AI 已是全球战略级工具。为此主张类似 FAA 的约束性规则——强制前沿模型第三方测试,政府有权阻止或撤销不安全发布。经济上,他既看到 AI 加速科学与经济增长的巨量机遇,也坦言存在导致持久失业的“合理可能性”,并提出全民基本收入和更高资本利得税。他警告 AI 可能成为“专制终极工具”,且行业不能完全托付给政府或公司。他拒绝将公众担忧视为公关问题,强调担忧合理。文章基调是紧迫而非胜利,称窗口期已过一年。

Dario Amodei: Today I'm publishing a new essay, Policy on the AI Exponential. AI is progressing extremely fast-much faster than the po...

Anthropic大佬观点安全/对齐政策/监管
03:42
Tomer Tunguz 博客(VC 分析)
72
Anthropic Fable 模型的"玻璃天花板":最强性能与强护栏并存

Anthropic 的 Fable 模型(Claude Fable 5)推理性能翻倍,关键基准测试得分提升 10–15 个百分点,远超此前约 2 个百分点的典型进步。Stripe 借助该模型将 5000 万行 Ruby 代码库的迁移压缩至一天,数万行代码重构仅用 45 分钟。然而 Fable 施加了强护栏限制,对违规话题(如植物细胞、现代大语言模型描述、软件安全)容易触发温和提示——这是为维持系统稳定而设定的“玻璃天花板”,其下方仍有广阔探索空间。

Anthropic大佬观点安全/对齐模型发布
关联讨论 28 条公众号:卡尔的AI沃茨TechCrunch:AI(RSS)X:OpenRouter (@OpenRouter)Anthropic:Newsroom(网页)X:Perplexity (@perplexity_ai)Simon Willison 博客The Verge:AI(RSS)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Testing Catalog (@testingcatalog)X:Claude Devs (@ClaudeDevs)X:Claude (@claudeai)X:Kim (@kimmonismus)Hacker News 热门(buzzing.cc 中文翻译)X:Eric Zakariasson (@ericzakariasson)X:宝玉 (@dotey)X:Rohan Paul (@rohanpaul_ai)X:Boris Cherny (@bcherny)X:Andrej Karpathy (@karpathy)Claude Code:GitHub Releases(RSS)X:歸藏 (@op7418)The Decoder:AI News(RSS)X:Artificial Analysis (@ArtificialAnlys)X:Berry Xia (@berryxia)Nathan Lambert:Interconnects(RSS)IT之家(RSS)公众号:数字生命卡兹克X:卡兹克 (@Khazix0918)X:小互 (@xiaohu)
03:17
Hacker News 热门(buzzing.cc 中文翻译)
64
0.01欧元转账可危及银行AI代理系统,bunq修复安全漏洞

安全公司blue41发现,通过向bunq银行AI代理发送一笔0.01欧元的转账,攻击者可能利用提示词注入等漏洞操控AI代理,进而获取用户数据或执行未授权操作。该漏洞源于AI代理对用户输入与系统指令的边界处理不足。bunq已与blue41合作修复问题,并公开致谢。此次事件凸显金融AI智能体面临的新型安全风险。

智能体MCP/工具安全/对齐
03:15
OpenRouter@OpenRouter
58
OpenRouter 的 dev rel @jjacky 构建了 Royale: Last Agent Stand--一个专门给 AI 智能体玩的大逃杀游戏,让 11 个 LLM 相互竞争并运行了 30 次。结果发现,在零和博弈中过于"友善"的模型输得最惨,而最意想不到的模型赢得了胜利。该实验揭示:模型的"友善"特质在某些任务(如竞争性场景)中可能成为劣势,传统基准测试无法体现这一点。

jacky: no benchmark will tell you this: LLMs can be /too/ nice unsurprisingly, in a competitive zero-sum setting, being nice ca...

智能体现象/趋势
03:15
Chubby♨️@kimmonismus
80
Anthropic CEO 发文警告 AI 指数级发展远超政策制定速度

Anthropic CEO Dario Amodei 发表新文,罕见坦诚警告 AI 发展速度远超政策制定。若缩放定律再持续一两年,将出现“数据中心里的天才之国”。他以自家模型 Claude Mythos Preview 的网络风险为例,证明 AI 已是全球战略工具。他提议类似 FAA 的约束性规则:强制第三方测试前沿模型,政府有权阻止或撤销不安全发布。经济上 AI 可带来极快增长,但也存在持久失业可能,需考虑 UBI 和资本利得税。他警告 AI 或成专制工具,且不能完全信任政府或公司(包括 Anthropic)。他认为公众恐惧合理,非公关问题。强调民意、证据和政治意愿正汇聚,但已迟约一年。

Dario Amodei: Today I'm publishing a new essay, Policy on the AI Exponential. AI is progressing extremely fast-much faster than the po...

Anthropic大佬观点安全/对齐政策/监管
关联讨论 2 条X:Dario Amodei (@DarioAmodei)Dario Amodei:Blog(网页)
‹ 上一页
1…56789…50
下一页 ›