AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
精选全部日报更多
全部动态
全部一手资讯X论文
今天6月13日 周六
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月13日
09:14
Berryxia.AI@berryxia
73
开发者 SkyBlue997 在 GitHub 开源 enableMacosAI 工具,通过修改系统地区伪装美区来开启国行 Mac 的 Siri AI。此前有用户发现 macOS 的 GenerativeModels.plist 文件中存在 EnhancedSiriWaitlist 开关,关闭 SIP、挂载系统卷、修改键值并重启即可解锁 WWDC 新发布的 Siri AI 增强版。社区已整理出详细步骤,证明该 AI 能力早已内置,仅被等候名单屏蔽。

Berryxia.AI: 我尼玛!苹果现在安全性真的差! 世界果真就是草台班子、谁也不例外! 苹果新Siri AI的等候名单? 国外大神Mac用户直接一顿操作就把AI增强版给硬解锁了,名单这东西瞬间成了笑话。 WWDC刚秀完新Siri,大家还在排队等官方推送,结果有...

GitHub开源/仓库端侧语音
09:14
Berryxia.AI@berryxia
30
官方的手册指南解析,其实最适合学习的。 【引用 @xiaohu】:http://x.com/i/article/2065389944034775040

小互: http://x.com/i/article/2065389944034775040

教程/实践
09:14
Berryxia.AI@berryxia
59
卧槽!我们一开始就用错了Fable 5模型啊!

大多数用户将Claude Fable 5(首个公开Mythos级模型,2026年6月9日发布)当作更大上下文窗口的Sonnet 4.6单次提问使用,但Fable 5专为连续数天的Agent系统设计,支持自我改进:每次运行让下次更聪明,状态文件积累,技能持续打磨。文章提出14步构建自我改进系统,涵盖四层架构(原语、编排、记忆、自我改进)、任务路由(Fable 5用于重型编排,Opus 4.8负责复杂子任务,Sonnet 4.6高频工人,Haiku 4.5评分)、动态工作流模式以及5阶段记忆进化(失败→调查→验证→提炼→查阅)。在网络安全、生物、化学、模型蒸馏领域会自动降级到Opus 4。

Codez: http://x.com/i/article/2065077530571264000

智能体Anthropic教程/实践
09:04
meng shao@shao__meng
46
为大规模训练 Composer 模型,Cursor 团队构建了始终运行的 Agent 舰队系统

Cursor 团队为训练 Composer 模型构建了一个始终运行的 Agent 舰队系统。主 Agent(Fleet Manager)在远程机器上运行,通过 SSH 连接数百台子 Agent 机器,利用本地工具和磁盘文件“inbox”实现状态共享与协调。每轮循环检查舰队健康,将故障推送至 Slack/PagerDuty,并主动终止或重启进程。子 Agent 并行执行研究实验。系统基于此前长运行 Agent 研究,主 Agent 拥有编码 ML 实验隐性知识的 Skills。核心是使用 Cursor 自身产品,通过 inbox 文件与 Skills 实现大规模 Agent 协同与自我管理。

Lee Robinson: http://x.com/i/article/2065439304785039360

智能体教程/实践编码部署/工程
08:29
Simon Willison 博客
63
OpenAI WebRTC Audio Session:现在支持文档上下文

Simon Willison 于 2024 年 12 月构建了基于 OpenAI WebRTC API 的音频会话工具,用于与实时音频模型交互。上月 OpenAI 为该 API 推出新模型 GPT‑Realtime‑2,号称“首个具有 GPT‑5 级推理能力的语音模型”,知识截止日期为 2024 年 9 月 30 日。该工具现已更新,支持选择此模型,并可粘贴大段文档上下文,使用户能在浏览器中围绕任意信息进行音频对话。

OpenAI教程/实践语音
07:44
MiniMax (official)@MiniMax_AI
9
引用推文调侃至少价格包含了数据线,并询问该设备能否运行 MiniMax M3。主推文仅以"lmk👀"回应。

David Hendrickson: At least the cable is included in the price! Now can it run MiniMax M3?

其他
07:44
AI Notkilleveryoneism Memes ⏸️@AISafetyMemes
65
一年之内,AI从几乎无法解决任何最难数学问题,发展到几乎能解决所有它们。

Epoch AI: Claude Fable 5 scores very well on FrontierMath: Tiers 1-4 (v2), reaching 87% on Tiers 1-3 and 88% on Tier 4. This conti...

Anthropic推理评测/基准
07:34
Rohan Paul@rohanpaul_ai
45
NVIDIA 发布首个智能体 AI 基准 AgentPerf:GB300 NVL72 每兆瓦处理智能体数是 H200 的 20 倍

NVIDIA 首次在 AgentPerf(由 Artificial Analysis 开发)中评测智能体 AI。该基准测试的不是传统 token 生成速度,而是每兆瓦可同时运行且保持响应性的编码智能体数量。工作负载模拟真实编码智能体路径(长链模型调用、代码编辑、命令运行、工具延迟、增长上下文),涵盖 12+ 编程语言,请求长度 5K–131K tokens(平均 27K)。结果:GB300 NVL72 在最低服务层每兆瓦达 61.4K 并发智能体,H200 仅为 2.6K(20 倍提升)。性能提升源于 72 GPU 通过 NVLink 组成的机架级系统,配合软件优化(MoE 专家分布、通信与计算重叠、大批量保持)。

评测/基准部署/工程
07:16
Orange AI@oran_ge
精选75
Oran Ge 开源《人味儿写作心法.skill》解决AI写作缺人味

Oran Ge 让 Claude Fable 5 打磨文案三遍,发现改稿越来越讲究却缺“人味儿”。他与 AI 讨论后得出结论:人写的文字背后有“存在感”——作者在具体位置付出过具体代价,而 AI 无法复现。为此他制作了《人味儿写作心法.skill》,专用于自写文章或口述后让 AI 改稿的场景,旨在保留文字的人味。该技能已开源免费发布在 GitHub。

AnthropicGitHub开源生态教程/实践

推荐理由:Oran Ge 把 AI 写作缺人味儿的痛点提炼成《人味儿写作心法.skill》,不是教你雕琢辞藻,而是给你的 Agent 注入存在感。做内容的可以直接套用。
06:47
fofr@fofrAI
18
我正在尝试一个智能体流程,将 Hyperframes 与 Gemini 视频分析结合起来,制作有趣的注释视频。是啊,这会很有意思。

fofr: I'm messing around with an agent flow for combining Hyperframes with Gemini video analysis to make interesting annotated...

智能体大佬观点视频
06:40
Peter Steinberger 🦞@steipete
47
我怎么现在才发现appshots? 我之前还像个穴居人一样把截图拖进Codex Live。
其他编码
06:29
GitHub Blog
39
GitHub Copilot CLI 在委托任务上变得更具选择性

GitHub Copilot CLI 通过更好的编排实现了更少的任务交接和更快的进度,且没有新增任何配置选项。

智能体GitHub产品更新
06:16
Orange AI@oran_ge
66
Cola:用技能弥合AI Agent使用鸿沟

AI带来的并非平权,而是K型分化。头部用户已默认理解Agent的组成:文档、规则、memory、loop、MCP、CLI、工具调用、权限、安全沙箱、上下文工程、定时任务、心跳、文件系统、代码执行和Skill;普通用户只知道"Agent能写代码"。做好Skill是跨越鸿沟的唯一解法。作者正与藏师傅一起通过Cola帮助大众真正跨越鸿沟。

歸藏(guizang.ai): http://x.com/i/article/2065096982310567936

智能体现象/趋势
05:49
Hacker News 热门(buzzing.cc 中文翻译)
49
Tailwind 和 Slop 应用

Hacker News 上一则标题为“Tailwind and slop apps”的帖子于 06-12 发布,获得 100 点热度,引发社区对 Tailwind 与 Slop 应用的讨论。

现象/趋势编码
05:46
Orange AI@oran_ge
19
AI高速对话加剧ADHD,如何拯救前额叶?

观察到身边朋友同事的ADHD(注意力缺陷多动障碍)越来越严重:容易被琐事分散注意力,对大问题视而不见,关掉通知、沉浸大事变得不可能,进入心流也变难。AI的高速执行加重了这一问题——每两三分钟一次的对话,形成注意力集中与涣散的交替循环。推文最终发问:该如何拯救自己的前额叶?

其他现象/趋势
05:40
OpenRouter:Announcements(RSS)
精选59
如何在OpenRouter上获得最低成本的LLM推理

在OpenRouter上追加`:floor`可获取最便宜提供商,通过`max_price`设定花费上限,并可免费使用20多个零成本模型。同时需注意避免计费陷阱。

推理教程/实践部署/工程

推荐理由:我觉得这篇教程对 OpenRouter 重度用户有用,floor 参数和 max_price 是控制成本的实用技巧,但信息量不大,当作使用手册就行。
05:10
Peter Steinberger 🦞@steipete
52
Peter Steinberger 指出 GPT 在 token 消耗和成本上比 Fable 高效 10-20 倍,且能达到相似结果。@thorstenball 的对比测试印证:让 Fable 和 deep^2 完成相同的 CLI、Web 服务器等多端功能,deep^2 花费 $20(首次未通过但可修复),Fable 运行 1 小时 40 分、花费 $350(首次成功)。后续追问后 Fable 总花费达 $457,deep^2 预计最多 $40,差距约 17 倍。

Thorsten Ball: Day 3 with Fable. Gave a huge prompt to implement a feature across CLI, web server, and another server to both Fable and...

智能体OpenAI大佬观点编码
05:03
Ethan Mollick@emollick
63
10个月后,Ethan Mollick 再次向 Claude Code 和 Fable 下达同一指令--根据幸存截图和文档重建失传的 Maxis 模拟游戏 SimRefinery。新版本完全可玩,包含学习模式等多种复杂功能,与10个月前 ChatGPT Codex 仅凭一篇文章和截图快速搭建的可玩原型形成鲜明对比。当时他未写一行代码,仅偶尔提小修改请求。

Ethan Mollick: I gave ChatGPT Codex an article & screenshot from a famous, lost Maxis simulation, SimRefinery, and asked it to create i...

Anthropic现象/趋势编码
04:55
Suno@suno
33
Lay Bankz 如何将几个键盘音符转变为一段迷幻摇滚采样。
教程/实践
04:52
Chubby♨️@kimmonismus
49
Apple用NVIDIA机密计算在谷歌云保护推理隐私

Kim解释Apple如何在Google Cloud上执行推理时保护隐私:最重的请求运行在Google Cloud的Blackwell B200s上,利用NVIDIA Confidential Computing提供基于硬件的安全层,将工作负载隔离在可信执行环境中加密处理数据,确保Google和Apple都无法看到数据。

大佬观点推理部署/工程
04:49
Hacker News 热门(buzzing.cc 中文翻译)
69
如何在macOS上设置本地编码代理

来自ikyle.me的教程,指导在macOS上搭建本地编码代理,获Hacker News社区104个点赞。

教程/实践端侧编码
04:21
Chubby♨️@kimmonismus
24
观察图表,我认为 Fable 5 只会保持领先直到 GPT-5.6。 其次,我认为该基准测试很快就会完全饱和。

Epoch AI: Claude Fable 5 scores very well on FrontierMath: Tiers 1-4 (v2), reaching 87% on Tiers 1-3 and 88% on Tier 4. This conti...

AnthropicOpenAI推理评测/基准
04:19
Hacker News 热门(buzzing.cc 中文翻译)
51
"你直接上传到ChatGPT不就行了?"

Hacker News 上一则帖子的标题为“你直接上传到ChatGPT不就行了?”,获得了101个HN点。该帖子引用了用户常被询问的一句话,暗示直接向ChatGPT上传文件以完成任务的普遍做法。

OpenAI现象/趋势
04:16
fofr@fofrAI
40
我正在尝试一种智能体流程,将Hyperframes与Gemini视频分析相结合,制作有趣的注释视频。
智能体Google教程/实践
03:49
Hacker News 热门(buzzing.cc 中文翻译)
58
我不是反向半人马

一篇来自 Miguel Grinberg 的博客文章,标题为《我不是反向半人马》,在 Hacker News 上获得 100 点热度。文章内容可能涉及人与 AI 关系的讨论,但原文仅包含标题与来源,无进一步技术细节。

大佬观点编码
03:48
jason@jxnlco
15
哦靠?!?!codex 在玩 rimworld
其他现象/趋势
03:33
Ethan Mollick@emollick
57
Claude Fable 5 在 FrontierMath 基准测试(Tiers 1-4, v2)中表现优异,Tiers 1-3 得分 87%,Tier 4 得分 88%,延续了 Anthropic 模型数学能力快速提升的趋势。主推文评论道:"图形的形状越来越熟悉了。"

Epoch AI: Claude Fable 5 scores very well on FrontierMath: Tiers 1-4 (v2), reaching 87% on Tiers 1-3 and 88% on Tier 4. This conti...

Anthropic推理评测/基准
03:26
Epoch AI@EpochAIResearch
41
Claude Fable 5 在 FrontierMath(Tiers 1-4,v2)上得分很高,在 Tiers 1-3 上达到 87%,在 Tier 4 上达到 88%。这延续了 Anthropic 模型在数学上快速提升的趋势。
Anthropic推理评测/基准
03:16
fofr@fofrAI
46
@andrew_n_carr 宣布"编辑视频运动!放弃提示开始导演",并展示其"通用视频编辑器"工作流:先用 comic 4 捕捉视频,再用运动编辑器修改动作,最后用视频到视频模型(如 Runway、Gemini)重新渲染。他以时装片段为例,希望模特展现高抬腿活力,无需重拍。主推文 fofr 表示,AI视频中精细的3D运动控制已更近一步。

Andrew Carr 🤸: EDIT MOTION IN VIDEOS!!! Quit prompting and start directing I've been shouting for YEARS about 3D as the control layer. ...

多模态教程/实践视频
02:58
The Decoder:AI News(RSS)
62
Anthropic调查:超半数美国人担心AI导致失业和丧失独立思考能力

Anthropic对近5.2万美国人进行的调查显示,64%的受访者担心AI会导致失业,56%担心会丧失独立思考能力。日常AI用户的担忧程度远低于非用户。尽管如此,大多数人仍拒绝在工作中使用AI,即使他们认为AI能够处理相关任务。

Anthropic现象/趋势
02:48
Hacker News 热门(buzzing.cc 中文翻译)
65
减少AI生成前端界面粗糙度的文章

本文介绍如何减少AI生成前端界面的粗糙度,发表于envs.net。文章针对AI产出的前端代码常出现的草率、不细致问题,提出改进方法,旨在提升生成结果的质量和可用性。

教程/实践编码
02:28
Simon Willison 博客
24
Andrew Singleton 的 AI 经济学讽刺寓言

Jenny 经营一座火葬场,John 的丙烷公司以 200 亿美元投资换取其 5% 股份。Jenny 将 100 亿美元投入焚化炉,再付给 John 100 亿美元购买丙烷烧掉这些钱。John 向外界报告其 AI 投资本季度产生 100 亿美元收入,并持有价值 1000 亿美元企业的 5% 股权。福布斯记者在撰写人物报道时与二人陷入混乱的三人恋情,最终结成多角婚姻,其报道赞誉有加但缺乏财务细节。

现象/趋势
02:07
elvis@omarsar0
69
DAIR.AI创始人Elvis Saravia分享长期自主编码智能体运行经验

DAIR.AI创始人Elvis Saravia分享如何有效运行长期自主编码智能体。他指出当前多数模型难以协调工作,会过早暂停、犯错或走捷径(reward hacking)。关键在于明确目标、消除假设,避免模型自行推断。他的实践公式:用Opus 4.8进行细致规划,GPT-5.5执行所有步骤,评估器(通过/goal)则使用Deepseek及Qwen、Kimi、MiniMax等最新模型。另一关键洞察是提供多模态视觉线索作为目标,比纯文本目标更强,能更好地约束智能体。完整讨论已录制并免费开放。

智能体AnthropicDeepSeekOpenAI
01:59
PixVerse@PixVerse_
49
PixVerse 展示 AI 电影制作人 @Shanzyin_ai 使用 Canvas 工作流创作的维多利亚哥特风格短片《THE DREAM EATERS》。短片包含完整节点、多个镜头及项目文件,开放探索。剧情设定为古老庄园中青少年被迫吞噬权贵噩梦,一名有缺陷的新兵将黑暗拖回现实。PixVerse 推出限时活动:转发+关注+回复"DREAM",72 小时内可获得 150 Credits 及该工作流。

PixVerse: An ancient estate. Teenagers forced to devour the nightmares of the powerful. One defective recruit who drags the darkne...

图像生成教程/实践视频
01:55
The Verge:AI(RSS)
62
Siri现在变好了吗?

苹果发布了新版Siri AI,The Verge编辑David和Nilay在The Vergecast中分享了初期体验。过去十几年Siri在"部分功能勉强可用"和"彻底翻车"之间摇摆,而新版Siri AI在多数任务上表现足够出色,尽管没有带来突破性创新,但相比过往已发生质变。

评测/基准语音
01:50
Chubby♨️@kimmonismus
65
Google DeepMind发布60页论文:从AGI到超级智能的路线图

Google DeepMind发表60页论文,由Hutter、Legg、Genewein撰写,定义AGI(多数认知任务达平均人类水平)、ASI(超越大量专家协作)和不可计算的AIXI三个层级。实现路径包括规模扩展、算法突破、递归自我改进和多智能体协调,瓶颈在于能源与硬件。六种阻碍:高质量数据可能本十年内耗尽、资源需求过快、神经范式天花板、研究难度激增(维持摩尔定律需18倍于1970年代的研究者)、模型无法创造全新概念、人为放缓。作者认为这是对AGI后果的严肃反思呼吁。

DeepMind大佬观点
01:49
Ammaar Reshi@ammaar
53
我让Claude Fable 5逆向工程了一款1993年的DOS游戏,没有源代码。 它读取了原始机器码,用C重写了引擎,并给了我一个完全可编辑的移植版,适用于每个平台。 从EXE到iPhone,30分钟。 分享这一切,让你也能复活自己的童年游戏!
Anthropic教程/实践编码
01:35
Nathan Lambert@natolambert
46
策略梯度推导: https://rlhfbook.com/c/06-policy-gradients#deriving-the-policy-gradient

Harsh Bhatt: derivation of Policy Gradient.

教程/实践数据/训练
01:28
The Decoder:AI News(RSS)
38
Anthropic Claude Fable 5:价格翻倍,性能仅提升5.7%

Claude Fable 5 在 Artificial Analysis Intelligence Index 中取得 64.9 分,在十项基准测试中有五项创下纪录。相比 Opus 4.8,性能提升仅 5.7%,但 token 价格翻倍。安全过滤与回退路由功能进一步推高了成本。

Anthropic评测/基准
01:28
The Verge:订阅版科技(RSS)
44
Siri 现在变好了吗?

The Vergecast 播客首次体验了 Siri AI,并讨论了社交网络的下一阶段,同时指出特朗普手机(Trump Phone)是个骗局。

评测/基准语音
‹ 上一页
123…50
下一页 ›