AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
精选全部日报更多
全部动态今日 198 条
全部一手资讯X论文
6月12日周五
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月12日
06:13
Replit ⠕@Replit
精选72
如何像专家一样使用 Replit 进行提示 🤖 模糊的提示词只会导致更多重写。以下是如何让 Agent 第一次就构建出正确的东西。 🧵 展开线程 ↓
智能体教程/实践编码

推荐理由:Replit 官方教你跟 Agent 好好说话,这些 prompt 技巧对重度 Replit 用户是即时生产力,但出了这个生态圈就没什么用,典型的工具限定型干货。
06:03
elvis@omarsar0
25
今天让我10岁的孩子体验了Codex。 他脸上的兴奋说明了一切。 在用Claude Code CLI折腾了一会儿之后,今天他说:"这就是未来,爸爸。" Codex团队打造了一个漂亮的应用程序。
OpenAI编码评测/基准
06:03
elvis@omarsar0
74
good. now let's undo the nerf stuff as well (引用推文:Anthropic 在遭受强烈反对后,撤回 Claude Fable 5 秘密降低竞争 AI 研究人员性能的政策。Anthropic 对 WIRED 表示将修改安全措施使其可见,并为此前错误权衡道歉。)

Max Zeff: NEW: Anthropic is walking back Claude Fable 5's policy to covertly degrade performance for competing AI researchers, aft...

Anthropic安全/对齐
05:55
MarkTechPost(RSS)
59
xAI 发布 Grok Build 插件市场,首发集成 MongoDB、Vercel、Sentry、Chrome DevTools、Cloudflare 等插件

xAI 推出 Grok Build 插件市场,这是一个终端内插件平台,支持技能、智能体、钩子和 MCP 服务器。所有远程插件均通过 commit-SHA 验证确保安全。首发插件包括 MongoDB、Vercel、Sentry、Chrome DevTools、Cloudflare 及 Superpowers。

智能体MCP/工具xAI产品更新
05:47
Hacker News 热门(buzzing.cc 中文翻译)
70
OpenAI 正考虑大幅降价,以与 Anthropic 争夺用户

OpenAI 正在考虑大幅降低服务价格,以在与 Anthropic 的用户争夺战中占据优势。该消息由 CNBC 报道,来源为 WSJ。

AnthropicOpenAI行业动态
关联讨论 2 条Gary Marcus:The Road to AI We Can Trust(RSS)Bloomberg:Technology(RSS)
05:47
Hacker News 热门(buzzing.cc 中文翻译)
23
汽车前照灯不必这么刺眼

《大西洋月刊》文章指出,现代汽车前照灯亮度过高,对行人和其他驾驶员造成眩光,但通过技术改进和更合理的法规标准完全可以缓解这一问题。作者呼吁重新审视车灯设计,在保证夜间安全的同时减少不必要的刺眼干扰。

其他
05:44
Google Gemini@GeminiApp
45
Get a closer look at Gemini's new Neural Expressive design language at our next Discord community event. 在我们的下一次 Discord 社区活动中,近距离了解 Gemini 全新的 Neural Expressive 设计语言。 Product Marketing Manager Megan C. will be discussing some of her favorite highlights that help improve the Gemini experience, from dynamic visual responses to seamless mode switching. 产品营销经理 Megan C. 将讨论她最喜欢的一些亮点,这些亮点有助于改善 Gemini 体验,从动态视觉响应到无缝模式切换。 👉Join the Discord to watch live: http://discord.gg/gemini 👉加入 Discord 观看直播:http://discord.gg/gemini 📅 This Friday, June 12 at 11:30 AM PT 📅 本周五,6月12日,太平洋时间上午11:30
Google产品更新
05:29
Rohan Paul@rohanpaul_ai
62
SIA: Self Improving AI 框架

该论文提出SIA框架,让AI自动循环改进:一个观察者AI监控任务代理的表现,然后修改其外部设置(提示词、工具、重试规则、输出解析)或通过LoRA权重更新训练模型本身,模型主体不变,仅适配器从任务反馈中学习。在三个任务上测试:中文法律罪名分类(LawBench达70.1%)、GPU内核速度调优(生成代码优于此前最佳)、单细胞RNA降噪(得分0.289)。综合版本在所有任务上超越仅修改设置的方案,表明权重更新能帮助模型学到提示和工具无法发现的模式。

智能体arXiv数据/训练论文/研究
05:29
Rohan Paul@rohanpaul_ai
精选83
Jeff Bezos 在 CNBC 披露 Prometheus 愿景:构建人工通用工程师,融资 120 亿美元估值 410 亿美元

Jeff Bezos 在 CNBC 披露其新公司 Prometheus 的愿景:构建人工通用工程师,设计制造喷气发动机、芯片、医疗设备等硬物理产品,将传统数年设计周期缩短 10 倍以上。公司宣布完成 120 亿美元融资,估值 410 亿美元。初始启动资金 62 亿美元,新一轮融资表明公司需要更多算力、人才和工业数据才能验证产品。410 亿美元估值表明,前沿 AI 已从软件竞赛变为计算采购竞赛——投资者实质在为可能实现模型所需的机器预付费。

智能体具身智能行业动态
关联讨论 3 条X:Kim (@kimmonismus)Bloomberg:Technology(RSS)TechCrunch:AI(RSS)
推荐理由:这不是又一家AI初创,而是直接宣告算力即护城河的开端。Bezos的12B融资对创业者和投资人都是一本摊开的说明书,得读。
05:28
Bloomberg:Technology(RSS)
57
PIMCO的Richard Clarida:AI现已成为主要经济驱动力

Richard Clarida(PIMCO董事总经理兼全球经济顾问,前美联储副主席)指出,人工智能将在未来五年对经济和市场产生重大影响。他认为AI可能通过提高生产率和工资压缩成为通缩力量,同时AI投资也伴随融资风险。

大佬观点现象/趋势
05:25
Epoch AI@EpochAIResearch
55
Mythos 在网络能力方面有多大的飞跃? @timotheechauvin、@AlexBarry4、@js_denain 和 @ansonwhho 整理了公开证据,发现虽然尚不清楚 Mythos 在发现漏洞方面是否领先于趋势,但它在利用漏洞方面代表了一次巨大飞跃。🧵
安全/对齐现象/趋势
05:22
swyx@swyx
61
swyx 祝贺 ONA 团队加入 OpenAI,并引用其演讲透露 Codex 的下一步方向。同时引述 @aiDotEngineer 观点:运行 Agent 集群需要三层--Runtime 与编排触发器已解决,但协调层(Agent 间任务交接、验证阶段、继续执行)仍未解决。Stripe 和 RAMP 各自自建了内部方案 Minions 和 Inspect。@loujaybee 指出 GitHub 作为协调层很差--噪音大、仅为人类设计,不适合数百个并行 PR。他提出的修复方案是构建一个 CLI 网关,供本地编码 Agent 调用以检查当前 SDLC 阶段是否已通过、能否继续。

AI Engineer: Three layers you need to run agent swarms at scale: - Runtime: solved. - Orchestration and triggers: solved. - Coordinat...

智能体OpenAI行业动态
05:17
Hacker News 热门(buzzing.cc 中文翻译)
53
Claude Fable 5 在编码任务中表现中等

Claude Fable 5 在编码任务中取得中等水平结果,Hacker News 上获 109 个点赞。

Anthropic编码评测/基准
05:05
Peter Steinberger 🦞@steipete
17
让 Chris 用 Codex 做 PR!

Chris Williamson: Cooking. @steipete 🦞

OpenAI其他编码
05:05
OpenRouter:Announcements(RSS)
精选69
Advisor:让任何模型在生成过程中求助更强的模型

OpenRouter 推出 advisor 服务器工具,允许快速、便宜的模型在生成过程中向更强模型咨询。用户可用 GPT-4o Mini 处理常规任务,在关键环节调用 Claude Fable 进行更高质量的推理。

智能体产品更新部署/工程
关联讨论 2 条X:OpenRouter (@OpenRouter)OpenRouter:Announcements(RSS)
推荐理由:给便宜模型配了个聪明后台,做agent时小模型应付日常,遇到难题自动呼叫大模型兜底,成本和智商两头顾,捣鼓推理架构的可以试试。
05:05
OpenRouter:Announcements(RSS)
精选60
什么是 LLM 网关?应用与 AI 模型之间缺失的一层

缺少 LLM 网关时,供应商中断会直接变成用户可见的错误,AI 支出也难以追踪。文章从路由、合规性和设置时间三个维度比较了最佳方案。

教程/实践部署/工程

推荐理由:LLM 网关正在成为 AI 栈的必备层,这篇把路由、合规、部署时间这些选型维度拆得明白,正在做生产级集成的团队值得点开对照自己的架构。
05:02
elvis@omarsar0
59
threepointone 使用 Fable 处理一个约 10k 行代码的大 PR,花费 $250,认为不值,更倾向小步骤。Elvis Saravia 认同,表示自己用 Opus 4.8 做规划、GPT-5.5 做执行,并将任务拆解成更小步骤能显著提升质量。他认为动态工作流(dynamic workflows)的重要性被大多数人低估了。其日常仍使用 Cursor AI。

sunil pai: spent all day on fable for a giant PR. ~10kloc, lots of testing and intervention. 250$. I... don't think it's worth it? ...

AnthropicOpenAI大佬观点编码
04:59
HuggingFace Daily Papers(社区热门论文)
66
基于大语言模型构建社会世界模型

提出社会世界模型(SWM)框架,利用大语言模型的常识与社会智能模拟社会信念随重大事件的演变。SWM通过挖掘社会数据中的时间模式并优化证据下界学习状态转移函数,无需人工标注事件与信念的关联或普查数据。引入SWM-bench基准,包含Kalshi和Polymarket预测市场超12k数据点,覆盖政治、金融、加密货币等领域。实验表明SWM显著优于时序基线,在Kalshi上达最优,在Polymarket上表现有竞争力,并提供可解释的社会信念动态洞察。

推理论文/研究
04:59
Rohan Paul@rohanpaul_ai
67
OpenAI 收购 Ona,为 Codex 智能体提供持久云端工作空间

OpenAI 宣布收购 Ona,其安全云端执行技术可为 Codex 智能体创建持久云端工作空间——用户离开后,智能体仍可持续运行命令、检查系统、保留上下文并跨设备恢复任务。目前 Codex 周活用户达 500 万(增长 400%)。收购旨在强化企业级部署:智能体可在企业云边界内运行,具备作用域凭证、审核追踪、访问限制和可审计活动,适用于测试、漏洞修复、重构、迁移等多步骤任务。收购完成后,Ona 团队将加入 OpenAI Codex 团队。

OpenAI Newsroom: We've reached an agreement to acquire @ona_hq. Its secure cloud execution technology will help Codex take on longer-runn...

智能体MCP/工具OpenAI编码
04:59
Rohan Paul@rohanpaul_ai
71
贝佐斯:AI 不会导致失业,反而会带来劳动力短缺

杰夫·贝佐斯在 CNBC 反驳“AI 取代人类工作”的观点。他认为,许多人担心 AI 会消灭放射科医生、软件工程师等岗位,但这种看法是错的。AI 实际上会提升这些人的能力,就像挖地下室从铁锹换成推土机一样。他预测结果反而是劳动力短缺,经济生产力将大幅提升。

大佬观点现象/趋势行业动态
04:54
宝玉@dotey
73
宝玉表示使用 /goal 指令后,长任务运行稳定,不再需要像许多用户那样在AI意外停止时输入"继续"。引用推文指出,不少AI新手不知道AI意外停止时只要发一句"继续"即可恢复任务。宝玉的实践表明,/goal 指令能有效减少此类中断需求。

Jim Liu: 一个非常个人视野的观察:很多用AI时间不怎么久的人,似乎并不知道: > 当AI预期之外地停止工作的时候,通常只要给它再发一句"继续"就好了。

智能体教程/实践
04:54
宝玉@dotey
62
AI 没有重新定义软件工程,AI 放大了软件工程的重要性 【引用 @arkuy99】:AI 重新定义了软件工程。

Go学长: AI 重新定义了软件工程。

大佬观点编码
04:52
xAI@xai
73
Grok Build 插件市场现已进入公测阶段。你可以在终端中使用 MongoDB、Vercel、Sentry、Cloudflare 和 Chrome DevTools 等插件进行开发。详情:https://x.ai/news/grok-plugin-marketplace

xAI: The Grok Build Plugin Marketplace is now in beta. Build with MongoDB, Vercel, Sentry, Cloudflare, and Chrome DevTools pl...

智能体MCP/工具xAI产品更新
关联讨论 2 条X:xAI (@xai)xAI:News(网页)
04:47
Hacker News 热门(buzzing.cc 中文翻译)
53
Waymo Premier 在 Hacker News 上获得 102 个 HN 点数

Waymo 发布了一篇标题为 "Waymo Premier" 的博客文章(链接:https://waymo.com/blog/2026/06/waymo-premier/),介绍了名为 Waymo Premier 的产品或服务。该文章于 2026 年 6 月 11 日 16:10 UTC 在 Hacker News 上被分享,截至统计时获得了 102 个 HN 点数。

产品更新具身智能
04:38
AI Notkilleveryoneism Memes ⏸️@AISafetyMemes
51
AI 发明自己的语言--已在野外发生

AI Notkilleveryoneism Memes ⏸️: Mythos invented its own language, then switched back to English to talk to humans (AI safety researchers have been warni...

安全/对齐现象/趋势
04:33
IT之家(RSS)
59
Adobe 2026财年第二财季营收66.18亿美元,超预期

Adobe 2026财年第二财季营收66.18亿美元,同比增长12.69%,超市场预期64.6亿美元。订阅业务营收63.90亿美元,同比增14%。GAAP归母净利润17.12亿美元,同比增1.24%;非GAAP净利润24亿美元,同比增10.66%。AI-first ARR突破5亿美元,同比增三倍。期末ARR达271.0亿美元。上调全年营收指引至265-266亿美元,第三财季营收指引66.7-67.2亿美元。现任CFO将于6月15日离职,Steve Day任临时CFO。

行业动态
04:29
Rohan Paul@rohanpaul_ai
29
中国广州车展 一个超逼真的机器人服装,许多人最初误以为是小鹏的IRON人形机器人。🙂
具身智能行业动态
04:28
Bloomberg:Technology(RSS)
58
推动建立公共财富基金以分配AI收益

据Bloomberg报道,立法者与科技公司正推动设立公共财富基金等新机制,旨在使公众从AI技术推动的经济增长中获得收益。

政策/监管行业动态
04:24
Cursor Blog
74
Cursor 推出 Auto-review 实现智能体自治管控

Cursor 本周推出 Auto-review,旨在让代码智能体在保持自主性同时降低安全风险。该功能引入分类器代理,在每次工具调用前根据上下文判断风险:低风险时允许自由操作,越界时阻止并返回解释,使父智能体自主调整路径。分类器为轻量模型,与父代理同 RPC 流运行避免延迟,并可读取工作区文件辅助决策。团队基于约 12 小时内部开发者会话整理 6,122 条标注数据,补充合成异常用例评测,以平衡安全与开发效率。

智能体产品更新安全/对齐
关联讨论 1 条Cursor Blog
04:21
Sam Altman@sama
41
非常期待合作!

Johannes Landgraf: http://x.com/i/article/2064952499363000320

OpenAI行业动态
04:09
MiniMax (official)@MiniMax_AI
61
MiniMax 联合 Cysic 推出 CyOps Arena 开发者挑战赛,提供 $5,000 美元奖金池,并给予 MiniMax M3 模型 token 价格 80% 折扣。活动鼓励开发者利用 M3 和 CyOps 平台构建项目,快速上手。

Cysic: ICYMI: CyOps Arena is now live, co-hosted with @MiniMax_AI. With a $5,000 prize pool and 80% off MiniMax M3 model token ...

产品更新教程/实践
03:58
向阳乔木@vista8
70
想到一个特别有雄心的Claude Fable 5 任务! 做一个在线版Photoshop。 需求文档 AI 写好了,感兴趣的可以发过去试试。 PRD见评论
Anthropic图像生成教程/实践
03:55
DogeDesigner@cb_doge
18
只管 GROK 它
其他
03:47
Hacker News 热门(buzzing.cc 中文翻译)
精选88
全自主无人机首次击毙了人类士兵

据《新科学家》6月10日报道,全自主无人机首次击毙了人类士兵。这是有记录以来第一次由完全自主运行的无人机执行致命攻击,标志着自主武器系统在实战中的新进展。该报道来自《新科学家》网站,目前尚无更多细节公布。

具身智能安全/对齐政策/监管

推荐理由:全自主无人机首次实战杀人,这不再是实验室里的讨论,而是战场上的人命。自主武器的伦理和法律真空被推到台前,各国政策制定者该连夜开会了。
03:39
Greg Brockman@gdb
69
欢迎 @ona_hq 加入团队,帮助组织在生产环境中安全部署智能体!

OpenAI Newsroom: We've reached an agreement to acquire @ona_hq. Its secure cloud execution technology will help Codex take on longer-runn...

智能体OpenAI行业动态部署/工程
03:35
OpenRouter:Announcements(RSS)
43
什么是 LLM Gateway?你的应用与 AI 模型之间的缺失层

LLM Gateway 能防止 API 提供商故障变成用户端可见错误,并让 AI 费用变得透明。通过路由、合规性和设置时间等维度,可以对比市面上最佳的网关方案。

教程/实践部署/工程
03:29
Rohan Paul@rohanpaul_ai
精选82
WSJ:OpenAI 考虑大幅降价,同准备 ChatGPT 史上最大改版备战 IPO

WSJ 报道,OpenAI 正考虑大幅降价以应对与 Anthropic 的竞争。Anthropic 增长主要来自开发者和编码工作流,Claude Code 消耗大量 token,已让企业团队将其融入日常工作。OpenAI 虽在消费品牌上更大,但企业市场才是关键——企业为编码智能体、自动化等工具付费。同时,OpenAI 在 IPO 前准备对 ChatGPT 进行史上最大改版,将其打造成涵盖编码、AI 智能体、图像生成和商业软件的超级应用,改版将在未来几周陆续推出。OpenAI 将更多资源投入编码工具 Codex,目标实现 Codex 工程负责人所说的“个人智能体”。

Rohan Paul: OpenAI is preparing its biggest ChatGPT redesign yet, before its IPO. To make it into a superapp for coding, AI agents, ...

AnthropicOpenAI编码行业动态
关联讨论 2 条Gary Marcus:The Road to AI We Can Trust(RSS)Bloomberg:Technology(RSS)
推荐理由:WSJ这篇把OpenAI的窘境说清了,C端用户再多也不如开发者每天烧token来钱,所以降价是必然,但ChatGPT变超级应用是在抄Anthropic的作业。
03:20
Logan Kilpatrick@OfficialLoganK
65
我与 @ymatias(Google Research 负责人)关于 AI 如何加速科学进步的魔力循环、改善全球真实人们的生活,以及我们正进入研究黄金时代的对话。 这次交谈让我真切地感到振奋 : )
Google大佬观点现象/趋势
03:17
Hacker News 热门(buzzing.cc 中文翻译)
60
Zed:软件是在每次提交之间完成的

Zed 开发者在其官方博客中提出,软件真正的创造过程并不在代码提交本身,而是发生在两次提交之间的思考、调试与重构中。这一观点强调提交记录之外的隐式工作对软件质量的决定性作用。

开源/仓库部署/工程
03:12
Replit ⠕@Replit
精选65
AI 智能体很强大,但它们不记得你的偏好。 所以你总是重复指令--如何组织项目、你的品牌指南。 现在你可以通过自定义指令和技能让 Replit Agent 学会你的惯例。 它会在每个项目中自动将这些考虑进去。
智能体产品更新编码

推荐理由:Replit Agent 终于学会记住你的偏好了,自定义指令能让它更像一个了解你工作习惯的同事,不用每次重复项目结构、品牌规范,做 side project 的效率会明显提升。
‹ 上一页
1…1011121314…50
下一页 ›