AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
精选全部日报更多
全部动态
全部一手资讯X论文
5月28日周四
5月27日周三
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月28日
06:07
Chubby♨️@kimmonismus
35
我刚看了@arrakis_ai制作的片段,对Google的Omni印象深刻。 你可以在任意帧暂停,宝可梦卡牌上的文字都保持完美清晰且未改变。这种一致性和连续性是顶级水平。
Google大佬观点视频
06:02
elvis@omarsar0
61
真不敢相信这在今天竟然成为可能。 这激发了我构建自己的自改进编程智能体,使用简单的读、写、bash等工具。 我已经用这个编程智能体在24小时内构建了一个完整的生产级应用。 我不知道,伙计。这感觉太奇怪了。
智能体大佬观点编码
05:27
Emad@EMostaque
59
训练时使用自回归,推理时将权重转换为扩散模型。

David: Most researchers agree that autoregression is best when memory bandwidth is cheap and diffusion is best when FLOPS are c...

大佬观点开源生态数据/训练
04:59
Google AI@GoogleAI
45
与 @NotebookLM 一起回顾上周的 I/O 发布内容。 你可以收听音频概览、观看视频回顾,甚至查看我们详细的幻灯片,总结所有重大新闻和发布。 在此查看:http://goo.gle/4xcgBoj
Google多模态教程/实践
04:13
DogeDesigner@cb_doge
38
谷歌里有几个L? ChatGPT:2个 Grok:1个 ChatGPT真笨。
OpenAIxAI其他
04:05
Google AI Developers@googleaidevs
49
智能体需要在复杂任务中兼顾速度与性能。 观看 Gemini 3.5 Flash 的智能如何大规模处理这些任务,同时您进行构建 ↓
智能体Google教程/实践
03:33
Tomer Tunguz 博客(VC 分析)
精选61
软件之后是AI时代

软件时代正过渡至“智能体框架”时代。AI作为强大但需驯化的“野马”,其智能驯化包含七个核心组成部分:上下文与记忆、工具与行动、编排与循环、状态与持久性、沙箱与计算、可观测性与治理、成本与工作流优化。这些组件共同构成了一个生产级的智能体系统。这一转变将重塑软件竞争格局,模型通用化的未来中,最佳的智能体驾驭者将获胜。

智能体MCP/工具现象/趋势

推荐理由:Tomer 把 agent 时代的竞争拆成七个组件,不是空谈,而是给了创业公司一个具体的 check-list,做 agent 产品的值得对照一下。
03:08
SemiAnalysis@SemiAnalysis_
36
这里有一个非常重要的教训,但你们中的一些人还没准备好进行这场对话。

Serena Ge (Datacurve): Today we're releasing DeepSWE, a new standard for agentic coding benchmarks. On public leaderboards, top models often lo...

大佬观点编码评测/基准
03:08
TechCrunch:AI(RSS)
55
你的SEO策略已为不复存在的搜索引擎而优化

Google I/O宣布AI生成答案现已成为搜索的核心内容,但大多数品牌几乎无法了解AI如何向客户描述他们。这改变了以往依赖10个蓝色链接的SEO策略规则。

Google搜索现象/趋势
03:07
Rohan Paul@rohanpaul_ai
57
利用OpenAI Codex解决硬件问题实例

一位用户展示了一款从AliExpress购买的廉价MP3播放器,它存在蓝牙音频卡顿和菜单操作不便的问题。用户将设备芯片的照片提供给OpenAI的Codex进行分析。Codex随后引导用户通过Mac设备提取了播放器的完整固件文件。Codex分析了该固件的机器代码,定位到导致问题的具体代码段,并生成了一个修复了蓝牙问题并优化了菜单导航的定制固件。用户将此固件刷写回设备后,问题得到解决。此案例具体体现了AI工具在处理底层硬件调试与定制化开发任务中的潜力。

ぶんかい@AIで遊ぶ人: ぼくの着想の限界=Codexの限界。 それくらいまーじでCodexでなんでもできる。 これアリエクで買ったやっすいMP3プレイヤー。 でもBluetoothの音飛びと操作性が悪くて放置してたんですよ。 だけど昨日急にシャワーしている時にエウ...

OpenAI多模态教程/实践
03:05
Ethan Mollick@emollick
46
推文认为,未来十年将是人类历史上最伟大的十年之一,即使不考虑生成式AI,也将在解决由现代性引发的问题上取得巨大突破,包括代谢综合症、汽车相关死亡、碳排放、绿色能源和癌症治疗等领域。这些进展将与重返月球和AI发展共同构成一个进步的时代。

Kevin A. Bryan: One reason I started teaching my "progress" class is the vibes vs reality gap. Coming into the greatest decade in human ...

大佬观点现象/趋势
03:00
宝玉@dotey
62
批"AI模仿人类角色分工":纯浪费Token

推文强烈批评在AI智能体设计中,模仿人类组织架构、设定不同角色并通过聊天传递上下文的做法,认为这纯属浪费Token。其观点认为,人类分工是因能力有限,但AI不应受此限制。尽管承认此方式或能提供情绪价值,但用“三省六部”的比喻将其归结为满足用户幻想。

大罗SEO: 不要用传统的人员组织框架来限制AI组织,设计什么不同的agent角色互相通过聊天来传递上下文,这都是愚蠢的做法

智能体大佬观点
03:00
宝玉@dotey
63
fast 模式性价比太低,没必要开,我几乎不用。 【引用 @akazwz_】:我已经把 codex 的 fast 关掉了,没感觉到速度快,只感觉到了消耗快

akazwz: 我已经把 codex 的 fast 关掉了,没感觉到速度快,只感觉到了消耗快

教程/实践编码
02:37
Rohan Paul@rohanpaul_ai
35
在大学毕业典礼演讲中,如果提到AI,大家都会喝倒彩。我们无法阻止它,所以让我们诚实面对。 我们将在不到3年内实现AGI。我们将在5或6年内实现超级智能。
大佬观点现象/趋势
02:33
Hacker News 热门(buzzing.cc 中文翻译)
75
我认为Anthropic和OpenAI已经实现了产品与市场的契合

Simon Willison 在一篇简短的博文中表示,他认为 Anthropic 和 OpenAI 已经找到了产品与市场契合。文章本身仅提供了此核心观点,并未展开具体论据或技术细节。

AnthropicOpenAI大佬观点现象/趋势
02:06
Claude:Blog(网页)
精选67
AI智能体的零信任安全框架

Anthropic 发布了针对企业部署自主 AI 智能体的安全框架,指出前沿大语言模型正将漏洞利用周期从数月压缩至数小时。部署智能体面临双重风险:基础设施易受 AI 加速攻击,且智能体自身具备自主决策与执行能力。文章提出一个三层零信任架构(基础、高级、优化级)及八阶段实施流程,并概述了提示注入、工具投毒、记忆投毒等特有威胁。

智能体Anthropic安全/对齐教程/实践

推荐理由:当漏洞利用从数月压缩到数小时,安全架构必须同步进化。这篇框架把零信任落地到Agent场景,八阶段路线图和三级成熟度模型比泛泛的安全声明具体得多,企业安全团队值得细读。
02:02
elvis@omarsar0
57
AI智能体老化基准AgingBench发布

这项研究提出了AgingBench,一个用于纵向评估AI智能体可靠性的基准。它将智能体老化归纳为四种机制,包括压缩老化和干扰老化,旨在衡量部署后的智能体是退化以及退化形式。研究指出,即使冻结模型权重,智能体的有效状态也会因压缩交互历史、检索记忆库、事实更新等操作而不断变化,其可靠性是整个运行系统的寿命属性,而非基础模型的快照。基准测试在智能体部署第一天进行,然后持续数月。

智能体arXiv论文/研究
01:53
swyx@swyx
42
Railway推出"代理原生云",宣称拥有3M用户、每周10万注册量,其编码智能体上的支出超20万美元。创始人阐述了AI智能体为何需要新型云环境:Railway已将大部分工作负载迁移至自有的裸机数据中心,智能体使得CLI(命令行界面)比仪表盘更重要,而传统的Git/PR/CI/CD循环开始失效。文章还介绍了如何通过生产分支和功能开关使AI SRE更安全,并引用其观点:"如果你还在手动写代码,那你就是做错了。"

Latent.Space: 🆕Railway's Agent-Native Cloud: 3M users, 100K signups/week, $200K+ coding agent spend, production forks, & the death of...

智能体大佬观点部署/工程
01:37
SemiAnalysis@SemiAnalysis_
63
Anthropic的增长与Bedrock混合度提升AWS利润率,而同行落后。亚马逊的Bedrock混合度与Anthropic的交易条款相结合,显示出更强的经营杠杆。
Anthropic行业动态
01:35
Simon Willison 博客
精选72
我认为 Anthropic 和 OpenAI 找到了产品市场契合点

Anthropic 与 OpenAI 通过编程智能体找到了产品市场契合点,这导致企业客户成本显著上升。两家公司已于 2026 年 4 月前后调整了企业套餐定价,从原先的高额折扣改为与 API 用量挂钩。Anthropic Enterprise 套餐变为每席位 20 美元/月外加 API 费用,OpenAI Codex 则按 API token 用量计费。同期发布的新模型 GPT-5.5(4月23日)和 Opus 4.7(4月16日)的 API 定价也显著高于前代版本。

AnthropicOpenAI现象/趋势编码

推荐理由:Simon 这篇把近期碎片线索串起来了,企业级定价变化加上代码代理消耗剧增,说明 Anthropic 和 OpenAI 可能真开始赚钱了,四月是个新拐点。
01:33
Hacker News 热门(buzzing.cc 中文翻译)
48
科技公司CEO们显然正饱受人工智能妄想症的困扰
现象/趋势行业动态
01:32
向阳乔木@vista8
46
在AI领导力课程中,一位行业专家分享了一位年近70岁眼科专家的故事。这位专家拥有40多年中医眼科临床、教学与研究经验,是中国中医眼科学专业第一位博士。她通过Vibe Coding创建了公益网站EyeRestDaily.com,该网站免费、无需登录,提供眼肌放松练习和日常护眼知识,旨在帮助人们看屏幕后短暂放松。故事体现了终身学习的典范。

姚金刚: 年近70岁的一位阿姨,做眼科教学和临床四十多年 微信对我留言:Vibe Coding出了自己的一个公益小网站 我看了下,这个网站,非常精致,也很有特点: 1、不用登录,打开就能做眼肌放松练习,也可以顺便了解一些科学用眼、日常护眼的小知识 2...

现象/趋势编码
01:12
OpenAI Developers@OpenAIDevs
28
"我们为之构建的开发者已经进化了。" @0xmts 与 @romainhuet 探讨新的构建者思维,想法转化为可用软件的速度比以往更快。 完整节目将于5月29日上线。
OpenAI现象/趋势
01:05
Claude:Blog(网页)
54
CodeRabbit如何用Claude构建智能体编排系统

AI代码审查平台CodeRabbit发现,AI生成的代码常能通过编译与测试,却不符合开发者真实意图,根源在于开发者隐含假设AI理解上下文。为此,团队基于Claude构建了一个智能体编排系统,置于编码请求与智能体之间。该系统在代码生成前协调多个Claude模型进行结构化规划,输出可审查的产品需求文档,使需求显式化。系统每周助力审查超过200万个PR。

智能体Anthropic教程/实践编码
00:35
Chubby♨️@kimmonismus
精选80
与Google搜索产品副总裁Robby Stein的访谈:AI原生搜索时代

本文记录了与Google搜索产品副总裁Robby Stein在Google I/O的访谈,核心探讨Google Search向“AI原生”模式的重大转变。讨论话题包括AI Mode是进化还是重塑、如何将复杂问题拆解为多轮搜索、AI搜索的高运行成本、Google TPU及基础设施的优势、AI时代搜索量不减反增的原因,以及优质AI回答与出版商流量之间的张力。访谈还涉及Google决定展示哪些信息源与链接的逻辑,并围绕一个核心问题展开:如果Google直接给出答案,传统的基于链接的网页生态将走向何方?

Google大佬观点搜索

推荐理由:Google 搜索 VP 首次拆解 AI Mode 背后的成本逻辑、流量分配和 TPU 优势,比 I/O 演讲深得多,做搜索和内容生态的都值得听。
00:30
宝玉@dotey
63
Agent 产品的设计核心:定位是以 Agent 为主还是以人为主

Agent产品的设计需首先明确定位:若以人为主、Agent为辅,则人的工作区居中,AI智能体对话区在右侧辅助;若以AI智能体为主,则AI智能体对话区居中,其他界面在右侧,因为用户主要通过指令与Agent交互。Codex App、Claude Desktop、Cursor Agent等主流产品均采用了后者布局。文中以写PPT为例对比:前者是用户亲自编辑幻灯片,右侧与Agent对话辅助;后者是用户下达指令,由Agent生成并调整。这一界面设计被认为是所有ToB AI软件的最终形态,并推荐使用Mastra框架实现业务AI化。

赵纯想: 这就是所有 ToB AI 软件的最终形态,只要不是这样,就肯定设计错了。我说的。如果你会搞点儿VibeCoding,拿起我推荐的 Mastra 框架,上山下乡,走到小公司去,走到一切尚未正确拥抱AI的公司去,帮助他们把业务抽象成工具调用,让...

智能体大佬观点
00:27
Berryxia.AI@berryxia
65
这种复刻起来没有太多难度。 提示词见评论区:

@jason: Who made this?!?!

图像生成教程/实践
00:27
Berryxia.AI@berryxia
25
这个实时控制3D 打印的模型效果,真不错啊。
其他
00:27
Berryxia.AI@berryxia
69
AI智能体自主完成视频处理任务的实践

用户发布任务,要求三个AI智能体独立从链接下载视频并添加中文字幕。最终,一个AI智能体100%完成,一个只输出了部分成果,另一个则遇到API限流。整个流程虽耗时,但用户仅需“动动嘴”下达指令,全程零干预即可验收结果。评论称赞这种自主性(Agency)令人舒服,宛如“成精”。

Berryxia.AI: 麻蛋,Agent成精了。 但就是,我想要的状态。 这种Agency,真实令人舒服啊!

智能体教程/实践视频
00:27
Berryxia.AI@berryxia
51
推文复盘了一个让三个AI智能体(Berry小跟班、BuLeng、乐迪)竞赛的任务,目标是根据一个链接下载视频并添加中文字幕。最终,Berry小跟班100%完成了任务,BuLeng仅完成了部分输出,而乐迪遇到了API限流问题。整个过程展示了用户只需通过自然语言下达指令,AI智能体便能自主尝试执行并交付结果,体现了当前智能体在任务执行上的进展与实际应用中的局限。

Berryxia.AI: 另一个故事,忍不住分享! 全程人就是动动嘴,然后下载验收即可。 任务:https://x.com/cleoabram/status/2059622849266983122?s=20 下载视频 并且添加中文字幕 @Berry小跟班 @BuLe...

智能体教程/实践
00:22
AYi@AYi_AInotes
56
嘘声与AI:毕业典礼上的现实一课

推文描述了万名毕业生在毕业典礼上嘘前Google CEO埃里克·施密特的场景。作者认为,愤怒发泄于外部虽是低成本情绪出口,但真正危险的是台下那些在嘘声中学习并利用AI的同学。核心观点是:AI不会立即取代所有人,而是先放大差距,将机会赋予实践者。原文以一位22岁年轻人用AI免费完成价值1.5万美元营销策略的案例为证,并指出入门级工作的护城河已转向判断力、领域知识与执行力,AI已成为必要入场券。因此,与其抗议,不如将时间投入实践。

AYi: http://x.com/i/article/2058381329318682624

其他现象/趋势
00:20
Hugging Face:Blog(RSS)
精选72
Reachy Mini 实现完全本地化语音交互

Reachy Mini 机器人现可通过 `speech-to-speech` 库实现完全本地化的语音交互,无需依赖云端。该方案采用级联流水线架构,对外提供 Realtime API 兼容的 WebSocket 接口。默认组件包括 Silero VAD 用于语音活动检测、Parakeet-TDT 作为语音转文本模型、通义千问(Qwen3-TTS)作为文本转语音模型。大语言模型推荐使用 llama.cpp 运行 Gemma 4。所有数据均在本地处理,保障了隐私且无 API 费用。

智能体Hugging Face教程/实践语音

推荐理由:小众硬件的本地语音实战,但HF这套开源管线证明端到端对话已完全可用,所有组件都可自由替换,想做本地化语音助手的人可以照抄。
00:12
Microsoft Research@MSFTResearch
30
将AI理解为人类智能的延伸--而非其替代品--为构建可信赖的AI系统提供了一条更扎实的路径。了解更多:https://msft.it/6010vkoHk
Microsoft安全/对齐现象/趋势
00:10
Greg Brockman@gdb
66
OpenAI Codex 新增了"Meeting Recorder"技能。该技能可使用 GPT Realtime Whisper 端点实时转录会议并显示文本。用户可在转录过程中随时向 Codex 提问。会议结束后,会提供完整的转录内容及格式化版本。此功能基于实时 API,费用为 $0.017/分钟。相关代码与说明可在 GitHub 链接中查看。

Simon Smith: You can now transcribe meetings in real time using Codex and ask Codex questions about meetings as they're happening! I ...

OpenAI教程/实践语音
5月27日
23:31
elvis@omarsar0
47
为了面向未来,构建可组合的AI。 无论你使用什么,所有这些都应该是可组合、可迭代和可定制的: - LLMs - Evals - Automations - MCP/CLI tools - Skills/Memory/Context - Agent Harness (Codex, CC, Pi,…) 复利效应是惊人的。
智能体MCP/工具大佬观点
23:27
Berryxia.AI@berryxia
45
GPT Image 2 优秀排版源于预训练,非审美飞跃

用户实测发现,GPT Image 2 在仅给出简单指令的情况下,能自主生成结构清晰、可直接使用的排版图,体验震撼。有分析指出,GPT 这种出色的结构化排版能力,本质上源于其预训练过程中接触了大量此类素材,而非模型审美本身有巨大提升,但其默认效果已足够好用。

赖叔 | LaiShu.ai: 卧槽,GPT Image 2 的默认审美已经到这个程度了? 今天拍了份数学卷子,让它分析错题 分析完我随手加了一句: "将上面的孩子的最主要问题以及解决方案,平时训练建议都用一张图画出来" 没配色、没构图、没风格限定 结果它自己排版、标记 ...

OpenAI图像生成现象/趋势
23:27
Berryxia.AI@berryxia
33
这种GPT&Seedance 2.0打斗的视频一直可以火。 这恰巧是SD2.0最擅长的,视觉效果也拉满。 做游戏Demo展示太好了!
图像生成大佬观点视频
23:10
Kling AI@Kling_ai
58
Kling AI戛纳电影节探讨AI影视制作应用

快手旗下Kling AI在第79届戛纳电影节举办访谈,邀请中国、美国和韩国的创作者,共同探讨AI如何进入真实的电影制作工作流。对谈内容涵盖了从好莱坞规模的剧集制作,到全AI生成的剧情电影,以及AI动画电影等不同形式的影视创作。创作者们分享了AI在其实际叙事创作中的应用视角。

多模态现象/趋势视频
22:41
OpenAI Developers@OpenAIDevs
67
⚙️ 使用 Codex 构建自我改进税务智能体的幕后 我们与 @ThriveHoldings 共同打造了 Tax AI,围绕税务准备流程进行协作。这样当审核员修正任何错误时,Codex 可以追溯故障、改进系统,并在部署前测试更改。 https://openai.com/index/building-self-improving-tax-agents-with-codex
智能体MCP/工具OpenAI教程/实践
关联讨论 1 条OpenAI:官网动态(RSS · 排除企业/客户案例)
22:34
Ethan Mollick@emollick
63
Token 从一年前无人问津到如今成为编程的绝对必需品,这引发了焦虑,而非 AI 无用。 没人知道谁该获得 Token,该获得多少,以及如何控制。
推理现象/趋势部署/工程
‹ 上一页
1…4647484950
下一页 ›