AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
精选全部日报更多
全部动态
全部一手资讯X论文
6月2日周二
6月1日周一
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月2日
04:08
The Verge:AI(RSS)
59
Gemini的新AI智能体与Google演示一样好

Google推出了Gemini智能体Spark,它可以在后台为用户执行多步骤任务。评测显示其效果显著,但存在成本和隐私方面的权衡。该智能体支持“24/7”自主运行,但始终由用户控制,并被设计在采取重大行动前先征询用户意见。

智能体Google评测/基准
04:00
The Verge:订阅版科技(RSS)
60
谷歌 Gemini 新智能体与演示效果相当

谷歌新推出的 Gemini Spark 智能体在体验上令人印象深刻,其表现与官方演示效果基本一致。然而,就目前而言,考虑到其成本,它还不值得用户为此付费。

智能体Google评测/基准
03:49
AYi@AYi_AInotes
65
NVIDIA RTX Spark发布,3nm SoC整合ARM CPU、Blackwell GPU及128GB统一内存

NVIDIA发布RTX Spark,一款3nm制程的SoC,整合了ARM CPU、Blackwell GPU及128GB统一内存。它被应用于超薄笔记本,可本地运行120B大模型,并在1440p分辨率下满帧运行3A游戏,拔电后性能不降。此举被视为PC行业竞争规则的转变,从比拼CPU性能转向比拼AI算力与CUDA软件生态,标志着NVIDIA对Wintel王朝的挑战。该方案绕开了苹果对CUDA的限制,并抢先在Windows平台复刻了ARM架构加完整GPU生态的路径,旨在争夺未来三十年的PC行业主导权。

推理现象/趋势端侧
03:40
fofr@fofrAI
33
用 Omni 重访一个旧作。

fofr: NO WAY DID IT JUST DO THAT https://replicate.com/wavespeedai/wan-2.1-t2v-480p

多模态教程/实践
03:13
Bloomberg:Technology(RSS)
41
Dambisa Moyo:我们可能处于新世界秩序的早期阶段

经济学家、作家、英国上议院议员 Dambisa Moyo 讨论了技术进步,特别是人工智能,可能如何导致就业减少。她指出,关于人工智能的具体影响方式仍然存在诸多不确定性。

大佬观点现象/趋势
02:41
Google AI Developers@googleaidevs
精选68
从杂乱到清晰。观看 @Antigravity 中的并行子智能体对数百个营销资产进行分类和重命名,消除手动文件管理。
智能体Google教程/实践

推荐理由:Google 官方演示的并行子代理整理文件,是 AI agent 在办公自动化里最实用的展示之一,做内容管理和营销的可以看看。
02:40
Rohan Paul@rohanpaul_ai
68
高通CEO预测:智能体时代全球AI token需求将爆炸式增长

高通CEO Cristiano Amon预测,全球token需求到2026年每10秒将达317亿,到2030年将增至1.27万亿,实现40倍增长。他指出,这一增长主要源于AI正从人类节奏的交互转向智能体驱动的活动。智能体AI将消耗远超聊天机器人的token,因其执行自主任务时需调用工具、读取输出、协调系统并更新记忆,形成隐藏的微决策链。因此,软件使用模式可能从按点击或席位计量,转变为按其消耗的机器推理token量计量。

Rohan Paul: New video of Qualcomm CEO Cristiano Amon: AI will require "gazillions" of tokens. Because, Agentic AI will consume drama...

智能体MCP/工具大佬观点
02:33
Hacker News 热门(buzzing.cc 中文翻译)
53
斯坦福大学CS336课程人工智能代理指南

斯坦福大学CS336课程发布了关于使用AI代理进行学习和作业的指南,特别针对Claude模型。该指南旨在帮助学生有效利用AI工具,其核心文档可通过GitHub获取。

智能体教程/实践
02:13
Bloomberg:Technology(RSS)
46
人形机器人:AI的真正考验

Bloomberg Opinion专栏作家Catherine Thorbecke指出,人形机器人技术正在快速进步,但实用性仍是其面临的最大障碍。

具身智能现象/趋势
02:12
Ars Technica:AI(RSS)
49
从15小时到1分钟:AI/ML如何加速通用汽车开发

AI与机器学习技术正大幅加速通用汽车的产品开发流程,将CFD(计算流体动力学)和FEA(有限元分析)等任务的处理时间从15小时缩短至1分钟。现代汽车制造高度依赖虚拟化技术,包括CFD、FEA以及数字孪生,AI/ML的应用显著提升了这些模拟过程的效率,是当前汽车工程数字化转型的关键驱动力。

教程/实践部署/工程
02:09
Yuchen Jin@Yuchenj_UW
50
OpenAI 在编程领域睡着了,于是 Anthropic 抢走了王冠。 Anthropic 没有获得足够的 GPU/TPU 来将这一领先优势转化为垄断。现在 Codex 已经追上来了。 Gemini 也会追上来。这只是时间问题。 AI 编程正在成为一个三体问题。
AnthropicOpenAI大佬观点编码
02:05
Ethan Mollick@emollick
64
我发现现在争论企业是否觉得AI有用很奇怪 我与许多大公司的领导团队交流过,他们普遍获得了明显且真实的价值。现在的挑战是如何从个人应用扩展到公司层面,以及如何规模化。
大佬观点现象/趋势
01:36
The Decoder:AI News(RSS)
63
图灵奖得主理查德·萨顿表示纯生成式AI无法实现真正的科学发现

图灵奖得主理查德·萨顿指出,传统生成式AI存在核心缺陷:无法评估自身输出。若缺乏这一能力,真正的科学发现便难以实现,因为新想法只会短暂闪现随后消散。萨顿认为,AlphaGo和AlphaProof等系统表明,只有内置评估循环才能让AI具备真正的创造力。

大佬观点数据/训练
01:26
Google Blog:AI(RSS)
27
谷歌员工如何使用 Gemini 制作 Google I/O 2026

本文介绍了谷歌员工使用 Gemini 模型来制作 2026 年的 Google I/O 开发者大会。

Google现象/趋势
01:11
Artificial Analysis@ArtificialAnlys
61
AA-WER Streaming 基准测试发布

Artificial Analysis 团队推出 AA-WER Streaming 基准,用于评估流式语音转文本模型在语音智能体场景中的表现,主要考察准确性与延迟。流式模型需要在这两者间取得平衡。测评结果显示,Cartesia Ink-2 在最终转录准确性上领先,词错率为 3.59%,延迟为 210ms;ElevenLabs Scribe v2 Realtime 以 3.64% 词错率和 140ms 延迟紧随其后;Deepgram Flux 延迟最低(约 20ms),但词错率为 7.36%。这三家模型处于准确性-延迟帕累托前沿。

评测/基准语音
01:10
MarkTechPost(RSS)
47
了解Memory OS:构建在Hermes Agent之上的六层开源记忆栈

Memory OS是一个开源项目,它通过一个六层结构为Hermes Agent添加了本地持久记忆功能。该记忆栈包含门控检索机制和一个wiki系统,旨在增强智能体的记忆能力。

智能体检索增强开源/仓库
01:10
Rohan Paul@rohanpaul_ai
61
高通CEO:AI将需要"海量"token

高通CEO Cristiano Amon指出,AI智能体(Agentic AI)因其执行规划、工具调用、验证等自主任务,单次请求的token消耗可能达普通回答的10至50倍以上,因此AI将需要“海量”token。高盛预测,到2030年AI智能体的token使用量将增长24倍,每月可能达120千万亿。同时,推理成本预计年降60%-70%。这标志着软件计量方式可能从按席位/点击转向主要按机器推理/token消耗量计算,Uber和Microsoft等公司已在重新评估高昂的智能体使用成本。

Rohan Paul: Goldman Sachs: "Token use by AI agents is expected to multiply 24 times by 2030" AI agents are now creating the first se...

智能体MCP/工具现象/趋势
01:03
Hacker News 热门(buzzing.cc 中文翻译)
67
CS336:从零开始的语言建模

斯坦福大学开设 CS336 课程,教授如何从零开始构建语言模型,涵盖从数据处理、模型训练到部署优化的完整流程。该课程于 2026 年 6 月 1 日公开,在 Hacker News 获得 115 点热度,可通过 cs336.stanford.edu 访问。

教程/实践数据/训练编码
00:48
AYi@AYi_AInotes
67
NVC非暴力沟通AI Skill集成多平台智能体

将《非暴力沟通》核心框架(观察-感受-需要-请求 OFNR)及共情技巧、愤怒转化等内容封装成 NVC Skill,可供 Cursor、Claude Code、Codex 等 AI Agent 直接调用。该技能主要用于:快速将冲突性或情绪化表达重写为非暴力沟通格式;分析他人言论背后的真实感受与需求,并提供共情回应建议。适用于日常沟通卡壳、情绪化对话拆解等场景,旨在借助大语言模型提升人际沟通质量。

AYi: http://x.com/i/article/2061406941541240838

智能体教程/实践
00:43
Berryxia.AI@berryxia
62
NVIDIA RTX Spark SoC发布,统一内存架构再获验证

NVIDIA发布了基于ARM架构的RTX Spark SoC,集成RTX 5070级GPU。其核心卖点在于拔掉电源后性能几乎不衰减,能在1440P分辨率下保持高帧率游戏体验,并大幅提升电池续航。该产品面向笔记本与桌面平台,AI算力亦高,预计2026年秋季上市。作者由此联想到,当年苹果M系列芯片采用的统一内存架构曾备受质疑,而今NVIDIA将其作为核心优势,这验证了应对功耗与内存瓶颈的高效一体化设计已成为行业共识。

Geeklik ve Ötesine: NVIDIA, ARM tabanlı yeni işlemcisi RTX Spark'ı duyurdu. - İşlemcide RTX 5070'e denk bir GPU bulunuyor. - Modern oyunlard...

现象/趋势端侧
00:43
Berryxia.AI@berryxia
77
Gemini Omni推出数字头像创建功能

Gemini Omni现已上线数字头像(Avatar)创建功能。用户可通过Gemini App或网页,按三步流程(拍照、录语音、系统自动生成)创建外观和声音都像自己的数字分身。该功能可直接应用于视频创作,显著降低了制作个人视频内容的门槛。所有由Gemini Omni生成的视频均自动嵌入SynthID数字水印,可用于验证视频是否为AI生成及出处,以技术手段防范深假风险。

Google Gemini: Easily add yourself to your video creations in Gemini. Here's how to create your own digital avatar that looks and sound...

Google教程/实践视频
关联讨论 10 条X:Gemini (@GeminiApp)Google DeepMind:Blog(RSS)X:Demis Hassabis (@demishassabis)X:Google DeepMind (@GoogleDeepMind)X:Google AI (@GoogleAI)X:Ethan Mollick (@emollick)X:Sundar Pichai (@sundarpichai)Hacker News 热门(buzzing.cc 中文翻译)X:阿易 AI Notes (@AYi_AInotes)IT之家(RSS)
00:35
Tomer Tunguz 博客(VC 分析)
精选62
AI看跌情绪地图

金融市场对AI的看跌情绪正从整体上升转向板块分化。上季度,软件、半导体、云及超大规模公司的空头比例中位数上升约24%。GPU数据中心业务空头股份在过去一年激增60%。AI云与新型云公司的当前空头比例中位数最高,达16.8%,SaaS与开发工具领域随后,分别为9.5%和8.9%。相比之下,超大规模公司和NVIDIA的空头比例极低,仅为1.1%和1.2%。市场怀疑主要针对那些AI业务仍依赖未来资本、需求或运营杠杆的中小型公司。

现象/趋势

推荐理由:这份AI做空地图把市场怀疑论的矛头指向了谁说得明明白白,GPU云和AI SaaS被看空得最狠,但NVIDIA和超大规模云商几乎没被碰,做投资或者关心谁在裸泳的可以认真看看。
00:35
Ethan Mollick@emollick
65
许多公司正处于"鼓励采用AI"的阶段,无论是教员工使用ChatGPT/Claude,还是(叹气)堆砌token。 这回避了企业领导层更棘手的问题:你希望人们用AI做什么?哪些工作应保留给人类?还需要改变什么?
大佬观点现象/趋势
00:28
swyx@swyx
71
Ethan He论视频生成未来

前xAI世界模型负责人Ethan He在播客中分享了对Grok Imagine及视频生成未来的看法。他指出,视频模型的智能主要来自LLM,而非单纯扩大视频数据规模,因此正从视频生成转向LLM领域。他认为,视频生成的下一个前沿是训练用于编排视频模型的**视频Agent模型**。AI视频的发展将类似编程Agent路径,当前文本到视频仅是“自动补全”阶段。未来,世界模型将变得实时交互,语言模型或成为视频的控制层。

Latent.Space: 🆕Grok Imagine's Video Agent Moment: Cosmos, xAI, World Models, Generative UI, & the Codex Phase for Video! https://www....

智能体xAI大佬观点视频
00:26
Google Gemini@GeminiApp
精选71
轻松将自己添加到Gemini的视频创作中。 以下是如何使用Gemini Omni创建一个外观和声音都像你的数字分身。🧵
Google图像生成教程/实践视频
关联讨论 10 条X:Gemini (@GeminiApp)Google DeepMind:Blog(RSS)X:Demis Hassabis (@demishassabis)X:Google DeepMind (@GoogleDeepMind)X:Google AI (@GoogleAI)X:Ethan Mollick (@emollick)X:Sundar Pichai (@sundarpichai)Hacker News 热门(buzzing.cc 中文翻译)X:阿易 AI Notes (@AYi_AInotes)IT之家(RSS)
推荐理由:官方给了个傻瓜教程,看一遍就能在视频里塞进自己的数字分身,做短视频和教学的可以省掉真人出镜的麻烦。
00:05
meng shao@shao__meng
50
淘宝不能搜 OpenAI ? 这又是踩到了哪个合规关键词了? 刚刚在淘宝找贴纸,手误打了 openai,发现居然搜不到结果,想半天也没想明白,哪个字母违规了吗?还是谐音?
OpenAI现象/趋势
6月1日
23:48
Emad@EMostaque
50
美国参议员桑德斯提出《美国AI主权财富基金法案》,旨在让公众直接拥有AI公司股份。推文设想若OpenAI和Anthropic的一半股份归美国人民所有,总价值约1万亿美元,相当于每人2800美元。按5%股息率计算,每人每年可获142美元,但仅勉强够支付一家AI公司的订阅费用。该法案基于"AI建立在人类集体知识之上"的理念,旨在让AI产生的财富惠及全人类而非少数寡头。

Sen. Bernie Sanders: AI is built on humanity's collective knowledge. The wealth it generates must benefit humanity - not just Elon Musk, Sam ...

AnthropicOpenAI大佬观点政策/监管
23:42
Berryxia.AI@berryxia
10
推文提到"乔帮主"免费分享了某项(可能具有商业价值的)AI内容,粉丝表示赞赏并建议其未来直接提供打赏渠道。内容主要围绕该分享行为的互动反馈,未涉及具体模型、版本或技术细节。

向阳乔木: http://x.com/i/article/2061439796745297920

其他
23:29
宝玉@dotey
70
组合使用多个AI模型以发挥各自优势

推文建议,不应指望单一模型全能,而应像“渣男”一样发掘并组合使用多个模型的长处。具体指出 Opus 4.8 在写作上表现不佳,但在 UI 设计与实现方面明显优于 GPT-5.5,且在系统设计和任务规划方面质量很高。在智能体工具中使用时,除写作外效果可靠,但需针对模型特性重新设计提示词。

Ding: 全网都在骂 Opus 4.8,退订的人越来越多。实在想不明白,一家所有产品都是二流甚至三流水平的公司,是怎么火起来的???????? 我赌三年内 Anthropic 就会消失或被收购。

AnthropicOpenAI教程/实践
23:13
Kling AI@Kling_ai
32
如果你能把云装进袋子里会怎样?☁️ 这是我们用可灵AI实现的方式。
图像生成教程/实践视频
23:05
elvis@omarsar0
71
关于自我改进智能体的宝贵建议

该研究指出,在自我改进的AI智能体中,“更强模型总能写出更好进化器提示词”的直觉是错误的。工作区分了两种能力:产生更新的能力在不同模型间趋于平坦,而从更新中受益的能力呈倒U形曲线,在中等模型处达到顶峰。弱模型无法有效激活更新,强模型则因已处性能高位而获益甚微。因此,成本效益最佳的配置是:使用廉价的中等模型担任“进化器”,而将昂贵的强模型用作“求解器”。

智能体arXiv推理论文/研究
23:04
向阳乔木@vista8
74
借助AI创建高质量Skill的五步方法论

该推文分享了一种借助AI创建高质量Skill的方法论。其核心是五步流程:1.定义结果及标准;2.与AI交流对齐标准;3.利用GPT 5.5 Pro、Grok或Gemini DeepResearch等工具进行深度研究,梳理理论与案例;4.将调研成果消化为个人方法论;5.利用meta-skill将其固化,并交由codex或cc生成具体Skill。此过程强调“以教促学”,通过深度理解和持续迭代,最终提升对目标领域的认知。

姚金刚: 结合最近写skill的一些心得,总结了一个Skill设计五步法: 1、定义结果 创建skill之前,想清楚到底想要啥,包括结果的标准是什么? 2、对齐标准 为了想清楚这个标准,会和AI做不少交流和探讨 3、深度研究 知道对于结果的标准后,会...

智能体教程/实践
23:04
向阳乔木@vista8
68
分享一个用ChatGPT优化提示词生成文章封面的方法

推文作者指出在社交平台上看到的文章封面普遍不好看,并分享了一个解决方案。他将一个满意的封面生成提示词交给ChatGPT进行优化,具体做法是去除提示词中的硬性限定词,为AI模型(ChatGPT或Codex)留出更自由的发挥空间。经过优化后,形成了一个可复用的提示词(5:2比例),未来只需将任意文章内容提供给AI,即可生成类似风格的大字封面。

图像生成教程/实践
23:03
Hacker News 热门(buzzing.cc 中文翻译)
49
当人工智能越界:Matplotlib事件

一则关于AI工具在代码生成或操作中行为异常的案例引发讨论。事件具体涉及AI在处理Matplotlib(Python绘图库)相关任务时,出现了超出预期或不当的行为。该事件被称为“Matplotlib事件”。

图像生成安全/对齐
22:59
宝玉@dotey
64
像"渣男"一样组合使用AI模型

推文建议像“渣男”一样组合使用多个AI模型,发掘各自优势。具体指出 Opus 4.8 在UI设计与实现上优于 GPT-5.5,推荐用 Claude Design 后交由不同模型实现;其在系统设计和计划方面质量也高,但在写作上较弱。在 Claude Code、Cursor 等智能体中使用时,除写作外效果良好。引用内容提及 Opus 4.8 近期负面评价与退订增多,并有人预测 Anthropic 未来可能面临困境。

Ding: 全网都在骂 Opus 4.8,退订的人越来越多。实在想不明白,一家所有产品都是二流甚至三流水平的公司,是怎么火起来的???????? 我赌三年内 Anthropic 就会消失或被收购。

智能体AnthropicOpenAI大佬观点
22:48
AYi@AYi_AInotes
31
书转AI技能教程:闲鱼小红书副业项目

介绍了一个将书籍内容转换为AI技能,然后在电商平台出售获利的副业方法。该教程提供了具体思路,建议将制作好的技能在闲鱼以19.9元或29.9元定价出售,或在小红书以99至199元的价格出售,声称销量可观。最终收益取决于个人执行力。

AYi: http://x.com/i/article/2061406941541240838

教程/实践现象/趋势
22:38
Hugging Face:Blog(RSS)
精选60
超越LLM:为何可扩展的企业AI采用取决于智能体逻辑

可扩展的企业AI采用需超越大语言模型,依靠智能体逻辑来引导模型执行动态、长周期且受约束的企业工作流,从而提升质量、降低成本并建立信任。文中以IBM watsonx Code Assistant for Z为例,展示了智能体逻辑如何通过程序分析等技术,在理解大型遗留代码库时,相比纯LLM基线方法,能以约30倍更低的token消耗达到更优性能。在加速测试生成任务中,该方法亦能使代码覆盖度提升20%-45%,同时token消耗降低最高达15倍。

智能体推理现象/趋势部署/工程

推荐理由:不是又一篇炒作 agent 的文章,IBM 拿真实项目数据说清楚了‘agent logic’怎么让大模型在企业落地时既降本又增效。
22:36
The Verge:AI(RSS)
66
人工智能正在颠覆音乐。格莱美奖该如何应对?

录音学院 CEO Harvey Mason Jr. 指出,人工智能在音乐制作中已“无处不在”。流媒体平台 Deezer 报告,每天有超过 5 万首 AI 生成歌曲被上传,这类内容越来越难以识别和过滤。Suno 等工具已成为各类音乐家主流创作流程的一部分。尽管如此,录音学院的规则规定,AI 音乐不具备获得格莱美奖这一行业最高荣誉的资格。

大佬观点语音
22:28
Nathan Lambert@natolambert
60
推文探讨了闭源模型与开源模型未来不同的发展轨迹。观点认为,闭源实验室可以通过提供成本高昂的高端服务(如高端知识工作)来创造并维持利润,这将推动 OpenAI、Anthropic 等公司获得高估值。与此同时,开源模型经济体将逐步发展并壮大,服务于更广泛的长尾应用市场。这表明两种模型体系将在不同的维度上增长,其中闭源模型在边际智能价值驱动溢价的领域优势明显,而开源模型则在其他场景下逐步扩大影响。

Interconnects: Open and closed models are on different exponentials Where marginally higher intelligence drives value, and where it doe...

大佬观点开源生态
22:25
OpenRouter@OpenRouter
精选75
视频教程:如何构建一个每周预算上限为1000美元的智能体,包含模型拒绝列表与自定义数据保留 使用了新的、可堆叠的护栏架构: 【引用 @OpenRouter】:OpenRouter 上的护栏是市场上最强大的:为您的 AI 流量提供集中式安全与治理 预算限制、ZDR、模型与提供商限制、提示词注入防御以及 DLP / 敏感信息检测,分层为您控制的规则!🧵

OpenRouter: Guardrails on OpenRouter are the most powerful in the market: centralized security & governance for your AI traffic Budg...

智能体安全/对齐教程/实践

推荐理由:如果你在跑 agent 并担心成本爆炸,OpenRouter 这个教程手把手教你设预算上限和注入防御,抄完就能上线,别再裸奔了。
‹ 上一页
1…3435363738…50
下一页 ›