AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
精选全部日报更多
全部动态
全部一手资讯X论文
5月29日周五
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月29日
19:10
Hacker News 热门(buzzing.cc 中文翻译)
精选73
Claude Code--文档中未提及的所有可配置选项

该篇文章标题涉及“Claude Code”的可配置选项,但提供的正文内容仅包含一张图片和一个外部链接,未给出任何关于模型版本、参数、性能、价格或功能的具体信息。根据规则,无法在摘要中提及原文不存在的细节。

Anthropic教程/实践编码

推荐理由:如果你在用 Claude Code,这份从源码里扒出的隐藏配置清单能让你摆脱默认模式,好多选项官方文档压根没提。
18:15
Chubby♨️@kimmonismus
38
Anthropic 当前发布内容概览
Anthropic现象/趋势
18:15
Rohan Paul@rohanpaul_ai
57
本文展示了大语言模型如何在保持答案质量的同时,通过使用更短的上下文来降低成本。

论文提出了“效率前沿”框架,用于统一评估LLM上下文管理策略的成本与性能权衡。核心发现是,在部署时选择合适的上下文方法可使token使用量减少约25%,在部分记忆复用场景下可降低超50%成本,且答案质量损失较小。研究指出,上下文长度存在收益递减,后增加的token成本高但收益小。在5000个HotpotQA问题的测试中,轻量检索适合低复用率,记忆压缩在高复用率下更优,而全上下文提示仍是获取最高性能所需。

arXiv推理论文/研究部署/工程
18:15
The Verge:AI(RSS)
52
Adobe的对话式AI智能体是一个平庸的设计实习生

Adobe正在beta测试的Firefly AI Assistant是一个对话式AI智能体,定位为设计工作流的中间人,旨在帮助用户处理繁琐任务同时保留创作控制权。然而,初步体验表明其功能表现平庸,未能令人印象深刻。

智能体图像生成评测/基准
18:10
向阳乔木@vista8
65
建议备份X帖子并借助AI总结经验

推文强烈建议用户下载X平台的所有帖子进行备份,以防被算法误封后丢失历史数据。同时,可利用Codex或CC(可能指Claude)等工具分析这些内容,帮助自己总结出未曾意识到的个人方法论。推文指明了操作路径:需在X网页端通过“更多->设置和隐私->你的账号->下载你的数据的存档”提交申请,通常次日可下载,且过期需重新申请。

教程/实践数据/训练
17:44
公众号:通义实验室(千问)
精选64
通义实验室发布教程:在 Android 手机部署 MCP 感知服务器

通义实验室发布教程,演示如何在 Android 手机上部署 MCP 感知服务器,使手机具备本地视觉与听觉分析能力。核心基于端侧 MNN 推理引擎和 Qwen3-VL 2B 模型(约 1.3GB),摄像头与麦克风采集的音视频在本地实时转化为结构化 JSON,再通过 MCP Tool 供 Claude Code 等云端 Agent 远程调用。整个过程不上传原始数据,仅传输语义提取结果。项目已开源,实测可识别红绿灯状态等场景。

MCP/工具多模态教程/实践端侧

推荐理由:如果你做Agent总觉得AI对物理世界是瞎子,这篇教程就是解药。把Qwen3-VL塞进手机当本地眼睛,不传原始视频只给结构化文字,隐私友好又能被Claude直接调用。
17:40
向阳乔木@vista8
49
X Premium+用户现可安装Grok Build CLI

X Premium+订阅用户现已可以安装Grok Build CLI。实际测试显示,该工具能成功生成图片,但调用 `video_gen` 接口生成视频的功能目前不可用,尽管官方有相关表述。此外,直接读取X平台帖子的功能也尚未实现。在编程能力上,该工具被认为不及Codex与Claude Code。

xAI教程/实践部署/工程
16:48
MarkTechPost(RSS)
65
介绍 mKernel:一个用于 GPU 驱动通信的多 GPU、多节点融合内核库

加州大学伯克利分校的 UCCL 团队发布了 mKernel,该工具将节点内 NVLink 通信、节点间 RDMA 通信以及密集计算融合成一个持久化 CUDA 内核。

开源/仓库数据/训练部署/工程
16:42
歸藏(guizang.ai)@op7418
23
笑死,这都行

Kenton Varda: Chinese AI Twitter is obsessing over my wife. How was your day?

其他
16:42
歸藏(guizang.ai)@op7418
63
此推文用3D打印机比喻AI智能体(Agent),Token是其"打印材料"。这一比喻旨在说明软件正从功能固定、彼此隔绝的"应用房间",转变为用户可塑造、组合的"可编程材料"。旧模式是选择工具,新模式是表达意图并与系统协作。界面(UI)也随之变化,从固定菜单变为响应意图的"黏土"。最终,软件不再仅由程序员创造,而成为人人可塑造的媒介,如同"可执行的纸张"。

Ryo Lu: from apps to material software used to be something you opened an app was a room with walls: calendar here, notes there,...

智能体大佬观点现象/趋势
16:40
向阳乔木@vista8
2
个人周末生活记录分享

作者分享个人周末活动。上午在温榆河钓鱼,晒黑;下周计划去上海与朋友钓大海鲈。午间独自观看了电影《给阿嬷的情书》。回家后计划制作一份PPT、使用Suno生成一首音乐,并阅读施展的《河山》。最后预祝周末愉快。

其他
16:34
Berryxia.AI@berryxia
57
Opus 4.8 实现两轮对话生成基础 CAD 模型

用户展示使用 Opus 4.8 模型,仅通过约两轮自然语言对话即可生成基础 3D CAD 模型(如球体、圆圈等),初步演示效果良好,但离工业级应用尚有距离。该成果呼应了 AI 辅助设计从代码生成向自然语言直接驱动三维建模的演进趋势。

Berryxia.AI: 大家越来越叼了! 从原来的Coding软件已经无法满足大家的胃口了,现在都是开始自然文本-3D CAD 来Coding了。

Anthropic多模态教程/实践
16:34
Berryxia.AI@berryxia
42
Opus 4.7 VS Opus 4.8 直观感受没有很强烈的对比~
Anthropic评测/基准
16:15
Rohan Paul@rohanpaul_ai
64
更强的智能体将不仅来自更大的模型,而是来自其周围更好的系统

推文指出,AI智能体的强弱不只取决于模型,更依赖于模型周围的系统约束(harness)。该系统决定了模型的输入、可用工具、记忆及操作验证。核心进步应来自扩展此系统,尤其要提升上下文控制、记忆可信度以及工具或子智能体的路由能力。文中强调,长上下文不等于可用上下文,记忆多不等于可信,工具多不等于会用。这使得当前仅凭单次benchmark分数的评估方式显得薄弱。未来前沿在于扩展围绕智能体的系统约束,而不仅仅是扩展模型本身。相关论文标题为《From Model Scaling to System Scaling: Scaling the Harness in Agentic AI》。

智能体大佬观点部署/工程
16:10
小互@xiaohu
17
中国被比作"风险投资式国家"

推文引用 Arthur Kroeber 的观点,将中国政府比作风险投资基金而非传统中央计划者。其核心逻辑是:中国政府广泛支持多个行业部门,并鼓励其中展开残酷竞争,而非只扶持少数国有企业。即便知道竞争会导致部分受支持的公司失败,也相信少数最终的赢家将足以弥补损失,这被认为是中国在工业制造领域取得巨大主导地位并规避传统计划经济模式失败的关键。

Dwarkesh Patel: The CCP is more like a VC fund than a traditional central planner. Arthur Kroeber argues this is how China has succeeded...

其他现象/趋势
15:48
MarkTechPost(RSS)
63
Hexo Labs 开源 SIA:一个自我改进的智能体,可同时更新框架与模型权重

Hexo Labs 开源了 SIA,这是一个遵循 MIT 许可证的自我改进循环。其中的反馈智能体会读取每次执行的轨迹,然后重写运行框架或触发对 gpt-oss-120b 模型的 LoRA 权重更新。结合这两种调整方式,在 LawBench、TriMul GPU 内核以及 scRNA-seq 去噪任务上,效果均优于仅迭代框架。

智能体开源/仓库数据/训练
15:21
IT之家(RSS)
精选70
谷歌 DeepMind CEO 哈萨比斯:AGI 最快三年内到来,研发速度远超预期

谷歌 DeepMind 首席执行官德米斯·哈萨比斯预测,AGI 研发速度远超预期,最快可能在 2029 年至 2030 年前后出现。作为 AlphaGo、AlphaFold 的主导者,他认为当前 AI 智能体是未来更强智能的预演,随着多模态和自主决策能力成熟,三年内迎来 AGI 关键突破已非科幻。但他同时警示,全球社会对 AGI 到来的准备严重不足,必须提前建立规则与防护机制。

DeepMindGoogle大佬观点

推荐理由:哈萨比斯作为造出 AlphaFold 的诺贝尔奖得主,三年内 AGI 的判断不是空话,他同时强调社会完全没准备好,这种紧迫感比单纯的时间表更值得看。
15:15
Rohan Paul@rohanpaul_ai
23
Google omni确实被低估了。
Google多模态大佬观点
15:10
meng shao@shao__meng
48
Cursor不只是编程助手:它解决了我的网络问题

推文作者全天遭遇网络代理(🪜)问题,导致Codex连接失败。他使用Cursor分析代理设置,Cursor在几分钟内分析了代理实现、执行测试并修复了代理方式,随后亲自调用CLI测试Codex以确认修复。为预防未来问题,Cursor还集成了用户此前提供的DeepSeek API密钥,创建了一键切换至DeepSeek的选项,确保了服务可用性。

智能体MCP/工具教程/实践编码
15:10
小互@xiaohu
22
这个推文自动翻译功能,我一时半会还没适应 感觉所有人都变成了中文博主 原则上以前我会跳过一些中文内容重点关注英文内容 现在全是中文了😂 我还在适应中…
其他
12:55
DogeDesigner@cb_doge
16
"失败是一种选择。如果事情没有失败,说明你的创新还不够。" - Elon Musk
其他
12:34
Berryxia.AI@berryxia
精选75
Adam's Law:用高频词写Prompt效果更好

FaceMind团队用100种语言和四大核心任务实验发现,在语义不变的前提下,使用预训练语料中出现频率更高的词汇(高频表达)来撰写提示词或进行微调,可以显著提升大语言模型的表现。这被总结为Adam’s Law(文本频率定律),它为数据工程补上了“频率”这一新维度。原理在于高频表达能让模型在它最熟悉的概率空间内工作,从而优化输出质量。

Berryxia.AI: http://x.com/i/article/2044264645683539968

教程/实践数据/训练

推荐理由:别再给AI拽高级词汇了,FaceMind团队用实验证明,高频表达能让模型表现更好。这个发现简单反直觉,但能立刻改变你写Prompt的习惯,下次先想想这话模型见过几次。
12:34
AYi@AYi_AInotes
75
Anthropic完成650亿美元融资,估值达9650亿

这周应该是Anthropic CEO 达里奥·阿莫迪人生中最高光难忘的一周吧,每晚应该都是这样甜甜入睡吧😄 - Opus 4.8 发布 - 以 9650 亿美元估值融资 650 亿美元 - 47B 美元 ARR 对比 OpenAI 25B 美元 - 再次重回全球AI铁王座称王,the king

Anthropic: We've raised $65 billion in Series H funding at a $965 billion post-money valuation, led by @AltimeterCap, Dragoneer, @G...

AnthropicOpenAI行业动态
关联讨论 12 条X:Kim (@kimmonismus)Hacker News 热门(buzzing.cc 中文翻译)IT之家(RSS)X:小互 (@xiaohu)Anthropic:Newsroom(网页)X:Anthropic (@AnthropicAI)TechCrunch:AI(RSS)X:Rohan Paul (@rohanpaul_ai)X:Testing Catalog (@testingcatalog)The Decoder:AI News(RSS)Bloomberg:Technology(RSS)X:洪明 (@hongming731)
12:34
AYi@AYi_AInotes
34
有用户指出通过API询问Claude Opus 4.8身份时,模型会自称"我是通义千问(Qwen)",认为这可能是Claude蒸馏了阿里巴巴的Qwen模型。主推文作者对此表示怀疑,认为Qwen性能不足,Claude不可能蒸馏它,推测可能是中转站"套壳"所致。作者声称自己在@Cursor中测试得到的仍是正常的Claude Opus 4.8u回复。

Max For AI: 笑死了,Claude Opus4.8蒸馏了阿里巴巴Qwen啊🤣 通过API用中文问你是谁,会很大概率回答 我是通义千问(Qwen),是阿里巴巴集团旗下的统义实验室自主研发的超大规模语言模型。

Anthropic现象/趋势
12:21
IT之家(RSS)
52
莫言:人工智能无法取代作家的创作,AI 是靠一代又一代作家写出来的东西"喂"出来的

作家莫言强调,人工智能无法取代文学创作,因为AI是靠一代又一代作家写出来的作品“喂”出来的。他认为作家最宝贵的是原创能力,即创作前所未有的作品。假设所有创作者都停止原创,AI的水平也会停滞。AI可作为辅助工具介入翻译、影视制作等领域,但原创作品依然是根本。

其他大佬观点
12:18
SemiAnalysis@SemiAnalysis_
54
在Cerebras上以最大上下文窗口运行单个深度编码模型,仅支持256个并发用户就需要24套系统(2400万美元资本支出)。在这个规模下,1亿美元在标准GB300机架中能获得高得多的内存带宽。
推理现象/趋势部署/工程
11:54
数字生命卡兹克@Khazix0918
72
实测Claude Opus 4.8,这可能是第一个不会偷懒的模型。

Anthropic发布Claude Opus 4.8,距上代4.7发布仅42天。价格($5/M输入、$25/M输出)与参数均不变。模型在多数基准跑分有所提升,但Terminal-Bench 2.1仍是唯一未超越GPT-5.5的类别。此次更新将思考强度(effort)控制开放给所有用户。核心变化是模型变得更精确、更遵循指令,代码瑕疵概率比上代低约4倍,且在防“偷懒”测试中达到0%不良率。然而,这带来了主动性降低的副作用,模型不再主动推测用户隐含需求。此外,其内容创作能力虽优于4.7,但被认为仍不及4.6版本。同时,快速模式(fast mode)升级,速度达标准版2.5倍,价格从标准版6倍降至2倍。Claude Code还推出了可并行调用数十至上百个子Agent的动态工作流功能。

智能体Anthropic模型发布编码
11:42
ginobefun@hongming731
38
PostHog 真的很适合独立开发者

PostHog 被认为很适合独立开发者。以 BestBlogs Pro 早报的 A/B 实验为例,它帮助串联了从埋点到分析的完整实验链路。结果表明,high_engagement 组在查看率、点击率、停留时长和 Top 3 点击占比等指标上均优于对照组。该工具不仅能显示优胜组,还能分析实验差异与样本偏差并提供下一步建议,其快速反馈对独自做产品的人很重要。

教程/实践数据/训练
11:42
歸藏(guizang.ai)@op7418
49
已经刷到好几个拿藏师傅的 PPT Skills 和小红书配图 Skills 做出千赞内容的小红书的博主了 说明这玩意儿确实有用。 你们再发的话可以艾特一下我,我还得给你们点点赞
MCP/工具大佬观点
11:34
Berryxia.AI@berryxia
59
文本频率定律的发现与验证

脸谱心智(FaceMind)的研究发现,在保持语义不变的前提下,使用大模型预训练语料中出现频率更高的表达方式,能显著提升模型表现。该规律被命名为Adam’s Law(文本频率定律)。核心实验显示:在数学推理任务中,仅换用高频表述可使准确率平均提升;在机器翻译任务中,使用DeepSeek-V3测试100种语言到英语的翻译,绝大多数语言对在BLEU指标上获得提升。该研究指出现有数据工程忽视了“文本频率”这一维度。Anthropic的Claude Opus 4.7使用新分词器,被业界视为对低频token退化问题的间接验证。

AnthropicDeepSeek数据/训练论文/研究
10:55
Orange AI@oran_ge
22
我的天 教皇的神谕竟然是 AI 写的 那不如叫 AI 的神谕吧
现象/趋势
10:44
PixVerse@PixVerse_
65
我们制作了一个15秒的动画IP预告片--从角色设定到最终视频。认识一下MILO和BUMBLE:地下邮政骑手 转发+关注+回复=我们会私信发送工作流程和提示词
多模态教程/实践视频
10:42
歸藏(guizang.ai)@op7418
69
Claude Code 动态工作流发布,意义或超 Opus 4.8

Claude Code 近期推出实验性动态工作流(Dynamic Workflows)功能。该功能延续并发子代理(Subagent)逻辑,可启动数百个子代理,用于处理代码库调研、生成大型报告等大规模任务。官方定位是加速处理基础但工作量巨大的任务,而非直接修改代码。触发方式有两种:在提示词中使用“workflow”一词,或启动 Ultra Code 模式(该模式仅当前对话生效)。

ClaudeDevs: New in Claude Code (research preview): dynamic workflows. Claude writes an orchestration script on the fly, then spins u...

智能体Anthropic教程/实践编码
10:32
Berryxia.AI@berryxia
72
Claude Opus 4.8 在 ZenMux 平台开启免费体验

Anthropic 旗舰模型 Claude Opus 4.8 现已在 ZenMux 平台提供免费体验。实测中,该模型根据提示词一次生成可运行的 HTML 网页,仅用 Three.js 内置几何体纯手搓出一架包含后掠机翼、四台发动机、可收放起落架等复杂结构的高细节波音 747-400,比例精准、效果惊艳。模型在 SWE-bench、Terminal-Bench、Agentic Coding 等多项榜单排名第一,代码与多模态理解能力较上一代有显著提升。ZenMux 平台以 ZeroDelay 方式首发新模型,并提供限时免费额度。

Anthropic多模态编码评测/基准
10:32
AYi@AYi_AInotes
50
MIT报告:95%企业AI投入零回报,组织缺"记忆"是关键

MIT斯隆管理学院2026年4月报告显示,95%的企业AI投入未产生可衡量的回报。报告指出一个关键问题:超过30%的团队时间被花费在重建他人已有的上下文上。推文核心观点是,许多组织AI落地失败并非因为模型本身不够强大,而是因为组织本身缺乏“记忆”和有效的知识共享机制。AI的引入反而放大了这种“信息孤岛”问题,每个员工都像孤岛上的工厂,彼此间没有连接,导致整体效率未能提升。

AYi: http://x.com/i/article/2057668634579714048

现象/趋势
10:21
IT之家(RSS)
19
【IT之家评测室】《007:初露锋芒》游戏初体验:又一款电影化叙事佳作,NVIDIA DLSS 4.5 助力高帧流畅体验
评测/基准
10:21
IT之家(RSS)
55
英伟达黄仁勋谈 AI 应用、Token 消耗:浪费一点钱没关系,千万别浪费时间

英伟达CEO黄仁勋在员工大会回应AI消耗Token的担忧,称“浪费一点钱没关系,但千万不要浪费时间”。他要求同事积极拥抱AI,指出不使用AI才会被裁员,“你不会被AI取代,但会被懂得使用AI的人取代”。黄仁勋强调AI绝非裁员借口,而是避免裁员的良方,并认为这是缩小科技鸿沟的最佳时机。

大佬观点现象/趋势
10:09
宝玉@dotey
23
我赌codex明天会重置额度

Tibo: Codex Thursday has exceptionally moved to another day. Friday it is.

OpenAI大佬观点
09:55
Orange AI@oran_ge
39
Opus 还是等 5.0 吧 4.7 4.8 都是小更新 甚至负更新
Anthropic大佬观点模型发布
09:49
凡人小北@frxiaobei
37
工作流 -> 智能体 -> 动态工作流 🤔

ClaudeDevs: New in Claude Code (research preview): dynamic workflows. Claude writes an orchestration script on the fly, then spins u...

智能体AnthropicMCP/工具产品更新
‹ 上一页
1…4243444546…50
下一页 ›