AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
精选全部日报更多
全部动态
全部一手资讯X论文
5月30日周六
5月29日周五
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月30日
02:03
Steve Yegge:Medium(RSS)
66
技术面试的终结

作者基于超过35年的技术面试经验指出,该流程存在根本性缺陷。面试结果极不可靠,面试官意见高度不一致,且评分无法有效预测候选人实际表现。亚马逊的“Bar Raiser”和谷歌的“Hiring Committee”等补救机制并未从本质上解决问题。作者认为,当前的人才评估方式亟需一场根本性的变革。

大佬观点现象/趋势
01:45
The Verge:AI(RSS)
62
科技公司迫切希望拍摄你做家务的画面

AI训练数据初创公司Shift宣布将为纽约人提供免费家庭清洁服务,并计划扩展至伦敦等城市。作为交换,Shift要求拍摄其清洁人员工作的视频,记录洗碗、擦柜台、扫地、拖地等所有家务劳动。这些视频数据正被机器人公司竞相收集,用于训练机器完成家务,最终目的是销售家用服务机器人。

具身智能数据/训练现象/趋势
01:39
宝玉@dotey
68
用AI开发Mac应用的几点实用经验分享

一位开发者分享了借助AI开发Mac应用的四点经验:建议优先使用AppKit而非SwiftUI,因后者界面较弱,而AI已弥补了AppKit开发复杂度高的短板;推荐在编码前先用Claude Design打磨UI与UX;指出Opus模型生成的UI优于GPT-5.5;并提到Codex提供了一个名为“Build macOS Apps”的官方插件可供使用。

卫斯理: 今天想到一点,我是否可以去做 mac app? 理由如下 - 会 objective-c/swift 我是国内比较早进入 iOS 开发的那批人 - 正好有个 idea - 正好有 claude code ,以前总觉得 appkit 很难用,...

教程/实践编码
01:19
AI Notkilleveryoneism Memes ⏸️@AISafetyMemes
40
半个国家的人认为AI很蠢且没有进步,然而……它们即将抢走所有人的工作? 搞什么?
推理现象/趋势
01:18
SemiAnalysis@SemiAnalysis_
56
我们在电力危机研究中持续关注的一个数据点,因为它捕捉了AI运营商想建设的内容与电网实际能批准的内容之间的全部错配,即ERCOT的数据中心互联请求与电网运营商愿意支持的容量之间的差距。(1/4) 🧵
现象/趋势部署/工程
01:15
Rohan Paul@rohanpaul_ai
精选76
亲测为实:难以置信的推理速度

Kog团队在标准数据中心GPU上实现了极高的单用户推理速度,在8× AMD MI300X GPUs上达到3,000 tokens/s,在8× NVIDIA H200上达到2,100 tokens/s。相比常规推理速度(约100-300 tokens/s),实现了10-30倍提升。其核心思路是将LLM解码视为内存流问题,通过协同设计monokernel、重建同步机制、针对性内存访问映射及采用延迟张量并行的Laneformer模型架构,消除了传统流程的阻塞点。

大佬观点推理部署/工程

推荐理由:Rohan亲自测完Kog AI的3000 token/s,把单用户推理速度拉高了10-30倍,这套monokernel设计可能改写低延迟推理的玩法,做实时AI产品的团队必须盯紧。
01:15
Yuchen Jin@Yuchenj_UW
35
Google正在同时对抗所有最终Boss: 在模型领域对抗OpenAI和Anthropic, 在芯片领域对抗Nvidia, 在云服务领域对抗AWS和Microsoft, 在广告领域对抗Meta, 在自动驾驶领域对抗Tesla, 在手机和操作系统领域对抗Apple。 市值4.6万亿美元,却感觉被奇怪地低估了。
Google大佬观点现象/趋势
01:07
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选56
可信第三方评估的共享操作手册

OpenAI 发布了一份关于第三方 AI 评估的指导框架,内容涵盖如何评估前沿系统的能力、安全防护措施及评估本身的有效性。

OpenAI安全/对齐教程/实践评测/基准

推荐理由:OpenAI 首次把模型评估的方法论打包共享,这份指南是给第三方评估者的操作手册,比零散的论文更落地,做评测的团队可以直接抄作业。
00:34
Berryxia.AI@berryxia
57
Liquid AI发布设备端优化模型LFM2.5-8B-A1B

Liquid AI发布了LFM2.5-8B-A1B,一款为设备端优化的模型。它采用8B MoE架构,但仅有1.5B active参数,在38T tokens上进行了大规模RL训练,并将上下文扩展至128K。该模型的工具调用与多步智能体能力强劲,表现可接近4倍参数规模的模型。它支持在单台笔记本上完整运行本地智能体循环,具备低延迟与隐私优势。该模型兼容llama.cpp、MLX、vLLM等框架,覆盖Apple、NVIDIA、AMD硬件。

Liquid AI: Today, we're releasing LFM2.5-8B-A1B, a device-optimized model designed to power real-life applications on phones, lapto...

智能体模型发布端侧
00:34
AYi@AYi_AInotes
67
AI并未提升组织效率,反而暴露了其记忆缺失问题

AI工具虽使个体效率大幅提升,却未加快组织整体产出。核心在于组织普遍缺乏“记忆”:MIT Sloan 2026年报告显示95%的企业AI投资未产生可衡量回报,超过30%的团队时间用于重复建立上下文。个体生产力因AI工具(记忆留存于个人账户)而提升,但这种收益无法在组织层面整合,导致“个人在飞,组织在垮”。Sequoia在AI Ascent峰会提出,2026年将是长周期智能体的商业元年,下一轮AI将卖结果而非工具。

现象/趋势部署/工程
00:33
Tomer Tunguz 博客(VC 分析)
精选65
技能提炼

“技能提炼”是一种知识转移方法,由前沿大模型(如 Opus 4.7、GPT-5.1、Gemini 3 Pro)负责撰写并优化标准化的 SKILL.md 流程文件。然后,本地运行的小模型(如 Qwen 35B、Gemma 26B)直接执行这些文件。此过程不同于压缩模型权重的知识蒸馏、训练权重的指令微调或检索事实的 RAG,其核心是提取并转移操作流程,让小模型按步骤执行,从而形成前沿模型作教师、小模型作执行者的循环。

智能体MCP/工具大佬观点

推荐理由:Tomer 把个人代理的完整工作流摆了出来,用大模型写 skill 小模型执行,这条蒸馏思路比调 prompt 高级,想认真跑本地代理的人该盯一下。
00:25
Boris Cherny@bcherny
62
Salesforce发布了一篇关于使用Claude Code实现智能体化的详细文章。有几点引人注目。 他们曾评估需要231天的迁移工作,在13天内完成。其中一个PR交付了21个端点,测试覆盖率达到100%。
智能体Anthropic教程/实践编码
00:15
AK@_akhaliq
69
minWM 一个用于实时交互视频世界模型的全栈开源框架
开源/仓库开源生态视频
00:15
TechCrunch:AI(RSS)
精选70
Cognition的Scott Wu表示:AI编程智能体不应取代人类

Cognition公司开发了Devvin,这是一个号称首个且最成功的AI编程智能体。其著名程序员创始人Scott Wu明确表示,该智能体并非旨在取代人类程序员。

智能体大佬观点编码

推荐理由:Devin 创始人主动说 AI 编码代理不该取代人类,这个表态本身比技术有意思,做开发者工具的产品人该琢磨一下背后的潜台词。
00:07
Google AI@GoogleAI
64
聆听Gemini的架构师们回顾他们持续推动AI前沿的旅程,本期Release Notes节目。 @JeffDean、@koraykv、@OriolVinyalsML和@NoamShazeer一同出镜,分享模型背后团队的幕后故事,以及他们如何见证愿景的实现。
Google多模态大佬观点
关联讨论 1 条X:Jeff Dean (@JeffDean)
5月29日
23:26
Orange AI@oran_ge
67
推文探讨了AI带来时间节省后的悖论效应:当人们终于获得所追求的自由时间时,反而感到手足无措。引用@fortelabs的观点指出,AI节省时间后暴露出许多人生活的核心问题--缺乏深厚的业余爱好、社群联系和文化积累,生活完全以工作为中心。面对意外获得的自由,人们非但无法有效利用,反而更可能将自己更深地埋头于工作中,形成循环。最终,"自由"本身成了最令人无所适从的东西。

Tiago Forte: I think the main thing AI has taught me, through all the time savings it brings, is that I'm not a very interesting pers...

大佬观点
23:24
Kling AI@Kling_ai
62
Kling AI戛纳展示--RAPHAEL:AI工作流幕后 深入了解RAPHAEL,一部使用Kling AI创作的AI驱动故事片。看看创作者如何在整个电影制作流程中运用Kling AI,从创意构思到最终电影画面,简化制作并释放新的创作可能性。
教程/实践视频
23:14
elvis@omarsar0
68
AI智能体评估新指标:有效反馈计算提升成功率

新研究提出“有效反馈计算(EFC)”指标,用于优化AI智能体测试框架的设计。传统评估中,原始token数和工具调用次数预测智能体失败的R²值仅为0.33至0.42,而EFC将此提升至0.99。基于EFC进行资源重分配,可在相同计算量下将智能体成功率从0.27显著提升至0.90,使框架设计从经验猜测变为可预测过程。

智能体arXivMCP/工具论文/研究
23:10
向阳乔木@vista8
65
AI辅助PPT设计流程

用户分享其AI驱动的PPT制作流程:先用GPT 5.5 Pro和Grok搜集资料并形成个人理解;再由Codex或CC加工成Markdown格式的经验帖;然后将内容上传至Youmind,生成大纲及20页高清PPT页面;最后导出图片包,在Keynote中完成自我介绍、FAQ等最终页面的制作。

OpenAI教程/实践
23:10
Hacker News 热门(buzzing.cc 中文翻译)
60
在标准GPU上进行实时大语言模型推理:单次请求生成速度达3k tokens/s

该技术成果展示了在标准GPU硬件上实现大语言模型实时推理的可能性。核心性能指标为单次请求的生成速度可达到3000个tokens每秒(3k tokens/s per request)。这一结果表明,对于特定场景或模型配置,即使在非专用集群的常规计算设备上,也能实现高速的模型输出,对于降低大语言模型的使用门槛和成本具有参考意义。

推理教程/实践部署/工程
23:10
Hacker News 热门(buzzing.cc 中文翻译)
51
请使用 AI

文章呼吁人们使用人工智能(AI)。作者Shawn Smucker在Substack上发布该文,并在Hacker News上引发讨论,获得101个社区积分。

安全/对齐现象/趋势
23:09
X.PIN@thexpin
65
华为提出τ定律应对芯片制程瓶颈

由于美国出口管制,华为在芯片先进制程竞赛中面临困难。为此,华为于2026年5月提出“τ(Tau)定律”,旨在为后摩尔时代的芯片性能提升提供新框架。该定律的核心是优化有效RC时间常数(τ)以提升信号传播速度。其方法是不完全依赖制程微缩,而是从晶体管、电路、芯片互连及系统架构四个层次进行优化,以压缩τ值。华为将其描述为中国公司首次提出具有全球影响力的后摩尔扩展框架。

推理现象/趋势端侧部署/工程
22:56
Orange AI@oran_ge
47
也许会有一种新的软件商业模式 第一版免费 后续更新每次都收费 毕竟 AI Coding 第一版是最简单的… 维护是很费心力的… 或者 agent 自己迭代的版本免费 人类迭代的版本收费
大佬观点行业动态
22:49
Peter Steinberger 🦞@steipete
41
"clanker"不是贬义词。"vibe coding"才是。

Armin Ronacher ⇌: More musings after some people got upset about the word clanker. https://lucumr.pocoo.org/2026/5/26/clankers/

大佬观点编码
22:45
Chubby♨️@kimmonismus
40
o3 本该被命名为 GPT-5。 是时候说再见了。 很棒的模型。

Tibor Blaho: OpenAI is retiring o3 from ChatGPT on August 26, 2026 and GPT-4.5 on June 27, 2026 (these changes apply only to ChatGPT,...

OpenAI大佬观点
22:42
歸藏(guizang.ai)@op7418
63
AI编程工具不止写代码:新实用场景涌现

推文指出,Claude Code、Cursor等AI编程工具的能力已超越代码编写。作者分享了一个实际用例:在手机安装谷歌框架遇到问题时,通过Claude Code自动完成了下载安装包、安装和调试的全过程,体现了这类工具在解决日常技术问题上的潜在实用价值。

智能体Anthropic教程/实践端侧
22:40
Runway@runwayml
52
深入幕后,了解《The Rogue》如何由一个人在一个月内使用 Runway 制作完成。 《The Rogue》是 Project Luxo 的一部分:这是一个探索 AI 生成视频如何跨越恐怖谷的新项目。
图像生成教程/实践视频
22:34
Berryxia.AI@berryxia
68
开源项目:Three.js打造3D盛唐长安互动世界

作者开源了一个使用3D渲染技术Three.js搭建的盛唐长安互动世界项目。项目核心功能是接入Agora Skills,实现了实时语音互动。用户可以在虚拟世界中与NPC对话、与李白对诗、玩诗词小游戏、进入珍宝馆欣赏诗画,以及逛AI展馆体验古今融合。作者透露该项目花费了2周开发时间及800美元成本,现已托管在GitHub上并开放体验。

多模态开源/仓库语音
22:34
AYi@AYi_AInotes
60
AI让认知变廉价,关键在能否用它造新东西

红杉资本举办闭门会议,聚集150位AI领域创始人与OpenAI、Google、英伟达的核心高管。与会者将AI对认知工作的影响,比作电解法让铝价暴跌99.5%,使铝从比黄金贵的建筑材料变为廉价的铝箔。这隐喻写代码、写文案等长期练就的认知能力正迅速贬值。但观点强调,认知能力变便宜并非危机,真正的挑战是:当思考变得像铝箔一样随手可得时,能否用这些“白菜价”的脑力,去创造以前根本造不起的新事物。

AYi: http://x.com/i/article/2057668634579714048

大佬观点现象/趋势
22:23
Bloomberg:Technology(RSS)
47
市场重注押宝AI,这位哈佛教授却持保留态度

在人工智能需求推动下,市场接近历史高点,投资者正大举押注AI增长。哈佛大学经济学教授、国际货币基金组织(IMF)前第一副总裁吉塔·戈皮纳思(Gita Gopinath)做客Odd Lots播客,与主持人探讨了由AI驱动、没有社会动荡的“完美生产世界”是否可能实现。

大佬观点现象/趋势
22:19
Peter Steinberger 🦞@steipete
57
多个知名开源项目正在全面禁止AI/大语言模型相关的代码贡献。QEMU的政策是拒绝任何被认为包含或源自AI生成内容的贡献;NetBSD将AI生成的代码推定为污点代码,不得提交;Zig对AI实施完全禁令,明确禁止使用大语言模型生成内容、翻译、查找bug,甚至禁止讨论使用聊天机器人/大语言模型服务;OBS Studio则要求代码必须由人类编写。

The Lunduke Journal: While the Linux Kernel is quickly becoming "Vibe Coded", many other Open Source projects are outright banning all AI / L...

大佬观点开源生态编码
22:15
Rohan Paul@rohanpaul_ai
52
在真实拳击场辩论:Transformer 架构与后继者的未来

这是一场关于AI架构的辩论。Transformer阵营指出,其凭借简单、硬件友好、可扩展的优势主导当下,核心是基于键值存储的记忆与注意力机制,并强调任何替代架构必须能在扩展性上与之匹敌,且需达到约10倍优势才能颠覆现有技术栈。Post-Transformer阵营则认为,当前大语言模型的推理更像是后置的文本步骤,真正的突破在于实现模型内部的“潜在推理”与持续学习能力,并指出长上下文不等于真正记忆,未来可能是混合架构。辩论还提到,当前公开基准测试易被优化,而困惑度(Perplexity)仍是评估前沿模型的有效指标。最后指出,尽管Transformer仍占主导,但前沿正在拓宽,并列举了Pathway的BDH、Sakana AI的CTMs和Liquid AI的LFMs等新兴架构作为例证。

推理数据/训练现象/趋势
22:14
Ethan Mollick@emollick
57
围绕AI重构软件工程仍需努力(即使AI的编码能力正以极快的速度增长)。 理想情况下,组织应将token用于两件事: 1) 构建产品 2) 探索最佳实践的实验(这必然包含失败)
大佬观点编码
21:45
Chubby♨️@kimmonismus
38
推文主推文将教皇方济各(Pontifex)的言论比作"随机鹦鹉"论调的2026年新版,意指此类质疑在当下重新流行。引用的核心观点强调,AI不具备人类的亲身经历、身体感知、情感(如喜悦与痛苦)、道德意识,也无法真正理解爱、工作或责任,因其缺乏人类成长所需的感知、关系与精神视角。推文认为,尽管形式更新,这类对AI本质的否定性判断本质未变。

Pope Leo XIV: Artificial intelligences do not undergo experiences, do not possess a body, do not feel joy or pain, do not mature throu...

大佬观点推理
21:40
Hacker News 热门(buzzing.cc 中文翻译)
46
人工智能会导致前端领域重蹈"失落的十年"覆辙吗?
现象/趋势编码
21:34
AYi@AYi_AInotes
14
本文探讨"以术入道"的AI使用哲学。作者将AI工具分为两类:自主运行的Agent型(如Claude Code),和需人工逐步判断的"实习生型"(如Cursor)。后者是培养用户判断力的关键,但受限于必须在场的瓶颈。文中介绍了网易的免费远程软件UU远程,它允许用户通过手机连接Mac运行Cursor,实现低延迟操作,包括原生终端支持,从而打破了物理距离的限制。作者认为,AI发展的当前阶段,更需要这种能随时与AI协同思考的连接方式。

AYi: 今天,把一件关于 AI 很底层的事,彻底想透了。 使用 AI 的最佳方式是以道御术,但前提是你得先以术入道。 就像黄仁勋说的--真正会用 AI 的人,都是极高认知的提问者,带着自己的认知去提问,让 AI 帮你叩开未知的边界,而不是让它替你思...

其他开源/仓库教程/实践
21:30
OpenBMB@OpenBMB
53
🚀 一个1.3B模型在矿山现场和企业办公室处理实际工作--比你的标注团队更快。 开发者Jingdong分享的一个近期社区案例,探索了使用MiniCPM-V 4.6进行: ✅实验室图像中的矿样计数 ✅现场图像中的车辆检测与计数 ✅航拍地图中的矿区识别 ✅Go代码完整性检查 以下是实际发生的情况🧵
多模态教程/实践
21:15
Chubby♨️@kimmonismus
24
对我来说,现在每月都有新版本发布仍然感觉很疯狂--而且在一个月内,几乎每家主要AI实验室都推出了重要模型。
其他现象/趋势
20:34
AYi@AYi_AInotes
52
今天,把一件关于 AI 很底层的事,彻底想透了。

本文探讨了使用AI的两种核心路径:以Claude Code、Codex为代表的AI智能体型工具,可自主执行任务;以及以Cursor为代表的实习生型工具,需用户监督判断,后者是磨练判断力(以术入道)的关键。但Cursor依赖本地运行,限制了使用场景。作者通过UU远程(网易出品,免费)解决了这一问题,其手机端可实现4K 144帧低延迟连接,并原生支持完整终端,方便在移动端操作Cursor,实现了与AI实习生的随时连接。核心观点是AI工具的尽头是磨练我们成为值得被认真回答的提问者。

智能体大佬观点编码
20:10
meng shao@shao__meng
50
http://Clawd.rip 这个网站,只能说,太勇了!真的不怕 A\ 厂律师函啊?? http://Clawd.rip 是一份按时间排列的 Anthropic / Claude 争议与事故编年,语气讽刺(标题 Everything that went wrong with Claude、结尾 Don't Be Like Anthropic),但每条大多可对应公开来源:官方 status、postmortem、媒体报道、GitHub issue、诉讼与政策公告。 致敬一下作者 @maria_rcks 👍🏻

Peter Steinberger 🦞: I smell a takedown in 3...2...1 https://clawd.rip/

Anthropic现象/趋势
‹ 上一页
1…4142434445…50
下一页 ›