AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
精选全部日报更多
全部动态
全部一手资讯X论文
6月3日周三
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月3日
12:23
SemiAnalysis@SemiAnalysis_
64
观点:Codex桌面应用UX和内置浏览器现在非常适合"氛围编程"。一旦OpenAI基础模型在设计能力上提升,我预计Codex凭借更好的UX,很快就能在SemiAnalysis VibeMAX基准上超越Claude Code CLI。目前Claude在VibeMAX上是S级,Codex是A+级。Anthropic过度投资Claude Code终端CLI,而对Claude Code桌面应用投入不足,这是走错了岔路。
AnthropicOpenAI大佬观点编码
12:16
Yuchen Jin@Yuchenj_UW
63
Opus 4.8 相比 Opus 4.7 没有带来很大的升级感。 与此同时,GPT-5.4 到 GPT-5.5 的升级感觉是真正的飞跃。现在我很好奇 5.6 会是什么样子。 Anthropic 是在为 IPO 保留 Mythos 吗?
AnthropicOpenAI大佬观点
12:07
向阳乔木@vista8
26
Codex 使用体验分享

推文表达了对 Codex 工具的喜爱。用户提到让朋友用 Codex 撰写新书推荐语,并分享了自己的使用数据:已不间断连续使用 11 天,单次最长任务时长为 8 小时。推文最后邀请其他用户在 Codex 个人资料中查看并分享自己的 Token 使用统计。

OpenAI其他编码
12:07
向阳乔木@vista8
62
这个朋友写的Skill有意思,帮你监控Codex的重置消息,哈哈哈。 第一时间切fast模型,消耗用量。 安装指令有点长,见评论区,复制发给codex用就行。
MCP/工具OpenAI教程/实践
12:06
Hacker News 热门(buzzing.cc 中文翻译)
67
我们如何为RAG建立图像索引

为解决检索增强生成(RAG)系统处理图像时的挑战,Kapa.ai提出了一种方法。他们使用GPT-4 Vision模型为每张图像生成文本描述。处理流程包括将图片压缩至512×512像素并批量生成描述。最终,这些图像描述与元数据一同存入向量数据库。该方法使RAG能够检索图像内容,实现约70%的检索准确率,且成本极低,每张图片处理成本约0.01美元。

检索增强多模态教程/实践
12:01
Logan Kilpatrick@OfficialLoganK
16
被低估,即是自由。
大佬观点
10:48
Chubby♨️@kimmonismus
64
OpenAI将Codex升级为生产力平台,微软Build大会发布完整AI智能体栈

OpenAI将Codex从编码工具升级为生产力平台,新增六大角色插件并集成62个应用,还推出Codex Sites功能。关键数据显示,Codex周活达500万,企业收入周环比增长50%,GPT-5.6即将发布,ChatGPT月活已突破10亿。微软在Build 2026大会上发布完整智能体栈,推出自研推理模型MAI-Thinking-1(35B参数,256k上下文),其在编码盲测中超越Claude Sonnet 4.6。同时,微软发布了Agent 365、GitHub Copilot桌面应用、Microsoft IQ上下文层,并公布了专为智能体设计的硬件项目Solara。

智能体MicrosoftOpenAI现象/趋势
10:16
Rohan Paul@rohanpaul_ai
60
FluxMem:将AI智能体记忆视为持续演化的动态连接网络

FluxMem是一种新型AI智能体记忆系统,其核心思想是将记忆视为一个动态连接的网络,而非静态存储。它将事实、过往任务经历与可复用技能作为图中的节点进行存储。执行任务时,FluxMem先收集可能有用的记忆,再根据任务反馈动态修正记忆间的连接关系。此外,系统能将反复成功的任务路径转化为可复用技能。测试显示,该系统在LoCoMo基准上平均准确率达95.06,并在GAIA基准上结合Kimi K2取得了12.73分的性能提升,优于现有记忆系统。

智能体arXiv大佬观点
10:05
Hacker News 热门(buzzing.cc 中文翻译)
52
加州大学系统内对人工智能的不同态度

加州大学系统内部,不同高校对在校园中使用人工智能工具采取了差异化的态度和政策。部分学校可能持开放或谨慎接纳的态度,而另一些则可能实施了更严格的限制。这种内部的政策分歧反映了在人工智能快速发展的背景下,学术机构在平衡创新应用与学术规范、伦理考量时面临的复杂局面。

政策/监管现象/趋势
10:02
公众号:数字生命卡兹克
精选66
Claude Code团队工程总监分享5条AI原生工作原则

Claude Code团队工程总监Fiona Fung提出,AI时代软件工程瓶颈从“写代码太贵”转移至验证、评审与安全。团队采用JIT规划,先做原型再补文档;遇到重复工作追问“能否自动化”,形成肌肉记忆。代码评审中Claude承担60-70%风格检查与漏洞捕捉,人类聚焦法律、安全与产品判断。角色边界模糊,PM写代码、工程师用Claude起草文案,招聘看重品味与判断力而非代码产出速度。

智能体Anthropic教程/实践部署/工程

推荐理由:瓶颈从写代码转移到验证,这判断太准了。更实际的是自动化那些重复三次以上的事,这套逻辑正在Claude Code团队验证,值得每个带团队的人照抄。
09:16
MarkTechPost(RSS)
64
如何在 Google Colab 上使用 QLoRA 和 DPO 微调 LFM2:完整分步编码教程

本教程详细介绍了如何在 Google Colab 环境中,使用 QLoRA 和 DPO 方法对 LFM2 模型进行微调。内容涵盖了使用 TRL 和 PEFT 库进行监督微调、DPO 对齐以及适配器合并的完整分步编码过程。

教程/实践数据/训练
09:13
meng shao@shao__meng
精选75
智能体工程实战窍门全录

该内容源自@mvanhorn的分享,介绍了“智能体工程”如何重塑软件开发。其核心是从“人主导编码”转向“人主导方向、智能体执行”,中心从IDE变为终端与计划文件。方法论遵循Research → Plan → Work循环,核心是让plan.md约束智能体行为。分享者总结了22条实战技巧,涵盖规划、并行执行、输入方式、远程控制等方面,并列出了完整的工具栈。

Matt Van Horn: http://x.com/i/article/2061440101411102721

智能体教程/实践编码部署/工程

推荐理由:mvanhorn 三个月从零到 27K stars 的实战手册,22 条 hack 把 agentic 开发从规划到执行到语音全打通,开发者能直接套用。
09:13
meng shao@shao__meng
11
认真看完每个字,心里久久不能平静!! 有句话还是忍不住想问: 这张图,是 AI 生成的吗 😄 【引用 @Sizhe_bitcat】:真人真事!到底谁的错?

Sizhe思哲: 真人真事!到底谁的错?

其他
09:08
Ethan Mollick@emollick
53
我的时间线上似乎有人对芝加哥大学引入Claude感到惊讶,但许多学校(包括我任教的宾夕法尼亚大学)都已实现全校范围的AI接入。 关于AI与学术研究,仍有许多问题需要解决,但安全且公平的接入是必要的基础。
大佬观点安全/对齐现象/趋势
09:06
SenseTime@SenseTime_AI
35
商汤SenseNova U1展示Neo-Unify架构潜力

在2026 AI创新论坛上,商汤联合创始人兼首席科学家指出,模型架构优化能显著降低单位智能的计算成本,并主张中国AI生态应通过应用与模型创新来驱动芯片发展。其最新多模态模型SenseNova U1基于自研Neo-Unify架构,实践了这一理念,在信息图生成任务中实现了显著更低的计算成本,并同时适配了多种中国芯片。商汤强调将继续开发真正解决用户问题、创造商业价值的AI解决方案。

大佬观点
09:01
Sam Altman@sama
59
美国应通过持续开发最优秀的模型、确保其安全、并将网络工具交到可信的防御者手中来引领AI发展。 新的行政令取得了正确的平衡。
OpenAI大佬观点政策/监管
08:36
SenseTime@SenseTime_AI
34
商汤发布SenseNova U1模型及Neo-Unify架构

商汤联合创始人兼首席科学家在2026 AI创新论坛指出,模型架构优化能显著降低单位智能所需的算力。其新发布的多模态模型SenseNova U1基于自研Neo-Unify架构,实践了这一理念,在生成信息图时实现了显著更低的计算成本,并已适配多款中国芯片。商汤强调持续通过应用与模型创新推动芯片发展,以创造商业价值与长期竞争力。

多模态大佬观点推理端侧
08:30
jason@jxnlco
46
模型 'gpt-image-2' 不存在 https://chatgpt.com/s/m_6a1f701a74748191b883735fff3b28d7
OpenAI产品更新图像生成
08:26
DogeDesigner@cb_doge
21
Grok Imagine 处理 Logo 的效果相当不错。🔥
xAI图像生成评测/基准
08:12
meng shao@shao__meng
66
BigSet:AI生成B2B SaaS清单的开源工具

开源项目 BigSet 允许用户用自然语言描述数据需求,从实时网络中构建并定期刷新结构化数据集。研发团队负责人邵猛在实际工作中使用它,自动生成了一份 B2B SaaS 产品清单,内容涵盖产品分类、免费方案说明及官方定价页面链接,省去了逐一查找官网的繁琐工作。该项目已在 GitHub 上开源。

TinyFish: What if you and your agent had all the data that always stays fresh? Structured, on demand, never stale. Introducing Big...

GitHub搜索教程/实践
08:09
IT之家(RSS)
53
郭明錤:黄仁勋"重新发明 PC"口号与英伟达 RTX Spark 端侧 AI 智能体蓝图

天风国际分析师郭明錤评论称,英伟达 RTX Spark 的核心看点在于黄仁勋提出的“重新发明 PC”口号及端侧 AI 智能体工作流概念。该概念涵盖操作系统、云端与本地大语言模型切换等要素,但并非英伟达原创。他指出,RTX Spark 在未来 2 年内仍是笔记本电脑中的利基市场产品,目标人群是对端侧 AI 算力有需求的重度用户。要真正实现智能体工作流,需依赖 CUDA Toolkit 公开支持 Windows Arm64 及微软 Windows 本机 AI 智能体架构正式商用等软件生态支持。苹果在 WWDC 上对设备端 AI 智能体工作流的回应也将是另一观察重点。

智能体大佬观点端侧
08:05
Tibo@thsottiaux
26
@romainhuet 在我们每次 Codex 演示中。无论是否临时准备。都无所谓。总是准备就绪。 掏出笔记本电脑,像《分裂》里的凯文一样,切换了 23 种不同的人格。
OpenAI其他
08:00
jason@jxnlco
20
我有心像缺失症,所以GPT图像生成错误对我没有影响。
OpenAI大佬观点
07:58
ginobefun@hongming731
70
Claude Code 动态工作流与 GitHub Copilot 桌面应用发布

Anthropic 为 Claude Code 推出动态工作流,允许模型为每个任务自主生成 JavaScript 编排脚本,动态选择模型并启动多个子智能体在独立环境中并行执行,以解决单一上下文窗口处理复杂任务的限制。同时,GitHub 在 Microsoft Build 上发布了以智能体为核心的 Copilot 桌面应用,提供统一视图、协作面板和自动化流程,旨在管理并行 Agent 开发。文章披露,GitHub 平台每月提交量已突破 14 亿次。

智能体AnthropicGitHub现象/趋势
07:58
ginobefun@hongming731
49
Claude Code动态工作流与Copilot桌面应用发布

Anthropic 详解 Claude Code 的动态工作流,其能为每个任务即时生成专属编排脚本,旨在解决智能体懒惰与目标漂移问题。GitHub 发布 Copilot 桌面应用,为每个智能体提供独立的 worktree,其月代码提交量已突破 14 亿 tokens。此外,有观点指出大模型是史上首个“认知引擎”,工程师角色正从编写代码升级为设计能自我纠偏的 AI 系统。

智能体AnthropicGitHub编码
06:57
Simon Willison 博客
61
微软发布新MAI模型

微软发布了MAI-Thinking-1与MAI-Code-1-Flash两款新大语言模型。MAI-Thinking-1为35B参数的推理模型,目前向部分早期合作伙伴开放,官方称其在盲测中优于Sonnet 4.6。MAI-Code-1-Flash为5B参数模型,专为GitHub Copilot和VS Code优化,将逐步向VS Code的Copilot个人用户推出。两款模型均强调使用清洁、商业授权的数据从零开始进行端到端训练,未使用第三方模型进行蒸馏。

Microsoft大佬观点推理编码
06:56
Orange AI@oran_ge
12
当 CEO 发现 Token 很贵
现象/趋势
06:29
fofr@fofrAI
37
K2 处理风格参考强度的方式真的很棒。

fofr: Playing around a bit with Krea's K2 Large image model. I love how expressive it feels, and the variability you get with ...

图像生成评测/基准
06:26
Orange AI@oran_ge
48
Claude 版本迭代放缓,开发工具未加速模型进步

推文指出 Claude Opus 4.7 与 4.8 的发布效果不佳,价格提升但性能无明显改进甚至下降。作者认为 Claude 模型已停滞 4 个月,即使内部拥有 Mythos 等开发工具,模型进步速度依然未显著加快,仍维持约半年一次重大更新的节奏。

Anthropic大佬观点现象/趋势
06:13
elvis@omarsar0
38
代码就是你所需的一切! 搜索即代码 工具链即代码 接下来是什么?

Thariq: Workflows are the biggest upgrade to Claude Code's capabilities since skills and subagents. I dove deep into it with @si...

Anthropic产品更新编码
06:08
Ethan Mollick@emollick
40
那些"全能应用"看起来仍然很像聊天机器人与 IDE 的混合体,而非为通用知识工作而构建的东西。 太多假设线性流程且最终产出是唯一目标,太少与研究的连接,不够多的引导或选择机会,等等。
大佬观点现象/趋势
05:11
Emad@EMostaque
17
这没事 🐶☕️🔥 【引用 @EMostaque】:我对 Claude Opus 4.8 的评价: 我们应该少担心被变成回形针,多担心被烦死。

Emad: My review of Claude Opus 4.8: We should worry less about being turned into paper clips & more about being annoyed to dea...

Anthropic大佬观点
04:47
Chubby♨️@kimmonismus
18
"大家都讨厌 AI 垃圾内容" "我们将决定:这是氛围感,还是垃圾?" 这听起来是个有趣的活动 :D
图像生成现象/趋势
04:47
Chubby♨️@kimmonismus
50
刚刚发现"Mai"-1 thinking 代表: 微软 AI 思考。 🤯

Chubby♨️: Mai-1 thinking: Mid size model, 45b active parameter, MoE, side by side with sonnet 4.6 0 distillation "Microsoft's firs...

Microsoft大佬观点推理
04:38
Ethan Mollick@emollick
24
我希望Discord和Codex的标志以及底部文本框界面不要乍一看那么相似。我已经混淆过好几次了,导致GPT-5.5和群聊都一头雾水。
OpenAI大佬观点
04:38
Ethan Mollick@emollick
38
仅从分数很难判断 MAI-Thinking-1 有多好(比如 GPQA 和 Terminal Bench 2.0 的分数低得奇怪) 但微软在模型发布后很难让人试用(这是许多微软 AI 产品的通病),所以我不太清楚。不过数据低于 Meta Spark。
Microsoft大佬观点
04:35
Hacker News 热门(buzzing.cc 中文翻译)
26
Gmail觉得我很蠢,所以我走了

作者因不满Gmail过度“智能”的分类、过滤及对用户选择的“纠正”,决定迁移到Fastmail。他指出Gmail将邮件强制归入促销、社交等分类且难以关闭,干扰了工作流程;同时其垃圾邮件过滤过于激进,错误屏蔽重要邮件。作者体验Fastmail后,认为其提供了更安静、可控的邮件管理环境,能按自身习惯组织邮件,不再被平台的“AI”预设所困扰,从而提升了效率。

Google现象/趋势
04:29
fofr@fofrAI
29
稍微玩了一下 Krea 的 K2 Large 图像模型。我很喜欢它带来的表现力,以及每个提示词产生的多样性。
其他图像生成
04:24
ClaudeDevs@ClaudeDevs
精选73
如何让 Claude Code 在交回工作前检查自己的成果? 看看如何编码你的手动检查,让 Claude 自己关闭反馈循环:
智能体Anthropic教程/实践编码

推荐理由:如果你用Claude Code写代码,这个官方视频值得立刻打开——它教你把手动检查编码进去,让Claude自己形成反馈循环,能省掉大量反复修改的时间。
04:03
The Verge:订阅版科技(RSS)
37
我体验了下一代掌机MSI Claw 8 EX AI Plus

微星(MSI)推出了MSI Claw 8 EX AI Plus掌机,搭载Intel芯片,该产品被视为正在推动掌机市场向前发展的设备。

产品更新
‹ 上一页
1…3132333435…50
下一页 ›