AIHOT

精选全部 AI 动态 AI 日报 Agent 接入关于更新日志反馈信源提报

精选全部日报更多

全部动态今日 94 条

全部一手资讯 X 论文

今天6月13日周六

全部 AI 动态

AI 相关资讯全量信息流

全部一手信源资讯推文

全部模型产品行业论文技巧

6月13日

03:13

MiniMax (official)@MiniMax_AI

64

MiniMax M3 已在 Fireworks AI 上线，Day-0 即获最快推理端点。模型为开源权重，在 Artificial Analysis 指数排名第一。支持 512K 上下文窗口、原生图像及视频输入；采用 MSA 稀疏注意力机制，实现 9 倍更快的 prefill 与 15 倍更快的 decode。定价与 M2.7 持平。M3 将长周期智能体、全仓库理解与多模态编程集成于单一模型。

Fireworks AI: MiniMax M3 is live on Fireworks. Day-0, fastest endpoint for the MiniMax series. → Top open-weight model on the Artifici...

智能体多模态推理模型发布

03:04

Ars Technica：AI（RSS）

61

Jeff Bezos 新创公司 Prometheus 将专注于物理 AI

Jeff Bezos 创立的新公司 Prometheus 瞄准物理 AI 领域。尽管并非唯一涉足该赛道的初创企业，Prometheus 是资金最充足的公司之一。

具身智能行业动态

03:04

AK@_akhaliq

46

SpenseGPT 实用的一次性剪枝，实现LLM推理的稀疏和密集GEMM

推理论文/研究

03:01

HuggingFace Daily Papers（社区热门论文）

66

TRACE：将用户修正编译为运行时约束以改善编码智能体

交互式LLM智能体的用户偏好修正常被遗忘，Mem0记忆仍有57.5%相关偏好检查被违反。研究提出TRACE，一种即插即用的技能层管道，从用户聊天修正中挖掘原子规则并编译为运行时检查。在ClawArena上，分布内违规从100.0%降至37.6%，分布外从100.0%降至2.0%；在MemoryArena上，分布内从100.0%降至60.5%，任务通过率匹配或超越最强记忆基线。实验代码已开源。

智能体arXivGitHub论文/研究

03:01

HuggingFace Daily Papers（社区热门论文）

36

异构智能体稠密潜在通信：See What I See， Know What I Think

多智能体系统通常依赖文本通信，解码-重编码代价高且信息有损。KV-cache通信是低开销替代方案，但现有方法多限于同构模型。本文提出稠密对齐方法，通过轻量级跨模型缓存变换和两阶段训练（重构→生成）实现异构智能体间KV-cache直接传输。在Qwen3-4B、8B、14B三个模型组成的六个方向和六个基准上，上下文感知设置中性能匹配或超越文本通信，计算量降低2–3倍；上下文无关传输中仍有效，而先前方法完全失效。

智能体编码论文/研究

03:00

Bloomberg：Technology（RSS）

54

SpaceX 因 Grok 运行遇技术难题，将 Colossus 1 数据中心全部租赁给 Anthropic

SpaceX 决定将位于孟菲斯的 Colossus 1 数据中心全部容量租给 Anthropic。此举源于 SpaceX 团队在利用该设施开发并运行其 Grok AI 模型时遇到技术困难。据知情人士透露，SpaceX 是在自家团队用起来有麻烦之后才做出这一决定的。

Anthropic行业动态部署/工程

02:58

The Decoder：AI News（RSS）

62

Anthropic调查：超半数美国人担心AI导致失业和丧失独立思考能力

Anthropic对近5.2万美国人进行的调查显示，64%的受访者担心AI会导致失业，56%担心会丧失独立思考能力。日常AI用户的担忧程度远低于非用户。尽管如此，大多数人仍拒绝在工作中使用AI，即使他们认为AI能够处理相关任务。

Anthropic现象/趋势

02:48

Hacker News 热门（buzzing.cc 中文翻译）

65

减少AI生成前端界面粗糙度的文章

本文介绍如何减少AI生成前端界面的粗糙度，发表于envs.net。文章针对AI产出的前端代码常出现的草率、不细致问题，提出改进方法，旨在提升生成结果的质量和可用性。

教程/实践编码

02:43

MiniMax (official)@MiniMax_AI

69

MiniMax-M3 是一款拥有 428B（23B 激活）参数、1M 上下文的新开源模型，性能与 Gemini 3.1 Pro 相当。可在 138GB 内存/显存上运行动态 2-bit GGUF 版本，或 165GB 上运行 3-bit 版本。在 @UnslothAI 的帮助下，今天即可本地运行 M3。

Unsloth AI: MiniMax M3 can now be run locally!🔥 MiniMax-M3 is a new 428B (23B active) open model with 1M context that performs on p...

Hugging Face开源生态模型发布

02:32

Rohan Paul@rohanpaul_ai

43

AGENTCL：面向语言智能体持续学习的严格评估

AGENTCL 提出评估 AI 智能体是否真正从经验学习，而非单纯累积信息。通过构建组合任务流（前序任务包含可被后续任务复用的代码片段、研究证据或工作流），与无固定复用线索的随意任务流对比。关键发现：当前记忆方法在任务连接明显时可复用过去经验，但当任务差异较大时仍难以避免混淆。论文旨在为智能体持续学习提供更清晰的测评标准。

智能体论文/研究评测/基准

02:28

Simon Willison 博客

24

Andrew Singleton 的 AI 经济学讽刺寓言

Jenny 经营一座火葬场，John 的丙烷公司以 200 亿美元投资换取其 5% 股份。Jenny 将 100 亿美元投入焚化炉，再付给 John 100 亿美元购买丙烷烧掉这些钱。John 向外界报告其 AI 投资本季度产生 100 亿美元收入，并持有价值 1000 亿美元企业的 5% 股权。福布斯记者在撰写人物报道时与二人陷入混乱的三人恋情，最终结成多角婚姻，其报道赞誉有加但缺乏财务细节。

现象/趋势

02:23

TechCrunch：AI（RSS）

61

Google 起诉被指使用 AI 发送诈骗短信的中国网络犯罪团伙"Outsider Enterprise"

Google 起诉一个名为“Outsider Enterprise”的组织，指控其利用人工智能在两周内发送了 250 万条诈骗短信，导致数十万受害者上当。该组织被描述为中国网络犯罪团伙。

Google安全/对齐行业动态

02:15

Anthropic：Newsroom（网页）

47

TCS与Anthropic合作，将Claude引入受监管行业

Anthropic宣布与塔塔咨询服务（TCS）合作。TCS将向56个国家的5万名员工提供Claude，并为金融、医疗等受监管行业客户构建基于Claude的产品，同时加入Claude Partner Network。作为“客户零号”，TCS将在自身工程、财务、法律、营销和销售团队中率先使用Claude，并组建专门团队为客户设计和运维Claude系统。具体用例包括：Diligenta用Claude改善2200万保单持有人的体验；银行产品团队用Claude Code提升软件工程效率；工程团队贡献可复用技能和插件；TCS iON提供Claude培训与认证。

Anthropic行业动态

02:12

ClaudeDevs@ClaudeDevs

61

Claude 托管智能体可以在您控制的沙盒中运行，在您自己的基础设施上或您选择的任何提供商上运行。今天我们新增了针对 @blaxelAI、@e2b、@googlecloud、@namespacelabs 和 @superserve_ai 的指南，以便您选择最适合您用例的方案。

智能体Anthropic产品更新

02:07

elvis@omarsar0

69

DAIR.AI创始人Elvis Saravia分享长期自主编码智能体运行经验

DAIR.AI创始人Elvis Saravia分享如何有效运行长期自主编码智能体。他指出当前多数模型难以协调工作，会过早暂停、犯错或走捷径（reward hacking）。关键在于明确目标、消除假设，避免模型自行推断。他的实践公式：用Opus 4.8进行细致规划，GPT-5.5执行所有步骤，评估器（通过/goal）则使用Deepseek及Qwen、Kimi、MiniMax等最新模型。另一关键洞察是提供多模态视觉线索作为目标，比纯文本目标更强，能更好地约束智能体。完整讨论已录制并免费开放。

智能体AnthropicDeepSeekOpenAI

02:04

Ars Technica：AI（RSS）

35

乌克兰测试用完全自主无人机击杀俄军士兵

完全自主的无人机仍属罕见，但乌克兰正为无人机和机器人加装AI模块，提升自主作战能力。此前一次测试中，乌军首次使用完全自主无人机击杀俄军士兵。

安全/对齐行业动态

01:59

PixVerse@PixVerse_

49

PixVerse 展示 AI 电影制作人 @Shanzyin_ai 使用 Canvas 工作流创作的维多利亚哥特风格短片《THE DREAM EATERS》。短片包含完整节点、多个镜头及项目文件，开放探索。剧情设定为古老庄园中青少年被迫吞噬权贵噩梦，一名有缺陷的新兵将黑暗拖回现实。PixVerse 推出限时活动：转发+关注+回复"DREAM"，72 小时内可获得 150 Credits 及该工作流。

PixVerse: An ancient estate. Teenagers forced to devour the nightmares of the powerful. One defective recruit who drags the darkne...

图像生成教程/实践视频

01:58

The Decoder：AI News（RSS）

60

OpenAI 为 Codex 编程智能体推出灵活速率限制重置，开启 AI 价格战

OpenAI 现在允许 Codex 用户存储速率限制重置次数并手动触发，而非按固定时间到期。用户在使用中达到上限时可立即使用已保存的重置而无需等待。Go、Plus、Pro 和 Business 订阅计划用户各获得一次免费重置。Plus 和 Pro 用户还可通过邀请好友解锁额外重置。

OpenAI产品更新编码

01:56

Epoch AI@EpochAIResearch

64

FrontierMath： Tiers 1-4 （v2）现已上线。我们完成了一项审计，修正了 42% 的问题中的错误。排名相似，但整体得分更高。目前的领先者是 GPT-5.5 （xhigh），在 Tiers 1-3 上达到 85%，以及 Google 的 AI co-mathematician，在 Tier 4 上达到 76%。

GoogleOpenAI推理评测/基准

01:55

The Verge：AI（RSS）

62

Siri现在变好了吗？

苹果发布了新版Siri AI，The Verge编辑David和Nilay在The Vergecast中分享了初期体验。过去十几年Siri在"部分功能勉强可用"和"彻底翻车"之间摇摆，而新版Siri AI在多数任务上表现足够出色，尽管没有带来突破性创新，但相比过往已发生质变。

评测/基准语音

01:53

TechCrunch：AI（RSS）

60

Mistral 被曝以 200 亿欧元估值融资 30 亿欧元

Mistral 正进行新一轮融资，传闻金额为 30 亿欧元，投后估值约 200 亿欧元（约 231.5 亿美元），较其 C 轮估值 117 亿欧元接近翻倍。

行业动态

01:50

Chubby♨️@kimmonismus

65

Google DeepMind发布60页论文：从AGI到超级智能的路线图

Google DeepMind发表60页论文，由Hutter、Legg、Genewein撰写，定义AGI（多数认知任务达平均人类水平）、ASI（超越大量专家协作）和不可计算的AIXI三个层级。实现路径包括规模扩展、算法突破、递归自我改进和多智能体协调，瓶颈在于能源与硬件。六种阻碍：高质量数据可能本十年内耗尽、资源需求过快、神经范式天花板、研究难度激增（维持摩尔定律需18倍于1970年代的研究者）、模型无法创造全新概念、人为放缓。作者认为这是对AGI后果的严肃反思呼吁。

DeepMind大佬观点

01:49

Ammaar Reshi@ammaar

53

我让Claude Fable 5逆向工程了一款1993年的DOS游戏，没有源代码。它读取了原始机器码，用C重写了引擎，并给了我一个完全可编辑的移植版，适用于每个平台。从EXE到iPhone，30分钟。分享这一切，让你也能复活自己的童年游戏！

Anthropic教程/实践编码

01:48

Hacker News 热门（buzzing.cc 中文翻译）

25

Maxproof 论文发布

6月12日，名为 Maxproof 的论文在 arXiv 上发布，并在 Hacker News 上获得 100 点热度。

论文/研究

01:48

Google Research：Blog（网页）

44

Google Research研究：AI如何帮助用户理解皮肤问题

Google Research 在《JAMA Dermatology》发表两项研究，探索 AI 帮助普通人理解自身皮肤问题。一项涉及 2345 名参与者的定量研究显示，AI 辅助显著提升了用户识别皮肤疾病名称的能力，并影响了其就医或自我护理的下一步决策。另一项混合方法研究对比了用户通过 AI 工具与医生对话获取的认知。这些工作基于此前开发的 AI 鉴别诊断模型和 SCIN 数据集，旨在通过高质量信息支持皮肤健康决策。

Google搜索论文/研究

01:35

Nathan Lambert@natolambert

46

策略梯度推导： https：//rlhfbook.com/c/06-policy-gradients#deriving-the-policy-gradient

Harsh Bhatt: derivation of Policy Gradient.

教程/实践数据/训练

01:34

Ars Technica：AI（RSS）

57

今年价值1300亿美元的数据中心项目因抗议被叫停

截至今年，抗议活动已成功阻止价值约1300亿美元的AI数据中心项目。反对者通过组织行动阻碍了多地的开发计划，称这一胜利让参与者“尝到了政治权力的滋味”。抗议主要针对数据中心带来的能源消耗、水资源占用和环境影响，部分项目已被政府暂停或重新审查。

现象/趋势行业动态部署/工程

01:32

Rohan Paul@rohanpaul_ai

63

SpaceX 的官方 SEC 文件显示，AI 几乎占其预期的 28.5 万亿美元总可寻址市场的全部。

Rohan Paul: There are IPOs that list companies, and then there are moments that list the future. @SpaceX goes public carrying a civi...

其他行业动态

01:28

The Decoder：AI News（RSS）

38

Anthropic Claude Fable 5：价格翻倍，性能仅提升5.7%

Claude Fable 5 在 Artificial Analysis Intelligence Index 中取得 64.9 分，在十项基准测试中有五项创下纪录。相比 Opus 4.8，性能提升仅 5.7%，但 token 价格翻倍。安全过滤与回退路由功能进一步推高了成本。

Anthropic评测/基准

01:28

The Verge：订阅版科技（RSS）

44

Siri 现在变好了吗？

The Vergecast 播客首次体验了 Siri AI，并讨论了社交网络的下一阶段，同时指出特朗普手机（Trump Phone）是个骗局。

评测/基准语音

01:16

Google Gemini@GeminiApp

30

Gemini 即将在 Discord 社区活动中介绍全新的 Neural Expressive 设计语言。产品营销经理 Megan C. 将讲解动态视觉响应、无缝模式切换等提升使用体验的亮点。活动于本周五 6 月 12 日上午 11：30 PT 举行，快来 Discord 加入吧！

Google Gemini: Get a closer look at Gemini's new Neural Expressive design language at our next Discord community event. Product Marketi...

Google行业动态

01:15

Google AI@GoogleAI

40

Google AI 本周发布多项更新

Google AI 本周推出多项更新：Gemini 3.5 Live Translate 是用于实时语音到语音翻译的最新音频模型；NotebookLM 获重大升级，加入智能体对话能力、更高级推理及新输出格式；来自 GoogleLabs 的 Project Genie 向 Google AI Ultra 5x 订阅者全球开放；GeminiApp 中的 Notebooks 在 EEA、英国、瑞士上线；同时发布实验性开源模型 DiffusionGemma，探索文本扩散技术，实现极快文本生成。

智能体Google产品更新开源生态

01:13

MiniMax (official)@MiniMax_AI

41

MiniMax M3 已在 @parasail_io 上线。这是首个具备前沿编码与智能体能力的开源权重模型，拥有 1M 上下文窗口和原生多模态理解。联系我们可以启动专属端点进行测试！🚀

Parasail: Minimax M3 is live on Parasail, day zero. It's the first open-weight model with frontier coding & agent capabilities, 1M...

开源生态行业动态

01:11

Kling AI@Kling_ai

18

谁是你的比赛日选择？

图像生成行业动态视频

01:04

Ars Technica：AI（RSS）

66

谷歌起诉中国网络犯罪团伙：利用 Gemini 自动化诈骗数十万人

谷歌对一中国网络犯罪网络提起诉讼。该团伙涉嫌利用 Gemini 创建并运营诈骗网站，目标达数十万人。

Google安全/对齐行业动态

01:04

Ars Technica：AI（RSS）

50

就总用水量而言，AI数据中心只是沧海一粟

AI数据中心的全球总用水量占比较小，但即使是中等规模的数据中心，也可能对当地水资源造成过大的局部影响。

数据/训练现象/趋势

01:02

Rohan Paul@rohanpaul_ai

66

Anthropic从租用云算力转向自建数据中心

Anthropic正从租用云算力转向自建数据中心，计划在美国部署超1GW容量，Google可能为其租赁付款提供财务担保。此前Anthropic已承诺超10GW云服务器租赁，包括与Google的2000亿美元协议，以及Akamai、AWS、CoreWeave、Fluidstack的大型合作（含500亿美元Fluidstack合作、AWS Trainium硬件）。此外，Anthropic以每月12.5亿美元租下xAI/Colossus I数据中心全部空间，并租用Colossus II。此举旨在通过自控服务器降低长期计算成本。

The Information: Anthropic is moving forward with a plan to control its own servers for developing AI, giving it the ability to cut its c...

AnthropicGoogle行业动态部署/工程

01:01

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选67

OpenAI 推出面向新时代工作的新 Academy 课程

OpenAI 发布三门 Academy 课程，帮助用户掌握实用 AI 技能、创建可重复工作流，并在日常工作中应用 AI 智能体。

智能体OpenAI教程/实践

推荐理由：这三门课不是那种泛泛的“AI 提高效率”鸡汤，而是直接教你怎么把 agent 做成可重复的工作流，产品经理和运营能立刻套用。

01:00

Bloomberg：Technology（RSS）

32

音乐行业当前面临的四大问题

音乐行业当前面临四大问题，涵盖AI、欺诈以及AI驱动的欺诈，业界对此表示担忧。

现象/趋势语音

00:50

Chubby♨️@kimmonismus

31

据 The Information 报道，OpenAI 正在准备一个新 AI 模型。主推文回应："天哪，不会吧！（/s）"

unusual_whales: OpenAI is preparing a new AI model, per The Information

OpenAI行业动态

123 4…50