AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
精选全部日报更多
全部动态今日 95 条
全部一手资讯X论文
今天6月13日 周六
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月13日
06:16
Orange AI@oran_ge
66
Cola:用技能弥合AI Agent使用鸿沟

AI带来的并非平权,而是K型分化。头部用户已默认理解Agent的组成:文档、规则、memory、loop、MCP、CLI、工具调用、权限、安全沙箱、上下文工程、定时任务、心跳、文件系统、代码执行和Skill;普通用户只知道"Agent能写代码"。做好Skill是跨越鸿沟的唯一解法。作者正与藏师傅一起通过Cola帮助大众真正跨越鸿沟。

歸藏(guizang.ai): http://x.com/i/article/2065096982310567936

智能体现象/趋势
06:14
Replit ⠕@Replit
18
Replit 正在接管纽约,我们迫不及待在 #Vibecon 与你相见。为期两天的艺术、代码与文化潮流引领者盛宴。详情请见 http://vibecon.ai @BrandNewSchool
行业动态
06:04
Rohan Paul@rohanpaul_ai
53
《从AGI到ASI》--Google DeepMind论文

Google DeepMind新论文提出从通用人工智能到超级智能的四条路径:持续扩展(计算、模型规模、数据、测试时推理)、算法范式革新(超越Transformer架构)、递归自我改进(AI加速自身研发)、多智能体集体智能(众多专业AI智能体协作出超人类智能)。扩展可能遇到数据、算力、能源瓶颈;递归改进最不确定;多智能体路径最易被低估,通过专业化与协调能超越单个强模型。ASI可能不是单次跃迁,而是AI辅助创造更好AI的加速链。

智能体推理论文/研究
05:49
Hacker News 热门(buzzing.cc 中文翻译)
49
Tailwind 和 Slop 应用

Hacker News 上一则标题为“Tailwind and slop apps”的帖子于 06-12 发布,获得 100 点热度,引发社区对 Tailwind 与 Slop 应用的讨论。

现象/趋势编码
05:48
Google AI Developers@googleaidevs
59
通过 Gemini Live API 中的 Gemini 3.5 Live Translate,为你的应用添加近实时语音翻译。🎙️ 观看模型如何处理实时直播流和翻译,包括连续语音到语音流(S2ST)和同步转录文本,让用户能以母语收听全球广播节目。
Google产品更新语音
05:46
Orange AI@oran_ge
19
AI高速对话加剧ADHD,如何拯救前额叶?

观察到身边朋友同事的ADHD(注意力缺陷多动障碍)越来越严重:容易被琐事分散注意力,对大问题视而不见,关掉通知、沉浸大事变得不可能,进入心流也变难。AI的高速执行加重了这一问题——每两三分钟一次的对话,形成注意力集中与涣散的交替循环。推文最终发问:该如何拯救自己的前额叶?

其他现象/趋势
05:43
MiniMax (official)@MiniMax_AI
精选82
MiniMax M3 发布,具备前沿编码与智能体能力,原生图像视频输入和计算机使用,1M-token 上下文。核心采用 MSA 稀疏注意力:每个 query 评分 128-token KV 块,仅对 top 块做注意力。vLLM 当日即支持 M3,包括专用 MSA prefill/decode 核、前缀缓存与分块 prefill、BF16 和 MXFP8 检查点、Hopper 与 Blackwell 的 MoE 后端,并在 NVIDIA 与 AMD 硬件上验证。同时支持原生多模态输入、工具调用、推理解析和思考模式控制等智能体工作负载。

vLLM: 🎉 Congrats to @MiniMax_AI on releasing MiniMax M3! Frontier coding and agentic capabilities, native image and video inp...

多模态开源生态推理模型发布
关联讨论 1 条X:MiniMax (@MiniMax_AI)
推荐理由:M3把1M上下文从‘理论上能做’变成了‘今天就能部署’,MSA稀疏注意力是关键,开源社区和推理框架的深度合作值得关注。
05:40
OpenRouter:Announcements(RSS)
精选59
如何在OpenRouter上获得最低成本的LLM推理

在OpenRouter上追加`:floor`可获取最便宜提供商,通过`max_price`设定花费上限,并可免费使用20多个零成本模型。同时需注意避免计费陷阱。

推理教程/实践部署/工程

推荐理由:我觉得这篇教程对 OpenRouter 重度用户有用,floor 参数和 max_price 是控制成本的实用技巧,但信息量不大,当作使用手册就行。
05:28
MarkTechPost(RSS)
58
Google 发布 Gemini-SQL2:Gemini 3.1 Pro Text-to-SQL 在 BIRD 单模型排行榜上取得 80.04% 执行准确率

Google Research 于 2026 年 6 月 12 日发布 Gemini-SQL2,基于 Gemini 3.1 Pro 驱动的文本转 SQL(Text-to-SQL)能力,在 BIRD 单模型排行榜上达到 80.04% 的执行准确率。

Google推理模型发布编码
05:13
MiniMax (official)@MiniMax_AI
73
MiniMax 开源 M3 模型,约 428B 总参数、23B 激活参数,支持前沿编码、长周期智能体任务及原生多模态(文本、图像、视频),上下文窗口达 1M token。开放权重,可在 Baseten 部署。在少于 500B 参数的模型中,能同时兼顾编码、智能体工作负载和 1M 上下文的模型极少,M3 全部实现。

Baseten: Congrats to the MiniMax team on the open-source launch of M3! There are very few <500bn parameter models that can tackle...

多模态模型发布编码
05:13
MiniMax (official)@MiniMax_AI
47
MiniMax M3 现已登陆 FactoryAI Droid。

Factory: MiniMax M3 has arrived in Droid.

产品更新
05:13
🚨 AI News | TestingCatalog@testingcatalog
49
Claude Convey Agent 将作为 Labs 项目发布,类似于 Claude Design。 > Conway 是一个由 Claude 管理的 Agent,将在远程容器中运行。 > 用户将为 Conway 安装不同的自定义 UI 标签和插件。 而且它可能比你想象的更大 👀
智能体Anthropic产品更新
05:10
Peter Steinberger 🦞@steipete
52
Peter Steinberger 指出 GPT 在 token 消耗和成本上比 Fable 高效 10-20 倍,且能达到相似结果。@thorstenball 的对比测试印证:让 Fable 和 deep^2 完成相同的 CLI、Web 服务器等多端功能,deep^2 花费 $20(首次未通过但可修复),Fable 运行 1 小时 40 分、花费 $350(首次成功)。后续追问后 Fable 总花费达 $457,deep^2 预计最多 $40,差距约 17 倍。

Thorsten Ball: Day 3 with Fable. Gave a huge prompt to implement a feature across CLI, web server, and another server to both Fable and...

智能体OpenAI大佬观点编码
05:03
Ethan Mollick@emollick
63
10个月后,Ethan Mollick 再次向 Claude Code 和 Fable 下达同一指令--根据幸存截图和文档重建失传的 Maxis 模拟游戏 SimRefinery。新版本完全可玩,包含学习模式等多种复杂功能,与10个月前 ChatGPT Codex 仅凭一篇文章和截图快速搭建的可玩原型形成鲜明对比。当时他未写一行代码,仅偶尔提小修改请求。

Ethan Mollick: I gave ChatGPT Codex an article & screenshot from a famous, lost Maxis simulation, SimRefinery, and asked it to create i...

Anthropic现象/趋势编码
04:55
Suno@suno
33
Lay Bankz 如何将几个键盘音符转变为一段迷幻摇滚采样。
教程/实践
04:54
TechCrunch:AI(RSS)
59
谷歌起诉中国网络犯罪团伙 Outsider Enterprise:利用 AI 诈骗数十万受害者

谷歌起诉名为“Outsider Enterprise”的中国网络犯罪团伙,指控其利用人工智能技术实施诈骗,受害者达数十万人。该团伙在两周内发送了约 250 万条诈骗短信。

Google行业动态
04:52
Chubby♨️@kimmonismus
49
Apple用NVIDIA机密计算在谷歌云保护推理隐私

Kim解释Apple如何在Google Cloud上执行推理时保护隐私:最重的请求运行在Google Cloud的Blackwell B200s上,利用NVIDIA Confidential Computing提供基于硬件的安全层,将工作负载隔离在可信执行环境中加密处理数据,确保Google和Apple都无法看到数据。

大佬观点推理部署/工程
04:49
Hacker News 热门(buzzing.cc 中文翻译)
69
如何在macOS上设置本地编码代理

来自ikyle.me的教程,指导在macOS上搭建本地编码代理,获Hacker News社区104个点赞。

教程/实践端侧编码
04:48
Microsoft Research@MSFTResearch
15
Project Ire 分析了一个及时的恶意软件样本,并通过逆向工程确定其意图--识别出 LOTUSLITE 特征,即使大多数主流 EDR 工具未检测到它。https://msft.it/6011viy4N
Microsoft其他
04:43
OpenCode@opencode
50
Kimi 2.7 Code 现已在 Go 中可用 文本 · 图像 · 针对编码优化 定价与 2.6 相似
产品更新编码
04:38
elvis@omarsar0
62
GoogleResearch推出Gemini-SQL2,基于Gemini 3.1 Pro,在BIRD benchmark上达到Text-to-SQL的SOTA结果,能将自然语言翻译为可直接执行的SQL查询。DAIR.AI的Elvis Saravia指出,现实世界数据复杂混乱,尽管强推理模型表现不错,但定制模型(如Gemini-SQL2)在此类任务上更胜一筹。他认为在知识库、搜索、图数据库等领域也存在类似机会,BIRD是一个非常具有挑战性的基准。

Google Research: 🚀 Introducing Gemini-SQL2, our breakthrough text-to-SQL capability powered by Gemini 3.1 Pro! We've achieved state-of-t...

Google数据/训练模型发布
04:21
Chubby♨️@kimmonismus
24
观察图表,我认为 Fable 5 只会保持领先直到 GPT-5.6。 其次,我认为该基准测试很快就会完全饱和。

Epoch AI: Claude Fable 5 scores very well on FrontierMath: Tiers 1-4 (v2), reaching 87% on Tiers 1-3 and 88% on Tier 4. This conti...

AnthropicOpenAI推理评测/基准
04:19
Hacker News 热门(buzzing.cc 中文翻译)
51
"你直接上传到ChatGPT不就行了?"

Hacker News 上一则帖子的标题为“你直接上传到ChatGPT不就行了?”,获得了101个HN点。该帖子引用了用户常被询问的一句话,暗示直接向ChatGPT上传文件以完成任务的普遍做法。

OpenAI现象/趋势
04:16
fofr@fofrAI
40
我正在尝试一种智能体流程,将Hyperframes与Gemini视频分析相结合,制作有趣的注释视频。
智能体Google教程/实践
04:14
Replit ⠕@Replit
26
连市长都知道气氛在哪里 👀 http://vibecon.ai
行业动态
04:13
MiniMax (official)@MiniMax_AI
33
SambaNovaAI 祝贺 MiniMax 发布 M3 开源模型,并表示未来将在其 RDUs 上支持 M3。MiniMax 表示感谢并期待这一合作。

SambaNova: Congrats to our partners at @MiniMax_AI on the launch of MiniMax M3. Open-weight models continue to push the ecosystem f...

开源生态行业动态
04:13
🚨 AI News | TestingCatalog@testingcatalog
48
月之暗面最新智能体编码模型 Kimi-K2.7-Code 已在 AI/ML API 平台上线,支持扩展推理和工具使用,可通过 Playground 和 API 测试。为验证其自我修正能力(而非一次性生成),研究者让四个 Kimi 智能体运行一个 2D 飞行物理模拟,目标是从发射到入轨并让助推器着陆。四次飞行中:第一次在最大动压处解体;第二次过关但分离过早失败;第三次成功入轨但未抓住着陆船;第四次修正着陆计算后成功着陆。该过程展示了模型通过迭代闭环调试从失败中自动学习。

AI/ML API: Kimi K2.7-Code is now available on AI/ML API! Moonshot's latest is built for long-horizon agentic coding that self-corre...

智能体模型发布编码
03:49
Hacker News 热门(buzzing.cc 中文翻译)
56
特斯拉全自动驾驶功能在丹麦官方认证视频中使用了自行车道

特斯拉全自动驾驶功能(Full Self Driving)在丹麦官方认证视频中被发现使用了自行车道。该视频由丹麦媒体politiken.dk报道,时长01:49,在Hacker News上获得100个点赞。

安全/对齐行业动态
03:49
Hacker News 热门(buzzing.cc 中文翻译)
58
我不是反向半人马

一篇来自 Miguel Grinberg 的博客文章,标题为《我不是反向半人马》,在 Hacker News 上获得 100 点热度。文章内容可能涉及人与 AI 关系的讨论,但原文仅包含标题与来源,无进一步技术细节。

大佬观点编码
03:48
jason@jxnlco
15
哦靠?!?!codex 在玩 rimworld
其他现象/趋势
03:44
OpenAI Developers@OpenAIDevs
42
Codex 让 @intelligenceco 的 @ndrewpignanelli 能够并行更新网站的多个部分,将一周的工作量缩短为三天。
OpenAI编码行业动态
03:43
MiniMax (official)@MiniMax_AI
56
来自@NVIDIAAI的认可意义重大 免费GPU加速的M3端点现已上线 快来试试👇

NVIDIA AI: Congrats to the @MiniMax_AI team on the release of MiniMax M3, a long-context multimodal model for text, image, and vide...

多模态模型发布视频
03:43
Greg Brockman@gdb
71
OpenAI 在开发者文档网站上线了新的文档智能体,可帮助查找产品相关信息并直接跳转到对应文档。Greg Brockman 表示这是一种强大且酷的网站导航方式,让交互更加直观。

OpenAI Developers: Ask our developer docs. They'll show you the way The new docs agent on 🔗http://developers.openai.com helps you find ans...

智能体OpenAI产品更新搜索
03:40
Emad@EMostaque
40
看起来 @SpaceX 将花费其市值的 2.5% 以 15 倍营收收购 @cursor_ai 👀
编码行业动态
03:33
Ethan Mollick@emollick
57
Claude Fable 5 在 FrontierMath 基准测试(Tiers 1-4, v2)中表现优异,Tiers 1-3 得分 87%,Tier 4 得分 88%,延续了 Anthropic 模型数学能力快速提升的趋势。主推文评论道:"图形的形状越来越熟悉了。"

Epoch AI: Claude Fable 5 scores very well on FrontierMath: Tiers 1-4 (v2), reaching 87% on Tiers 1-3 and 88% on Tier 4. This conti...

Anthropic推理评测/基准
03:29
PixVerse@PixVerse_
20
如果世界拒绝给你月光,那就自己点亮月亮。 《不请自来的海》- PixVerse Originals S1,基于 Canvas 构建。 由 PixVerse CPP JaneDoeCreates 创作的治愈系音乐动画。 转发+关注+回复 = 150 积分 及 完整电影+工作流私信(仅 72 小时)
其他视频
03:26
Epoch AI@EpochAIResearch
41
Claude Fable 5 在 FrontierMath(Tiers 1-4,v2)上得分很高,在 Tiers 1-3 上达到 87%,在 Tier 4 上达到 88%。这延续了 Anthropic 模型在数学上快速提升的趋势。
Anthropic推理评测/基准
03:16
fofr@fofrAI
46
@andrew_n_carr 宣布"编辑视频运动!放弃提示开始导演",并展示其"通用视频编辑器"工作流:先用 comic 4 捕捉视频,再用运动编辑器修改动作,最后用视频到视频模型(如 Runway、Gemini)重新渲染。他以时装片段为例,希望模特展现高抬腿活力,无需重拍。主推文 fofr 表示,AI视频中精细的3D运动控制已更近一步。

Andrew Carr 🤸: EDIT MOTION IN VIDEOS!!! Quit prompting and start directing I've been shouting for YEARS about 3D as the control layer. ...

多模态教程/实践视频
03:14
Replit ⠕@Replit
59
新视频发布了!你在 Replit 上不再一次只能构建一件事。 运行并行 AI 智能体,从一个项目中同时交付网站、移动应用、视频和推介材料。 而且你现在可以向已有的项目中添加多个工件。
智能体产品更新
03:14
OpenAI Developers@OpenAIDevs
50
咨询我们的开发者文档。它们会为你指路。 新的文档智能体在 http://developers.openai.com 上,帮你找到关于 OpenAI 产品的答案,并直接带你到相关文档。
智能体OpenAI产品更新
‹ 上一页
123…50
下一页 ›