AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
精选全部日报更多
最新一期2026-06-12
2026 年 6 月12
  • 12 日Gemini Omni Flash 视频任务达 SOTA
  • 11 日DiffusionGemma:文本生成速度提升4倍的开源扩散模型
  • 10 日Claude Fable 5 和 Claude Mythos 5
  • 9 日小米 MiMo-V2.5-Pro-UltraSpeed 突破 1,000 tokens/s,单台 8-GPGPU 节点运行 1T MoE 模型
  • 8 日Harness-1:基于强化学习训练的有状态搜索20B检索子智能体
  • 7 日GitHub 开源 Spec Kit 工具包,用产品规范引导 AI 编码
  • 6 日Riverflow 2.5:可控制评分标准的图像模型
  • 5 日Nemotron 3.5 Content Safety:面向全球企业AI的可定制多模态安全
  • 4 日Grok Imagine 1.5 预览版发布
  • 3 日微软首款高级推理AI模型MAI-Thinking-1发布
  • 2 日MiniMax M3:前沿编码、100万token上下文与原生多模态一体模型
  • 1 日OpenAI发布生物防御AI工具Rosalind
2026 年 5 月31
  • 31 日Nano Banana Pro与Nano Banana 2正式发布
  • 30 日OpenAI推出实时翻译模型,支持70+语言输入
  • 29 日Claude Opus 4.8 发布:在编码、智能体技能与推理方面实现全面升级
  • 28 日Runway 推出 Model Context Protocol 服务器
  • 27 日谷歌 AI 框架 AlphaProof Nexus 攻克 2 道悬置 56 年数学难题
  • 26 日面壁智能联合清华等开源中国首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN
  • 25 日Luma Agents 实现规模化真实 UGC 广告生成
  • 24 日StepAudio 2.5实时语音发布:副语言感知与人格化交互
  • 23 日首个基于华为昇腾910B NPU全栈训练的1.58比特开源大模型BitCPM-CANN发布
  • 22 日Aleph 2.0 与 Edit Studio
  • 21 日Qwen3.7:智能体前沿
  • 20 日I/O 2026: 欢迎来到自主的 Gemini 时代
  • 19 日阿里云推出HappyHorse视频生成模型
  • 18 日Grok Imagine图像生成功能正式发布
  • 17 日社区协作再创佳绩,vLLM支持万亿级模型
  • 16 日MiniMax M2.7模型上线OrcaRouter平台
  • 15 日SenseNova U1技术报告发布,基于MoE架构开放模型权重
  • 14 日Hy3预览版登陆GMI,开源最强模型领跑
  • 13 日Claude Opus 4.7快速模式开放研究预览
  • 12 日SenseNova U1图像生成模型登陆ComfyUI平台
  • 11 日OpenCode x Ring 2.6 1T限时免费开放
  • 10 日ERNIE 5.1发布,预训练成本仅需对标模型6%
  • 9 日Ring-2.6-1T发布:万亿参数思维模型专为复杂任务设计
  • 8 日通过 API 中的新模型推进语音智能
  • 7 日SenseNova-U1开源8步蒸馏LoRA,推理速度大幅提升
  • 6 日GPT-5.5 Instant:更智能、更清晰、更个性化
  • 5 日语音克隆技术上线 真假难辨
  • 4 日从单张图像构建实时视频智能体:Runway Characters技术解析
  • 3 日模型别名新增"-latest"指向最新版本
  • 2 日GPT-5.5发布一周创营收新高
  • 1 日AntLingAGI开源Ling-2.6-1T模型,登陆Hugging Face平台
2026 年 4 月9
  • 30 日旗舰指令模型快速高效执行的秘诀:可靠基础设施与优化
  • 29 日Mistral AI发布Mistral Medium 3.5模型及Vibe远程编程智能体
  • 28 日小米开源MiMo-V2.5双模型,支持百万上下文与商用
  • 27 日Mistral AI 发布 Workflows 公开预览版,为企业AI工作流提供编排支持
  • 26 日DeepSeek V4模型限时2.5折优惠
  • 25 日迈入百万上下文普惠时代:DeepSeek-V4 模型预览版正式上线并同步开源
  • 24 日OpenAI 最智能 AI 模型:GPT-5.5 登场,Token 成本降至 1/35、每兆瓦输出提升 50 倍
  • 23 日inclusionAI/LLaDA2.0-Uni
  • 22 日inclusionAI/DR-Venus-4B-RL 发布
全部日报 →
AI 日报每早八时
6月12日6月11日6月10日更早
AIHOT DAILY
2026年5月10日 · 周日

1模型发布/更新

ERNIE 5.1发布,预训练成本仅需对标模型6%

ERNIE 5.1 刚刚发布。 基于 ERNIE 5.0 的预训练基础,我们最新的基础模型升级了搜索、推理、知识问答、创意写作和智能体能力,而预训练成本仅需对标模型的约 6%。 更多内容详见主题帖 🧵

X:百度 Baidu (@Baidu_Inc)
HappyHorse上线阿里云,AI视频无需等待

基准测试排名第一。闪电速度。原生音视频同步。 排队等待AI视频的时代结束了。HappyHorse现已在阿里云Model Studio上线。当别人还在渲染时,你已完成。 立即构建:https://int.alibabacloud.com/m/1000412167/

X:阿里云 / Alibaba Cloud (@alibaba_cloud)
StepAudio 2.5 TTS 在语音竞技场盲测中跻身全球前三

StepFun 推出的 StepAudio 2.5 TTS 在 Artificial Analysis 语音竞技场盲测排行榜中位列全球第三,Elo 评分为 1187 分,仅次于 Inworld TTS 1.5 Max 与 Google Gemini 3.1 Flash TTS。该模型语音自然度较前代显著提升,并以 8 分优势超越 Eleven v3。其定价为每百万字符 85 美元,生成速度为每秒 37.6 字符,并提供了全局上下文提示和行内情感标签两种语音控制方式。

X:阶跃星辰 StepFun (@StepFun_ai)

2产品发布/更新

Google 开放 Fitbit Air 的全新 Health API

Google 随新款 Fitbit Air 发布了全新的 Health API 并向开发者开放。该 API 提供了涵盖运动、睡眠、心率、血氧等维度的 31 种健康数据点,支持 Webhooks 实时数据推送、精细的读写权限控制以及按时间范围查询和汇总数据。开发者可利用该 API 基于个人真实健康数据构建 AI Agent、MCP Server、CLI 或实时监控系统等应用,从而创建实用的个人健康自动化工作流。官方已发布包含首次调用教学的入门指南。

X:Berry Xia (@berryxia)
帕累托代码:免费实验性编码路由工具

推出帕累托代码:一款全新、免费、实验性的编码路由工具 在请求中设置 `min_coding_score`,即可路由至符合您标准且成本最低的编码模型,排名由 @ArtificialAnlys 提供。 实时查看帕累托前沿的变化👇

X:OpenRouter (@OpenRouter)
Peekaboo 3.0 正式发布 专注操作与界面检测

Peekaboo 3.0 现已上线。这是自 2.0 以来最重要的版本。 ⚡ 以操作为先的 macOS 电脑使用体验 👁️ 统一的截图 + 界面检测功能 🧩 CLI + MCP 间更简洁的 JSON 交互 🛠️ 更好的快照功能 我去年就开始了这项工作,但当时的模型还不够好。现在它们已经准备好了。https://peekaboo.sh

X:Peter Steinberger (@steipete)
Qwen系列多尺寸模型登陆SiliconFlow平台

思小建大🔥 @Alibaba_Qwen 3.5 和 Qwen3.6 系列现已在 SiliconFlow 上线 🎉 9B 到 397B · MoE 与 Dense · 原生多模态 ✅ Qwen3.6-35B-A3B · Qwen3.6-27B ✅ Qwen3.5-397B-A17B · Qwen3.5-122B-A10B ✅ Qwen3.5-35B-A3B · Qwen3.5-27B · Qwen3.5-9B 更小的模型。更大的成果。社区的最爱。 现在,选择你的尺寸并开始构建 👇 https://cloud.siliconflow.com/

X:硅基流动 SiliconFlow (@SiliconFlowAI)
v2.1.137

本次发布的 v2.1.137 版本主要包含一项错误修复。该版本解决了 Visual Studio Code 扩展在 Windows 操作系统上无法激活的问题。此次更新专注于提升特定平台下的扩展兼容性与稳定性。

Claude Code:GitHub Releases(RSS)
v2.1.138

本次更新版本号提升至v2.1.138。核心变更是进行了一系列内部修复,旨在优化系统底层性能或解决已知问题。更新日志未提及新增功能或面向用户的具体特性改动,主要集中于后台代码的调整与完善。

Claude Code:GitHub Releases(RSS)

3行业动态

Claude Mythos评估显示16小时风险时距

嗯。 [引用 @METR_Evals]:我们于2026年3月的有限窗口内评估了Claude Mythos Preview的早期版本进行风险评估。在我们的任务套件上,我们估计其50%时间范围至少为16小时(95%置信区间8.5小时至55小时),这处于我们无需新任务即可测量的上限。

X:Ethan Mollick (@emollick)
DeepSeek融资70亿美元创纪录,创始人个人出资30亿

DeepSeek正以500亿美元估值进行高达70亿美元的融资,创下中国AI领域最大单轮融资纪录。创始人梁文锋个人出资30亿美元,占本轮融资的40%,同时仍保留公司90%的所有权。该公司最初诞生于其本人成功的对冲基金内部。本轮融资将主要用于获取大规模计算资源,以加速发布V4.1等新模型,并投资企业级产品,目标是推动公司实现营收转正,其发展路径与OpenAI和Anthropic类似。

X:Rohan Paul (@rohanpaul_ai)
工信部启动人工智能科技伦理审查与服务先导计划,加快推动审查工作落地实施

工业和信息化部近日启动人工智能科技伦理审查与服务先导计划,旨在依托国家人工智能产业创新应用先导区,探索审查服务的落地路径与协同治理机制。该计划部署了四项重点任务:细化省级伦理审查制度、指导创新主体建设伦理委员会、开展审查实践与标准研制、构建部省市三级联动治理网络。同时,将设立全国伦理风险监测服务网络,编制培训教材并开设“伦理课堂”,以提供智力支持,推动人工智能负责任创新和产业高质量发展。

IT之家(RSS)
Hermes Agent登顶OpenRouter全球令牌排名

祝贺@NousResearch! [引用 @NousResearch]:Hermes Agent 现已在全球 @OpenRouter 令牌排名中位列第一。 虽然我们的旅程才刚刚开始,但我们想借此机会感谢我们的贡献者、支持者和用户,感谢他们为我们走到今天所做的一切。

X:OpenRouter (@OpenRouter)
Hy3预览版免费期结束 三项指标居首

@OpenRouter 的免费期已结束。 这两周期间,Hy3预览版达成: 总令牌使用量排名第一 代码生成排名第一 工具调用排名第一 在所有供应商中占据15.4%市场份额 Hy3预览版仍可在OpenRouter以有竞争力的价格使用。继续创造——并请持续反馈。 https://openrouter.ai/tencent/hy3-preview

X:腾讯混元 (@TencentHunyuan)

4论文研究

菲尔兹奖得主称 ChatGPT 5.5 Pro 在无人帮助下两小时内完成“博士级”数学研究

菲尔兹奖得主蒂莫西·高尔斯让 ChatGPT 5.5 Pro 尝试解决数论中的开放性问题。该模型在不到一小时内,将一个问题中的指数界限改进为多项式界限。一位参与的 MIT 研究员认为其核心想法“完全具有原创性”。高尔斯总结指出,未来数学贡献的门槛将变为证明某些是大语言模型无法完成的工作。

The Decoder:AI News(RSS)
教克劳德“为什么”

Anthropic公司发布了Claude模型的新研究“Teaching Claude Why”。该研究通过让模型学习解释自身推理过程中的“为什么”,显著提升了其推理能力和输出结果的准确性。实验表明,经过此项训练后,模型在多项基准测试中的表现得到改善,其推理步骤的透明度和逻辑连贯性增强。这项技术旨在推动AI向更可解释、更可靠的方向发展。

Hacker News 热门(buzzing.cc 中文翻译)
OncoAgent:一个用于隐私保护肿瘤临床决策支持的双层多智能体框架

研究团队发布了开源肿瘤临床决策支持系统OncoAgent。该系统采用双层多智能体框架,结合LangGraph拓扑与四阶段Corrective RAG流程,检索超过70份权威临床指南。系统根据查询复杂度,将任务路由至9B参数的速度优化模型或27B参数的深度推理模型,两者均通过QLoRA在AMD MI300X硬件上使用包含26万余病例的数据集进行微调。系统强制执行严格的零受保护健康信息政策,并通过三层反射安全验证器确保安全,支持完全本地部署以保护患者数据主权。

Hugging Face:Blog(RSS)

5技巧与观点

Redis创始人用C语言引擎将大模型“装进”个人电脑

Redis创始人Antirez开源了专为DeepSeek V4 Flash设计的原生推理引擎ds4。该引擎仅用几千行C代码,通过三项关键技术:对MoE专家进行不对称2-bit量化、将KV Cache移至高速SSD突破内存限制、为Apple Silicon进行纯Metal原生优化,成功在128GB MacBook Pro上流畅运行具备1M上下文窗口的模型,实测达27 tok/s。此举将原本依赖云端GPU集群的前沿AI能力,通过极致工程优化 democratize 至个人设备,展现了开源社区推动技术平民化的强大潜力。

X:阿易 AI Notes (@AYi_AInotes)
AI放大能动性差异,用户两极分化加剧

主观能动性向来具有自我增强的特性,而AI正在放大这种效应。 低能动性的AI使用者进一步丧失能动性,高能动性的AI使用者则进一步增强能动性。

X:Francois Chollet (@fchollet)
YC CEO开源个人AI操作系统GBrain,构建知识复利“第二大脑”

Y Combinator CEO Garry Tan开源其个人AI操作系统GBrain,旨在将AI打造成具备复利效应的“第二大脑”。该系统通过“Book Mirror”、“Meeting Prep”等模块化技能,在五个月内深度处理了20多本书、自动预习会议,并管理着超10万页持续增长的结构化知识。其架构清晰,分为轻量路由层、可组合技能层与丰富数据层,并能按任务智能调用不同AI模型。Garry Tan强调,未来属于能构建此类复利系统的建造者,而非仅使用通用聊天工具的用户。

X:Berry Xia (@berryxia)
GPT Image 2 Prompt:中文科技新闻爆款封面生成器

这是一个用于生成中文科技新闻爆款封面图的详细提示词框架。它要求AI扮演顶级视觉设计师,根据输入的文章内容自动提取核心新闻、关键数字、产品及行业情绪等信息。设计需融合中国科技媒体头图、B站爆款缩略图等风格,强调强烈的视觉冲击与高信息密度,确保3秒内传递重点。构图包含顶部新闻区、中央超大标题区、主视觉产品区、数据卡片区和底部总结区,配色、字体、背景均需根据文章行业、品牌和情绪动态调整,最终输出专业的16:9横版媒体级封面图。

X:宝玉 (@dotey)
GPT-Realtime-2语音控制CRM集成方案

以下介绍如何集成GPT-Realtime-2为CRM工作流添加语音控制功能。

X:OpenAI Developers (@OpenAIDevs)
用Codex并行调试验证修复

每当调查bug时,我让codex在临时crabbox中重建精确状态,验证bug,修复它,再验证修复。 没有混乱状态因为本地系统可能被污染,也没有速度下降因为我并行运行10个会话。http://crabbox.sh

X:Peter Steinberger (@steipete)
手机扫描与AI Agent技术颠覆房地产与专业领域
25今日事件
11一手报道
3新模型
20信源
← 前一日历史后一日 →
VOL.2026.05.10·25 STORIES·AI HOT DAILY

AIHOT日报

二〇二六年五月十日 星期日DAILY · 每早八时
01

模型发布/更新

Model Releases
3 篇

ERNIE 5.1发布,预训练成本仅需对标模型6%

官方·XX:百度 Baidu (@Baidu_Inc)

ERNIE 5.1 刚刚发布。 基于 ERNIE 5.0 的预训练基础,我们最新的基础模型升级了搜索、推理、知识问答、创意写作和智能体能力,而预训练成本仅需对标模型的约 6%。 更多内容详见主题帖 🧵

HappyHorse上线阿里云,AI视频无需等待

官方·XX:阿里云 / Alibaba Cloud (@alibaba_cloud)

基准测试排名第一。闪电速度。原生音视频同步。 排队等待AI视频的时代结束了。HappyHorse现已在阿里云Model Studio上线。当别人还在渲染时,你已完成。 立即构建:https://int.alibabacloud.com/m/1000412167/

StepAudio 2.5 TTS 在语音竞技场盲测中跻身全球前三

官方·XX:阶跃星辰 StepFun (@StepFun_ai)

StepFun 推出的 StepAudio 2.5 TTS 在 Artificial Analysis 语音竞技场盲测排行榜中位列全球第三,Elo 评分为 1187 分,仅次于 Inworld TTS 1.5 Max 与 Google Gemini 3.1 Flash TTS。该模型语音自然度较前代显著提升,并以 8 分优势超越 Eleven v3。其定价为每百万字符 85 美元,生成速度为每秒 37.6 字符,并提供了全局上下文提示和行内情感标签两种语音控制方式。

02

产品发布/更新

Product
6 篇

一项名为“3D高斯泼溅”的技术,允许用户仅用手机扫描整栋房屋,即可生成可在浏览器中直接浏览的沉浸式3D模型。其成本极低、文件小巧,为房产等行业带来新机会。同时,AI在垂直专业领域正通过Agent范式取得突破。例如Tianfu Agent在专业命理大赛中接近人类顶尖水平,其通过构建专用工具集而非依赖通用模型硬记规则的方法,为法律、中医等规则密集型领域的AI化提供了可迁移的新路径。

X:阿易 AI Notes (@AYi_AInotes)
Codex Chrome插件安装与使用经验分享

用户成功使用Codex Chrome插件完成购物任务,验证了其可用性。安装过程存在关键注意事项:必须将Codex更新至最新版本,并切换为官方订阅登录模式,第三方API模式不支持安装。插件对网络节点有要求,例如香港地区不支持。安装后,必须在Codex对话中通过“@ Chrome”指令来调用插件功能。此外,将Chrome设置为默认浏览器有助于安装流程顺利进行,遇到连接问题时重启电脑可能有效。

X:Vista (@vista8)
Google 开放 Fitbit Air 的全新 Health API
X·KOLX:Berry Xia (@berryxia)

Google 随新款 Fitbit Air 发布了全新的 Health API 并向开发者开放。该 API 提供了涵盖运动、睡眠、心率、血氧等维度的 31 种健康数据点,支持 Webhooks 实时数据推送、精细的读写权限控制以及按时间范围查询和汇总数据。开发者可利用该 API 基于个人真实健康数据构建 AI Agent、MCP Server、CLI 或实时监控系统等应用,从而创建实用的个人健康自动化工作流。官方已发布包含首次调用教学的入门指南。

帕累托代码:免费实验性编码路由工具

官方·XX:OpenRouter (@OpenRouter)

推出帕累托代码:一款全新、免费、实验性的编码路由工具 在请求中设置 `min_coding_score`,即可路由至符合您标准且成本最低的编码模型,排名由 @ArtificialAnlys 提供。 实时查看帕累托前沿的变化👇

Peekaboo 3.0 正式发布 专注操作与界面检测

X·KOLX:Peter Steinberger (@steipete)

Peekaboo 3.0 现已上线。这是自 2.0 以来最重要的版本。 ⚡ 以操作为先的 macOS 电脑使用体验 👁️ 统一的截图 + 界面检测功能 🧩 CLI + MCP 间更简洁的 JSON 交互 🛠️ 更好的快照功能 我去年就开始了这项工作,但当时的模型还不够好。现在它们已经准备好了。https://peekaboo.sh

Qwen系列多尺寸模型登陆SiliconFlow平台

官方·XX:硅基流动 SiliconFlow (@SiliconFlowAI)

思小建大🔥 @Alibaba_Qwen 3.5 和 Qwen3.6 系列现已在 SiliconFlow 上线 🎉 9B 到 397B · MoE 与 Dense · 原生多模态 ✅ Qwen3.6-35B-A3B · Qwen3.6-27B ✅ Qwen3.5-397B-A17B · Qwen3.5-122B-A10B ✅ Qwen3.5-35B-A3B · Qwen3.5-27B · Qwen3.5-9B 更小的模型。更大的成果。社区的最爱。 现在,选择你的尺寸并开始构建 👇 https://cloud.siliconflow.com/

v2.1.137

官方Claude Code:GitHub Releases(RSS)

本次发布的 v2.1.137 版本主要包含一项错误修复。该版本解决了 Visual Studio Code 扩展在 Windows 操作系统上无法激活的问题。此次更新专注于提升特定平台下的扩展兼容性与稳定性。

v2.1.138

官方Claude Code:GitHub Releases(RSS)

本次更新版本号提升至v2.1.138。核心变更是进行了一系列内部修复,旨在优化系统底层性能或解决已知问题。更新日志未提及新增功能或面向用户的具体特性改动,主要集中于后台代码的调整与完善。

03

行业动态

Industry
5 篇

Claude Mythos评估显示16小时风险时距

X·KOLX:Ethan Mollick (@emollick)

嗯。 [引用 @METR_Evals]:我们于2026年3月的有限窗口内评估了Claude Mythos Preview的早期版本进行风险评估。在我们的任务套件上,我们估计其50%时间范围至少为16小时(95%置信区间8.5小时至55小时),这处于我们无需新任务即可测量的上限。

DeepSeek融资70亿美元创纪录,创始人个人出资30亿

X·KOLX:Rohan Paul (@rohanpaul_ai)

DeepSeek正以500亿美元估值进行高达70亿美元的融资,创下中国AI领域最大单轮融资纪录。创始人梁文锋个人出资30亿美元,占本轮融资的40%,同时仍保留公司90%的所有权。该公司最初诞生于其本人成功的对冲基金内部。本轮融资将主要用于获取大规模计算资源,以加速发布V4.1等新模型,并投资企业级产品,目标是推动公司实现营收转正,其发展路径与OpenAI和Anthropic类似。

工信部启动人工智能科技伦理审查与服务先导计划,加快推动审查工作落地实施

综合资讯IT之家(RSS)

工业和信息化部近日启动人工智能科技伦理审查与服务先导计划,旨在依托国家人工智能产业创新应用先导区,探索审查服务的落地路径与协同治理机制。该计划部署了四项重点任务:细化省级伦理审查制度、指导创新主体建设伦理委员会、开展审查实践与标准研制、构建部省市三级联动治理网络。同时,将设立全国伦理风险监测服务网络,编制培训教材并开设“伦理课堂”,以提供智力支持,推动人工智能负责任创新和产业高质量发展。

Hermes Agent登顶OpenRouter全球令牌排名

官方·XX:OpenRouter (@OpenRouter)

祝贺@NousResearch! [引用 @NousResearch]:Hermes Agent 现已在全球 @OpenRouter 令牌排名中位列第一。 虽然我们的旅程才刚刚开始,但我们想借此机会感谢我们的贡献者、支持者和用户,感谢他们为我们走到今天所做的一切。

Hy3预览版免费期结束 三项指标居首

官方·XX:腾讯混元 (@TencentHunyuan)

@OpenRouter 的免费期已结束。 这两周期间,Hy3预览版达成: 总令牌使用量排名第一 代码生成排名第一 工具调用排名第一 在所有供应商中占据15.4%市场份额 Hy3预览版仍可在OpenRouter以有竞争力的价格使用。继续创造——并请持续反馈。 https://openrouter.ai/tencent/hy3-preview

04

论文研究

Research
3 篇

菲尔兹奖得主称 ChatGPT 5.5 Pro 在无人帮助下两小时内完成“博士级”数学研究

综合资讯The Decoder:AI News(RSS)

菲尔兹奖得主蒂莫西·高尔斯让 ChatGPT 5.5 Pro 尝试解决数论中的开放性问题。该模型在不到一小时内,将一个问题中的指数界限改进为多项式界限。一位参与的 MIT 研究员认为其核心想法“完全具有原创性”。高尔斯总结指出,未来数学贡献的门槛将变为证明某些是大语言模型无法完成的工作。

教克劳德“为什么”

综合资讯Hacker News 热门(buzzing.cc 中文翻译)

Anthropic公司发布了Claude模型的新研究“Teaching Claude Why”。该研究通过让模型学习解释自身推理过程中的“为什么”,显著提升了其推理能力和输出结果的准确性。实验表明,经过此项训练后,模型在多项基准测试中的表现得到改善,其推理步骤的透明度和逻辑连贯性增强。这项技术旨在推动AI向更可解释、更可靠的方向发展。

OncoAgent:一个用于隐私保护肿瘤临床决策支持的双层多智能体框架

官方Hugging Face:Blog(RSS)

研究团队发布了开源肿瘤临床决策支持系统OncoAgent。该系统采用双层多智能体框架,结合LangGraph拓扑与四阶段Corrective RAG流程,检索超过70份权威临床指南。系统根据查询复杂度,将任务路由至9B参数的速度优化模型或27B参数的深度推理模型,两者均通过QLoRA在AMD MI300X硬件上使用包含26万余病例的数据集进行微调。系统强制执行严格的零受保护健康信息政策,并通过三层反射安全验证器确保安全,支持完全本地部署以保护患者数据主权。

05

技巧与观点

Tips & Takes
8 篇

Redis创始人用C语言引擎将大模型“装进”个人电脑

X·KOLX:阿易 AI Notes (@AYi_AInotes)

Redis创始人Antirez开源了专为DeepSeek V4 Flash设计的原生推理引擎ds4。该引擎仅用几千行C代码,通过三项关键技术:对MoE专家进行不对称2-bit量化、将KV Cache移至高速SSD突破内存限制、为Apple Silicon进行纯Metal原生优化,成功在128GB MacBook Pro上流畅运行具备1M上下文窗口的模型,实测达27 tok/s。此举将原本依赖云端GPU集群的前沿AI能力,通过极致工程优化 democratize 至个人设备,展现了开源社区推动技术平民化的强大潜力。

AI放大能动性差异,用户两极分化加剧

X·KOLX:Francois Chollet (@fchollet)

主观能动性向来具有自我增强的特性,而AI正在放大这种效应。 低能动性的AI使用者进一步丧失能动性,高能动性的AI使用者则进一步增强能动性。

YC CEO开源个人AI操作系统GBrain,构建知识复利“第二大脑”

X·KOLX:Berry Xia (@berryxia)

Y Combinator CEO Garry Tan开源其个人AI操作系统GBrain,旨在将AI打造成具备复利效应的“第二大脑”。该系统通过“Book Mirror”、“Meeting Prep”等模块化技能,在五个月内深度处理了20多本书、自动预习会议,并管理着超10万页持续增长的结构化知识。其架构清晰,分为轻量路由层、可组合技能层与丰富数据层,并能按任务智能调用不同AI模型。Garry Tan强调,未来属于能构建此类复利系统的建造者,而非仅使用通用聊天工具的用户。

GPT Image 2 Prompt:中文科技新闻爆款封面生成器

X·KOLX:宝玉 (@dotey)

这是一个用于生成中文科技新闻爆款封面图的详细提示词框架。它要求AI扮演顶级视觉设计师,根据输入的文章内容自动提取核心新闻、关键数字、产品及行业情绪等信息。设计需融合中国科技媒体头图、B站爆款缩略图等风格,强调强烈的视觉冲击与高信息密度,确保3秒内传递重点。构图包含顶部新闻区、中央超大标题区、主视觉产品区、数据卡片区和底部总结区,配色、字体、背景均需根据文章行业、品牌和情绪动态调整,最终输出专业的16:9横版媒体级封面图。

GPT-Realtime-2语音控制CRM集成方案

官方·XX:OpenAI Developers (@OpenAIDevs)

以下介绍如何集成GPT-Realtime-2为CRM工作流添加语音控制功能。

用Codex并行调试验证修复

X·KOLX:Peter Steinberger (@steipete)

每当调查bug时,我让codex在临时crabbox中重建精确状态,验证bug,修复它,再验证修复。 没有混乱状态因为本地系统可能被污染,也没有速度下降因为我并行运行10个会话。http://crabbox.sh

手机扫描与AI Agent技术颠覆房地产与专业领域

X·KOLX:阿易 AI Notes (@AYi_AInotes)

一项名为“3D高斯泼溅”的技术,允许用户仅用手机扫描整栋房屋,即可生成可在浏览器中直接浏览的沉浸式3D模型。其成本极低、文件小巧,为房产等行业带来新机会。同时,AI在垂直专业领域正通过Agent范式取得突破。例如Tianfu Agent在专业命理大赛中接近人类顶尖水平,其通过构建专用工具集而非依赖通用模型硬记规则的方法,为法律、中医等规则密集型领域的AI化提供了可迁移的新路径。

Codex Chrome插件安装与使用经验分享

X·KOLX:Vista (@vista8)

用户成功使用Codex Chrome插件完成购物任务,验证了其可用性。安装过程存在关键注意事项:必须将Codex更新至最新版本,并切换为官方订阅登录模式,第三方API模式不支持安装。插件对网络节点有要求,例如香港地区不支持。安装后,必须在Codex对话中通过“@ Chrome”指令来调用插件功能。此外,将Chrome设置为默认浏览器有助于安装流程顺利进行,遇到连接问题时重启电脑可能有效。

25
今日事件
11
一手报道
3
新模型
20
信源
← 前一日查看历史后一日 →
AI HOT · 编辑系统自动生成