AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
精选全部日报更多
全部动态一手 · 2413 条
全部一手资讯X论文
5月13日周三
5月12日周二
5月11日周一
5月10日周日
5月9日周六
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月13日
05:53
Claude Code:GitHub Releases(RSS)
精选70
v2.1.140 版本更新

本次更新包含多项错误修复与体验优化。核心改进包括:增强了Agent工具的`subagent_type`匹配逻辑,现对大小写和分隔符不敏感;修复了`/goal`命令在特定钩子设置下无响应的问题,现会显示明确提示;解决了Windows系统上因缺失可执行文件导致的周期性事件循环停滞。此外,还修正了后台服务启动、远程设置认证重试、托管市场更新策略持久化、`/loop`命令调度冗余以及`Read`工具参数验证等多个问题。插件系统现会对因配置冲突而被静默忽略的默认组件文件夹发出警告。

AnthropicGitHub产品更新部署/工程
关联讨论 7 条X:Claude (@claudeai)X:Claude Devs (@ClaudeDevs)X:Berry Xia (@berryxia)X:Thariq (@trq212)X:洪明 (@hongming731)X:小互 (@xiaohu)X:宝玉 (@dotey)
推荐理由:Claude Code 这次修了一批烦人小 bug,尤其是 /goal 不再装死、/loop 不再空转,用着难受的开发者可以立刻更新试试。
03:08
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选64
Parameter Golf 揭示了关于 AI 辅助研究的哪些经验

Parameter Golf 项目汇聚了超过 1000 名参与者和 2000 多份提交作品,在严格限制条件下探索了 AI 辅助的机器学习研究、编码智能体、模型量化及新颖模型设计。活动展示了 AI 工具如何帮助研究人员在受限参数规模下优化模型性能,推动了高效模型架构与自动化代码生成技术的实践进展。核心发现包括智能体协作能显著提升研究效率,而量化技术可在微小精度损失下大幅压缩模型体积。

智能体OpenAI现象/趋势

推荐理由:OpenAI让1000多人一起玩AI辅助研究,这篇复盘给出了几个很实在的教训,尤其关于代码Agent和量化,搞研究的人值得花五分钟读一下。
02:54
Claude:Blog(网页)
精选58
Anthropic 网络安全团队如何利用 Claude Code 构建威胁检测平台

Anthropic 检测平台工程团队技术负责人 Jackie Bow 运用 Claude Code 开发了 CLUE 威胁检测与响应平台。该平台通过自然语言界面连接内部系统,包含 CLUE Triage 自动初筛警报,整合上下文信息分配处置建议;以及 CLUE Investigate 支持分析师用自然语言查询日志,由 Claude 自动生成并执行查询,将数小时的人工分析缩短至几分钟。团队在一天内完成概念验证,一周内交付实现,显著提升了安全运营效率。

智能体Anthropic安全/对齐教程/实践

推荐理由:我一直好奇大模型公司自己怎么用 AI 做安全,这篇挖出了 Anthropic 内部 CLUE 平台的构建细节——从一天出原型到每周省下 234 人天,数据比很多 PR 稿扎实。
01:54
Claude:Blog(网页)
精选73
Claude进军法律行业

Anthropic公司为法律行业发布20多个新的MCP连接器及12个专用插件,将Claude深度集成至合同管理、文档处理等法律核心软件栈。Claude现可直接在Microsoft Word、Outlook等办公应用中无缝工作,具备起草、修订、条款比对等可复用技能,并能自动化处理日常法律事务。公司同时宣布与多个司法公益组织合作,以扩大法律服务的可及性。

智能体AnthropicMCP/工具产品更新

推荐理由:Claude 这次在法律行业的布局很大,20+ 连接器和 12 个插件意味着它不是做表面集成,而是把律师的整套工具链都拉了进来——对律所是效率革命,对做垂直 AI 产品的团队则是教科书级的行业解决方案示范。
01:53
GitHub Blog
精选61
GitHub Copilot 个人计划:在 Pro 和 Pro+ 中引入弹性配额,以及新的 Max 计划

GitHub 宣布从6月1日起更新 Copilot 个人计划阵容,基于用户反馈进行调整。主要变化包括在现有 Pro 和 Pro+ 计划中引入弹性配额机制,允许用户更灵活地分配使用量;同时新增 Max 计划,扩展高级选项。此次更新旨在提升计划的可定制性,为开发者提供更个性化的编程辅助服务,优化整体使用体验。

GitHub产品更新编码

推荐理由:GitHub Copilot 个人版引入弹性配额和更贵的 Max 计划,对你这样每天靠它写代码的人,要么多花钱要么被限流,算清楚自己的用量比看功能列表更重要。
01:05
Google Developers Blog(RSS)
精选73
使用ADK构建可暂停、恢复且永不丢失上下文的长时运行AI智能体

本文探讨了如何从无状态聊天机器人升级为生产级AI智能体,以管理长达数天或数周的企业工作流程(如HR入职)。通过引入Agent Development Kit(ADK),其架构核心采用持久状态机和持久化会话存储,确保智能体在“空闲时间”或服务器重启时永不丢失上下文。系统利用事件驱动的Webhook和多智能体委托机制,实现在暂停期间“休眠”,并在唤醒后以高推理准确性恢复复杂任务,从而构建出具备韧性和可靠性的长时运行智能体系统。

智能体Google教程/实践部署/工程
关联讨论 1 条X:洪明 (@hongming731)
推荐理由:Google 官方手把手教你把无状态 chatbot 升级成能跨天跨周的持久化 agent,状态机和持久会话是两个关键切入点,做过生产环境 agent 的都懂这东西有多刚需。
00:26
Nathan Lambert:Interconnects(RSS)
精选64
开放模型生态的复合增长

中国AI生态呈现高参与度与开放优先特征,开源模型社区形成自我强化循环。开发者基于主流架构二次创新,国产开源模型下载量季度环比激增超200%。开放协作降低了技术门槛,推动应用层涌现大量行业解决方案,模型微调工具使用量同比大幅增长。生态参与者通过贡献代码、数据及优化方案,持续反哺核心模型迭代,构建了技术红利共享的复合增长网络。

大佬观点开源生态现象/趋势

推荐理由:Nathan Lambert这篇对中国开放模型生态的剖析,点出了‘参与人数×开源速度’的飞轮,做开源的人该认真看看。
00:24
Claude:Blog(网页)
精选58
Code w/ Claude SF 2026开发者大会:基于AI指数级增长的构建

在Code w/ Claude SF 2026开发者大会上,Anthropic宣布提升开发者工具能力。Claude Code的速率限制翻倍,Claude Opus的API限制提高,以支持大规模可靠开发。同时,Claude平台上的托管智能体新增四项功能:“梦想”功能通过回顾会话优化记忆;多智能体编排支持主智能体并行委派子任务;“成果”功能通过定义输出标准提升任务成功率,内部测试显示最难问题成功率最多提升10%;Webhooks提供任务完成通知。大会主题演讲和分组会议录像已上线,并计划在伦敦和东京举办后续活动。

智能体AnthropicMCP/工具产品更新

推荐理由:虽然已是旧闻,但Dreaming和Outcomes这两个功能让agent能自我改进,是构建生产级AI团队的真信号,做Claude开发的值得补课。
5月12日
23:53
GitHub Blog
精选58
Dungeons & Desktops: 使用 GitHub Copilot CLI 构建一款程序化生成的 Roguelike 游戏

一位 GitHub 员工利用 GitHub Copilot CLI 开发了一款扩展程序,能够将任何代码库转换成一个独特的 Roguelike 风格地下城。该工具通过 AI 辅助的代码生成,实现了程序化关卡创建,展示了 Copilot CLI 在创意编码和游戏原型开发中的实际应用潜力。项目核心是自动解析代码结构并生成对应的可探索地下城布局。

GitHub教程/实践编码

推荐理由:用 GitHub Copilot CLI 把代码库变成 roguelike 地牢,玩法挺有脑洞,做 Copilot 扩展的开发者可以看一眼思路。
22:40
Google DeepMind:Blog(RSS)
精选57
Co-Scientist:一个加速研究的多智能体AI伙伴

Co-Scientist 是一款由 Gemini 构建的协作式 AI 助手,旨在帮助科研人员加速科学突破。它通过多智能体(multi-agent)的架构设计,作为研究人员的智能伙伴参与工作流程,以提升研究效率并推动创新发现。

智能体DeepMindGoogle产品更新

推荐理由:Google DeepMind 推出的科研助手,用多智能体框架帮科学家加速实验设计,如果做生物/材料领域研究,值得跟踪一下,但对其他领域暂时可能还是个概念。
19:49
公众号:智谱(GLM)
精选63
GLM-5.1获AA全新Coding Agent基准开源第一

全球权威评测机构Artificial Analysis发布全新Coding Agent Index,包含SWE-Bench-Pro-Hard-AA、Terminal-Bench v2和SWE-Atlas-QnA三项基准,用于衡量模型与Agent harness组合的真实编程能力。闭源模型Opus 4.7(在Cursor CLI中运行)全球第一,智谱GLM-5.1(在Claude Code中运行)获开源第一,代表国产大模型在实际编程Agent场景达到SOTA水平。

开源生态编码评测/基准
关联讨论 1 条公众号:智谱(GLM)
推荐理由:GLM-5.1 在 AA 的新 Coding Agent 基准上拿了开源第一,时隔一个月回头看,这个成绩对国产开源模型在编程 Agent 赛道的位置是个重要注脚,做工具链选型的还是值得扫一眼。
18:00
公众号:小红书技术(dots.llm)
34
QCon 北京 2026 | 把自动化测试当 AI Coding 来做:小红书 GUI Agent 实战回顾

小红书在 QCon 北京 2026 分享了 GUI Agent 实战经验,核心思路是将自动化测试当作 AI Coding 来做,通过工程化方式让 GUI Agent 在真实业务场景中“跑起来、跑得稳、跑得省钱”。

智能体教程/实践部署/工程
14:22
公众号:火山引擎
21
乐橙×火山引擎:给安防注入AI能力,让监控从"被动记录"进化为"主动思考"
多模态端侧行业动态
12:45
公众号:昆仑万维(天工)
21
央视重磅聚焦:AI音乐Mureka与天工超级智能体彰显国产AI硬实力

央视聚焦昆仑万维的AI音乐产品Mureka及天工超级智能体,展示国产AI在音乐创作与智能体领域的硬实力。

行业动态
07:52
Apple Machine Learning Research(RSS)
51
BalCapRL: 基于强化学习的MLLM图像描述平衡框架

研究团队针对多模态大语言模型图像描述任务提出BalCapRL平衡框架。该框架通过设计多维度奖励函数,系统解决了现有强化学习方法在追求描述效用时引发的幻觉、噪声和冗长等问题。实验表明,BalCapRL在保持描述准确性的同时,显著提升了信息密度与可读性,在多个基准测试中实现了更均衡的性能表现,有效突破了传统方法在核心维度间的权衡局限。

多模态论文/研究
07:43
Hugging Face:Blog(RSS)
精选58
在AWS上进行基础模型训练与推理的核心构建模块

本文面向使用开源框架的机器学习工程师,阐述了AWS如何为大规模基础模型的全生命周期提供核心基础设施。其核心是三大紧密集成的组件:配备多代NVIDIA GPU(如H100、H200及新一代Blackwell B200/B300)的大显存加速计算实例;用于集体通信的高带宽、低延迟网络(节点内NVLink与节点间EFA);以及可扩展的分布式存储。这些基础设施与Slurm/Kubernetes等资源编排系统、PyTorch/JAX等ML框架协同,共同支撑预训练、后训练和推理工作负载,并可通过Prometheus/Grafana实现全栈可观测性。

开源生态教程/实践数据/训练部署/工程

推荐理由:这篇把AWS上训大模型的全套基础设施串了一遍,从GPU选型到网络存储再到Slurm/K8s编排,是做云端大规模训练的工程师的必读参考。
06:13
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选66
ChatGPT 在 2026 年初如何扩大应用范围

2026年第一季度,ChatGPT的用户采用率大幅上升,其中35岁以上用户群体的增长最为迅速,同时用户性别比例也趋于均衡。这表明以ChatGPT为代表的人工智能技术正加速融入主流社会,其应用范围已突破早期以年轻技术爱好者为主的局限,向更广泛、更多元化的普通用户群体拓展。

OpenAI现象/趋势

推荐理由:这是我今年看过最值得留意的用户数据,ChatGPT正跳出早期极客圈,35岁以上用户成为增长主力,所有面向大众的AI产品都得重新思考用户画像。
05:53
Claude:Blog(网页)
74
Claude Code 推出智能体视图功能

Claude Code 近日推出“智能体视图”功能,为用户提供了一个集中管理所有会话的统一界面。该功能解决了并行运行多个智能体时需要切换终端标签、管理复杂网格的痛点,允许用户一键启动新智能体并将其发送至后台运行。在视图中,用户可以直观查看每个智能体的状态(等待输入、运行中或已完成)、最后响应内容及交互时间,并支持内联回复或进入完整会话。用户可通过 `/bg` 命令或将现有会话加入后台,也可直接使用 `claude --bg [task]` 启动后台任务。此功能已作为研究预览版向 Pro、Max、Team、Enterprise 及 Claude API 用户开放。

智能体Anthropic产品更新编码
关联讨论 7 条X:Claude (@claudeai)X:Claude Devs (@ClaudeDevs)X:Berry Xia (@berryxia)X:Thariq (@trq212)X:洪明 (@hongming731)X:小互 (@xiaohu)X:宝玉 (@dotey)
03:18
Tomer Tunguz 博客(VC 分析)
精选67
本地模型处理半数日常任务,响应速度优于云端

一项为期五周的实验发现,在总计约1400项日常工作任务中,约50%可由本地35B参数模型(如Qwen 3.6 35B)成功处理,涵盖邮件、日程、总结和行政事务等类别。性能对比显示,本地模型在常规代理任务上的平均响应时间为2.8秒,比云端Claude Opus 4.5快2.1倍,尽管后者在复杂推理上仍领先约20%。本地模型输出更简洁,云端模型则在结构和代码规范性上更优。随着本地模型性能提升,将计算负载转向本地以应对云端成本已成为必然趋势。

大佬观点推理端侧

推荐理由:Tunguz用数据告诉你,本地35B模型延迟只有Opus的一半且能完成半数任务,对极致追求响应速度的产品思路冲击很大,本地优先可能会从边缘变成主流。
02:52
Claude Code:GitHub Releases(RSS)
精选72
Claude Code v2.1.139 版本更新

本次更新引入了多项新功能与优化。核心新增包括:集中管理会话的Agent视图(研究预览)、可设置目标并持续工作的`/goal`命令、实时调整滚轮速度的`/scroll-speed`命令,以及查看插件详情的`claude plugin details`命令。交互界面导航与控制能力得到增强。底层优化涵盖MCP服务器可获取`CLAUDE_PROJECT_DIR`环境变量、`/context all`的令牌估算会考虑模型分词器并显示舍入值。此外,修复了超过20项问题,如凭证死锁、内存无限制增长、权限规则、UI显示错误及路径处理等缺陷。

智能体AnthropicMCP/工具产品更新
关联讨论 7 条X:Claude (@claudeai)X:Claude Devs (@ClaudeDevs)X:Berry Xia (@berryxia)X:Thariq (@trq212)X:洪明 (@hongming731)X:小互 (@xiaohu)X:宝玉 (@dotey)
推荐理由:Claude Code 这波更新给了两个真正改变工作流的杀手功能,agent view 让你一眼看清所有会话,/goal 命令能让 Claude 自己跑完一个任务直到满足条件,做开发的同学可以立刻试试。
01:22
Claude:Blog(网页)
精选70
Anthropic在AWS上正式推出Claude平台

Anthropic公司正式在AWS上推出Claude平台,为AWS客户提供了通过其现有身份验证、账单及承诺消费抵扣使用完整Claude功能的新途径。该平台首次将全套Claude API功能引入AWS生态,新功能与原生API同日上线。平台包含Claude托管智能体、代码执行、文件API等多项核心功能,并支持最新模型。与Amazon Bedrock上的服务不同,此平台由Anthropic直接运营,数据在AWS边界外处理,适合需要完整平台体验的企业客户。服务将在多数AWS商业区域提供。

Anthropic产品更新部署/工程
关联讨论 5 条Hacker News 热门(buzzing.cc 中文翻译)X:Claude (@claudeai)X:Claude Devs (@ClaudeDevs)X:Berry Xia (@berryxia)X:OpenRouter (@OpenRouter)
推荐理由:Anthropic 第一次把完整 Claude 平台功能全量搬到 AWS 上,用 AWS 账号就能直接拿原生 API 最新特性,对于 AWS 生态里的开发者是个省心的一站式选择,不用再纠结该走 Bedrock 还是原生。
5月11日
22:54
Runway:News(网页)
精选68
告别编写YAML:使用confingy配置机器学习系统

Runway开源了Python库confingy,旨在解决机器学习系统配置的长期痛点。该库允许开发者用纯Python代码(支持懒加载、类型检查和序列化)替代传统YAML配置文件,从而摆脱YAML作为图灵完备领域特定语言所带来的维护困境。confingy无需重构现有代码,即可满足跟踪构造函数参数、避免实例化昂贵对象(如大语言模型)等核心需求,有效改善了因复杂YAML配置导致的无法跳转定义、类型提示失效和重构困难等开发体验问题。

开源/仓库部署/工程

推荐理由:Runway把自家ML训练的YAML坑填平了,开源了confingy。如果你还在用YAML管实验参数,这可能是今年最该装的pip包。
21:11
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选78
OpenAI 推出 DeployCo 以协助企业围绕智能构建业务

OpenAI 正式推出全新企业部署公司 DeployCo,旨在帮助各类组织将前沿人工智能技术投入实际生产,并转化为可衡量的商业影响。该举措标志着 OpenAI 进一步深入企业服务领域,专注于解决 AI 模型从测试到规模化部署的落地挑战,助力企业通过定制化部署方案提升运营效率与业务成果。

OpenAI行业动态部署/工程
关联讨论 7 条X:邵猛 (@shao__meng)X:洪明 (@hongming731)X:Greg Brockman (@gdb)X:Rohan Paul (@rohanpaul_ai)X:OpenAI (@OpenAI)X:小北 (@frxiaobei)X:Kim (@kimmonismus)
推荐理由:OpenAI 把部署单独拆成一家公司,说明企业落地不再是副业,而是和模型研发并列的支柱,做 toB 生意的同行可以重新想想自己的定位了。
17:58
公众号:小红书技术(dots.llm)
45
打造AI时代项目管理新范式 - 小红书PMO团队的Agentic探索之路

小红书PMO团队探索AI智能体(Agentic)在项目管理中的落地路径,目标是从让AI理解项目管理,进化为为每个项目组打造一个专属BP(业务伙伴)。

智能体教程/实践
16:38
公众号:火山引擎
34
Agent Plan发布:业界首个"Agent套餐包"来了

火山引擎发布Agent Plan,定位为业界首个面向AI智能体领域的“套餐包”产品。

智能体产品更新
13:56
OpenAI:官网动态(RSS · 排除企业/客户案例)
51
OpenAI Campus Network: 学生社团兴趣登记表

OpenAI正式推出校园网络计划,面向全球学生社团开放申请。该计划旨在连接世界各地的学生团体,为其提供AI工具支持、活动举办资源,并共同构建一个由AI驱动的校园社区。参与的学生社团将能直接接入OpenAI的生态系统,利用先进技术开展项目与活动,从而在校园内培育和发展人工智能的应用与实践。

OpenAI产品更新
11:04
公众号:腾讯混元
20
WorkBuddy 联合 Hy3 preview 推出专属折扣活动

WorkBuddy 联合 Hy3 preview 面向 WorkBuddy 用户推出限时专属优惠活动。

行业动态
10:00
公众号:昆仑万维(天工)
26
当企业开始用Mureka替换Suno--一场正在发生的AI音乐迁移,以及它背后的理由

Mureka正被企业用以替换Suno,一场AI音乐领域的迁移正在发生。背后涉及功能、成本或合规等方面的理由。

多模态现象/趋势语音
09:40
公众号:MiniMax(稀宇科技)
25
MiniMax 10x Team:邀你一起,推动你的领域 10x 加速

MiniMax 10x Team面向各领域人才发出邀请,期望与加入者共同推动其所在领域实现10倍速的突破性加速。

行业动态
08:00
Thinking Machines Lab:官方博客(RSS)
精选59
Thinking Machines Lab发布Interaction Models研究预览

Thinking Machines Lab发布interaction models研究预览。该模型从零训练,原生处理音频、视频和文本,采用多流微回合设计实现实时响应,无需外部脚手架。研究预览展示了全新的交互能力,并在智能性与响应性上取得综合SOTA表现。

智能体多模态模型发布视频

推荐理由:Thinking Machines 把实时交互训进了模型本身,不再是外挂脚手架,微轮次架构和 benchmark 数据很硬,做语音/视频助手的可以认真看看,虽然还是研究预览,但方向值得盯着。
04:34
Gary Marcus:The Road to AI We Can Trust(RSS)
52
对AI进步的恐慌放错了地方

METR最新发布的“时间范围”图表引发了关于AI进展的讨论。该图表旨在评估AI系统在未来两年内执行复杂任务的能力,但其预测基于当前趋势的线性外推,并未考虑技术突破的突发性或潜在瓶颈。图表显示,到2026年,前沿AI模型有10-20%的概率在软件开发等任务上达到人类水平,但这并非确定的预言。专家指出,公众对AI的担忧应更多聚焦于现有模型的实际风险与滥用,而非过度推测未来遥远的“超人”能力。

大佬观点现象/趋势
03:43
Hugging Face:Blog(RSS)
精选74
MachinaCheck:基于AMD MI300X构建多智能体CNC可制造性分析系统

MachinaCheck是一款基于多智能体AI的系统,旨在革新小型CNC机加工车间的报价分析流程。传统上,车间经理需花费30-60分钟手动分析图纸,而该系统在上传STEP文件及材料、公差等简单输入后,能在30秒内生成完整的可制造性报告,明确指出零件能否制造、所需工具及生产前需采取的行动。其核心在AMD MI300X加速卡上本地运行Qwen 2.5 7B模型,利用192GB HBM3显存确保客户设计数据无需离开本地,满足了制造业对数据隐私的严格要求。系统采用五组件流水线,结合精确的几何特征提取与LLM的制造知识推理,最终输出结构化报告。

智能体Hugging Face开源/仓库端侧

推荐理由:虽然是hackathon项目,但用多Agent做CNC可行性分析,把推理全压在本地AMD显卡上保护图纸隐私,还给了可跑的代码和Space,制造业AI落地就该这么直接。
5月10日
12:45
Hermes Desktop:GitHub Releases(RSS)
32
Hermes桌面版 2026.510.1

Hermes桌面版发布2026.510.1更新,修复桌面打包问题,确保WebUI优先使用捆绑的hermes-agent运行时,并抑制误导性Git更新提示。此次更新捆绑hermes-agent 0.13.0与hermes-webui 0.51.34,新增macOS arm64 DMG和ZIP安装包,提升安装一致性。

GitHub产品更新部署/工程
11:42
Hermes Desktop:GitHub Releases(RSS)
36
Hermes Desktop 2026.510.0发布

Hermes桌面端2026.510.0版本正式发布。本次更新捆绑了hermes-agent 0.13.0组件(对应上游标签v2026.5.7)以及hermes-webui 0.51.34(对应上游标签v0.51.34)。同时,新版本提供了针对macOS arm64架构的DMG和ZIP安装包构建。

智能体产品更新
02:42
Hugging Face:Blog(RSS)
精选68
OncoAgent:一个用于隐私保护肿瘤临床决策支持的双层多智能体框架

研究团队发布了开源肿瘤临床决策支持系统OncoAgent。该系统采用双层多智能体框架,结合LangGraph拓扑与四阶段Corrective RAG流程,检索超过70份权威临床指南。系统根据查询复杂度,将任务路由至9B参数的速度优化模型或27B参数的深度推理模型,两者均通过QLoRA在AMD MI300X硬件上使用包含26万余病例的数据集进行微调。系统强制执行严格的零受保护健康信息政策,并通过三层反射安全验证器确保安全,支持完全本地部署以保护患者数据主权。

智能体Hugging Face检索增强开源生态

推荐理由:这个开源肿瘤AI系统把多智能体、RAG和隐私合规全塞进一台AMD服务器,临床落地又近了一步,不是那种只发论文不交代码的项目。
5月9日
14:51
公众号:阶跃星辰(Step)
45
阶跃语音模型位列 Artificial Analysis 评测榜中国第一、全球前三
评测/基准语音
14:48
Claude Code:GitHub Releases(RSS)
27
v2.1.138

本次更新版本号提升至v2.1.138。核心变更是进行了一系列内部修复,旨在优化系统底层性能或解决已知问题。更新日志未提及新增功能或面向用户的具体特性改动,主要集中于后台代码的调整与完善。

Anthropic产品更新编码
09:30
公众号:MiniMax(稀宇科技)
48
大模型不认识马嘉祺?MiniMax做了一次全链路排查

开发团队发现大模型无法识别“马嘉祺”,随即对知识缺失原因进行了全链路排查。

教程/实践
09:00
公众号:蚂蚁百灵(Ling)
56
Ring-2.6-1T 正式发布

Ring-2.6-1T 是一款万亿级旗舰思考模型,引入可调节的 Reasoning Effort 机制,支持 high 与 xhigh 两种推理强度。high 模式面向高频 Agent 工作流,xhigh 面向数学、科研等复杂任务。评测中,high 模式 PinchBench 得分 87.60,Tau2-Bench Telecom 95.32;xhigh 模式 ARC-AGI-V2 得分 77.78,AIME 26 得分 95.83,GPQA Diamond 88.27。模型已上线 OpenRouter,近期将开源。

智能体推理模型发布
08:47
Claude Code:GitHub Releases(RSS)
35
v2.1.137

本次发布的 v2.1.137 版本主要包含一项错误修复。该版本解决了 Visual Studio Code 扩展在 Windows 操作系统上无法激活的问题。此次更新专注于提升特定平台下的扩展兼容性与稳定性。

Anthropic产品更新部署/工程
‹ 上一页
1…1516171819…50
下一页 ›