AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
精选全部日报更多
全部动态资讯 · 9010 条
全部一手资讯X论文
6月11日周四
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月11日
22:59
HuggingFace Daily Papers(社区热门论文)
59
Reroute:面向视觉语言模型的可恢复视觉Token路由方法

视觉语言模型(VLM)将图像投影为大量视觉token,导致推理时注意力计算与KV缓存开销高昂。现有方法遵循“排序‑移除”范式,但token重要性随解码器深度变化,早期丢弃的token可能在后续层变得关键。Reroute是一种无需训练的可插拔模块,将永久移除替换为可恢复路由:被延迟的token绕过当前解码阶段,在下一路由决策时重新进入候选池。在LLaVA‑1.5与Qwen骨干上对FastV、PDrop和Nüwa变体的实验表明,Reroute在激进token压缩下提升了grounding能力,同时保持通用VQA性能。

多模态推理论文/研究
22:52
TechCrunch:AI(RSS)
67
DoorDash 新 AI 聊天机器人 Ask DoorDash 支持通过提示词和照片下单

DoorDash 推出名为 Ask DoorDash 的 AI 聊天机器人,用户可以用自己的话搜索应用,或通过提示词和照片直接下单,无需逐页浏览餐厅和商店来构建购物车。

产品更新多模态搜索
22:32
IT之家(RSS)
65
Anthropic 调整 Claude Fable 5 面向研究员的"降智"措施

Anthropic 发布 Claude Fable 5 后,因在用户不知情下限制竞争对手使用该模型开发 AI 模型而遭社区反对。Anthropic 致歉并调整措施:将安全防护改为对用户可见。此前,用户询问网络安全、生物学或化学问题会被转给较弱模型;面向前沿 AI 研究人员原本会在不知情时被降低性能。新措施下,若怀疑用户试图用 Claude 构建高能力 AI,将明确提醒系统会拒绝请求或转到较弱模型。服务条款仍禁止使用 Claude 训练竞争性 AI 模型。

Anthropic安全/对齐行业动态
22:31
Runway:News(网页)
精选72
Runway与Lionsgate扩大战略合作

全球内容巨头Lionsgate与生成式AI研究公司Runway今日宣布扩大战略合作。Lionsgate已取得Runway股权,双方将启动联合开发项目,共同创作并制作新IP,首推一部基于Lionsgate现有IP和Runway生成模型的短剧系列。此外,Lionsgate将作为主持伙伴参与6月举行的Runway AI电影节。这是双方继2024年9月首次合作后的深化,Lionsgate此前已在预可视化、故事板及最终帧制作中应用Runway工具。

行业动态视频
关联讨论 1 条X:Runway (@runwayml)
推荐理由:好莱坞第一次有片厂拿股权绑定 AI 公司,不是工具采购而是共创 IP,影视行业的 AI 态度正在从「用一下」变成「绑一起」,值得关注。
22:17
Hacker News 热门(buzzing.cc 中文翻译)
60
为什么人工智能没有取代软件工程师,而且将来也不会

Hacker News 上一则观点认为,人工智能并未取代软件工程师,并且将来也不会。该帖子获得了 103 个 HN Points。

现象/趋势编码
21:59
HuggingFace Daily Papers(社区热门论文)
59
SKIM:面向大语言模型的自适应多分辨率程序性技能压缩框架

可复用的自然语言技能被频繁调用时,将完整文本放入每个上下文会显著增加预填充成本和延迟。SKIM(SKIll coMpression)是一种自适应多分辨率软token压缩框架,专为程序性技能设计。它根据每项技能的复杂度生成不同数量的软token,在提升LLM推理效率的同时保留技能使用效果。实验表明,SKIM将技能压缩至原始token长度的30%到60%,且在任务性能上优于现有压缩方法。代码已开源。

推理论文/研究部署/工程
21:45
Gary Marcus:The Road to AI We Can Trust(RSS)
精选58
OpenAI 正酝酿"大幅"降价,Gary Marcus 视其为示弱信号

OpenAI 正考虑大幅降价,Gary Marcus 认为这暴露了公司的疲软竞争力。

OpenAI大佬观点
关联讨论 3 条X:Rohan Paul (@rohanpaul_ai)Bloomberg:Technology(RSS)Hacker News 热门(buzzing.cc 中文翻译)
推荐理由:Gary Marcus 独家爆料 OpenAI 考虑大幅降价,仅一句话定调“这是疲软迹象”。没有细节但切中最大悬念,降价是对竞争压力的妥协还是战略主动,值得点开保持怀疑地看。
21:31
IT之家(RSS)
48
DeepSeek API 缓存计费系统出故障后主动向用户退款,赠金已到账

2026年5月13日至6月9日期间,DeepSeek开放平台缓存计费系统出现数据错误,部分API用户计费受影响。DeepSeek团队将相应金额以赠金形式自动返还至受影响账户,并明确优先从赠金账户扣款。此前DeepSeek于4月24日发布DeepSeek-V4-Pro和V4-Flash两个版本,均支持1M超长上下文,后续推行了降价策略。

DeepSeek行业动态
21:31
IT之家(RSS)
23
尚界汽车详解华为巨鲸电池平台:百万装车0自燃,7×24h BMS云端看护

鸿蒙智行尚界汽车详解尚界Z7全系标配的华为巨鲸电池平台,宣称“百万装车0自燃”。该平台采用正置电芯架构和15层防护(5层热安全、5层电芯、5层底部),包括航空级气凝胶、耐1000°C云母板与定向排烟通道、超耐磨防腐涂层、热成型钢板、铝合金缓冲层等。电池包四周加强筋、铝合金挡块及热成型钢梁提升抗碰撞能力,前防刮梁低于电池包最低点。BMS云端看护实现7×24h监控,近200个智能感知节点进行一芯一感知,AI预警可提前识别隐患并记录全生命周期健康档案。

教程/实践端侧
21:31
IT之家(RSS)
7
广汽传祺向往M8 PHEV L / E8 PHEV上市,16.84万元起

广汽传祺向往M8 PHEV L(3款,26.98-30.98万元)与向往E8 PHEV(4款,限时参考落地价16.84-19.86万元)上市。M8采用“一品麒麟”设计,搭载激光雷达等多传感器,支持城市NDA导航辅助与代客泊车,1.5T插混,CLTC纯电续航248km,综合续航超1300km,亏电油耗6.05L。E8全系标配10.25英寸仪表与15.6英寸中控屏,二排座椅通风/加热/按摩,1.5T+磷酸铁锂电池。

其他
21:31
IT之家(RSS)
28
港珠澳大桥香港口岸6月25日启用2条"无感e-道"

香港特区政府入境事务处宣布,6月25日在港珠澳大桥香港口岸推出2条“无感e-道”。完成登记后,系统通过容貌识别与AI影像分析核验身份,全程无需驻足,约5秒完成出境手续,较传统“e-道”提速约2秒。合资格者为年满11周岁的香港永久性居民,且过去90日内经该口岸旅检大楼累计出入境不少于10次。即日起可通过“非触式e-道”App登记。

政策/监管
21:27
Bloomberg:Technology(RSS)
57
DoorDash 推出 AI 聊天机器人,帮助处理订单、预订和杂货清单

DoorDash Inc. 在应用内推出了一款人工智能聊天机器人,帮助顾客完成餐厅和杂货订单,并暗示该技术还可用于解锁新的企业收入来源。

产品更新行业动态
21:25
The Decoder:AI News(RSS)
62
Dario Amodei 新文章:AI 时代的冷战剧本

Anthropic 发布了一篇由 Dario Amodei 撰写的长文和两个政策框架。文章呼吁对前沿 AI 模型进行强制审计,并将 AI 描绘为国家间争夺的战略武器,类似冷战时期的博弈。

Anthropic大佬观点安全/对齐政策/监管
21:12
Anthropic:Newsroom(网页)
精选61
Anthropic 启动 Claude Corps 全国奖学金项目

Anthropic 推出 Claude Corps 奖学金项目,面向早期职业生涯的年轻人,培训 1,000 名研究员使用 Claude,并匹配给美国非营利组织全职工作一年。研究员年薪 85,000 美元及福利,每周接受 5 小时持续培训。Anthropic 初始投入 1.5 亿美元,合作方为 CodePath 和 Social Finance。至少 400 家非营利组织将参与接待,包括 Braven、Code the Dream、Heartland Forward 等。

Anthropic行业动态

推荐理由:我觉得Anthropic这1.5亿不是白花的,它在为AI经济转型做一个社会实验,1000个fellows塞进非营利组织,如果跑通了,可能会变成大规模就业缓冲带。
20:57
Bloomberg:Technology(RSS)
55
OpenAI 高管 George Osborne:政府加快采用 AI 将成为经济与公共服务赢家

OpenAI 国际事务负责人、前英国财政大臣 George Osborne 在牛津郡 Founders Forum 表示,许多国家虽有采用 AI 的讨论,但多数仍在推进中,尚未真正落地。他称,更快采纳新技术的政府将在经济和公共服务方面成为大赢家。

OpenAI政策/监管行业动态
19:59
HuggingFace Daily Papers(社区热门论文)
65
次二次架构对比:xLSTM在代码预训练与时间序列任务中优于Mamba-2和Gated DeltaNet

在代码模型预训练、从大语言模型蒸馏代码模型以及时间序列基础模型预训练三项任务中,xLSTM、Mamba-2和Gated DeltaNet三种次二次架构中,xLSTM取得最佳整体性能。通过统一公式和机制分析发现,xLSTM的门控方案实现了更灵活稳定的记忆校正,其状态跟踪和记忆累积优势在合成长度泛化任务中得到验证。

推理编码论文/研究
19:52
The Verge:AI(RSS)
64
Anthropic 为 AI 模型 Claude Fable 5 隐形护栏致歉

Anthropic 就为其新 AI 模型 Claude Fable 5 内置隐形护栏并暗中限制用户行为致歉。声明称此类护栏损害了研究人员和竞争对手测试及开发竞争系统的正常使用。公司正撤销限制,并承诺更透明地告知护栏何时触发——即便这会导致 Fable 拒绝更多查询。Fable 是 Anthropic 旗下 Mythos 类 AI 系统中首个广泛可用的模型,公司此前长期警告该类模型过于危险不宜公开发布,目前通过护栏措施应对部分高风险查询。

Anthropic安全/对齐行业动态
19:42
Google DeepMind:Blog(RSS)
精选71
Google DeepMind 宣布投入 1000 万美元资助多智能体AI安全研究

Google DeepMind 与合作伙伴共同发起一项 1000 万美元的资金征集,专门用于多智能体 AI 安全方向的研究。

智能体DeepMind安全/对齐行业动态

推荐理由:多智能体安全研究拿到千万美金资助,DeepMind 在下一盘大棋,所有做 Agent 的团队都应该关注这个方向的风向变了。
19:30
Artificial Intelligence News(RSS)
61
Visa 与 ChatGPT 集成,AI 智能体可实现零售购买

Visa 将支付基础设施接入 ChatGPT,使 AI 智能体能够推荐零售产品并执行金融交易。该部署去除了零售漏斗最后阶段的人工干预——自主智能体将处理用户提示、评估商家目录,并利用 Visa 支付通道在任何支持商户处完成结账流程。

智能体MCP/工具OpenAI产品更新
19:17
Hacker News 热门(buzzing.cc 中文翻译)
50
Meta效仿特斯拉做法,在帐篷内建设数据中心

Meta效仿特斯拉的做法,在帐篷内建设数据中心。该消息在 Hacker News 上获得 100 HN Points。

Meta行业动态部署/工程
19:10
公众号:京东JoyAI
44
为卫浴装上"AI大脑",JoyInside×惠达AI卫浴套系6月17日重磅开售

京东JoyInside与惠达推出行业首款搭载JoyInside统一智能中枢的卫浴套系“惠达小京灵系列AI卫浴套装”,含AI智能马桶、AI智能花洒、AI智能浴室柜。依托JoyAI大模型,设备支持语音控制、模糊语义理解、连续多轮对话及方言识别,可实现自动预排冷水、语音控温、镜面除雾等场景联动。套系已开启预售,6月17日晚8点正式售卖。JoyInside已与近200家机器人、AI玩具、家电家居品牌合作,预计年内接入超千万终端设备。

产品更新端侧语音
19:00
Artificial Intelligence News(RSS)
52
Xebia:构建AI智能体的数据基础并加速

Xebia全球CTO Niels Zeilemaker指出,为组织引入AI智能体加速流程必须从数据基础着手——让数据可供AI消费。Agentic AI的规模取决于数据强度,忽视这一点将无法推进。

智能体大佬观点数据/训练
18:59
HuggingFace Daily Papers(社区热门论文)
67
ART:基于艺术强化训练的多模态大语言模型微调方法

ART(Art-based Reinforcement Training)是一种参数高效微调方法,通过仅优化冻结多模态大语言模型的原始视觉输入(像素阵列)来注入信息,无需修改预编译计算图,从而可在 vLLM 等高性能推理引擎上以软提示方式运行。ART 支持任意微调目标,优化后的视觉输入可被风格化为计算艺术作品。在开源 Qwen 架构的不同规模模型上,ART 在数学和结构化工具使用基准测试中达到了与 LoRA 相当的准确率。

多模态数据/训练论文/研究
18:59
Hugging Face:Blog(RSS)
46
PyTorch 剖析系列(二):从 nn.Linear 到融合 MLP

本部分将手写 matmul-add 对替换为 nn.Linear(bias=True),堆叠三层 Linear 与激活函数构成多层感知机(MLP)块,在 NVIDIA A100 GPU 上剖析。Profile trace 显示 nn.Linear 内部调用 aten::addmm,将 bias 加法作为 epilogue 融合进矩阵乘法核,避免额外 HBM 访问;transpose 操作(aten::t)仅改写 CPU 端张量元数据(shape 和 stride),不启动 GPU 核。

Hugging Face教程/实践部署/工程
18:57
Bloomberg:Technology(RSS)
66
AI成本开始反映在通胀中

人工智能数据中心的大规模建设,正在持续推高手机、电脑和汽车中所使用关键硬件部件的生产成本,这一成本上涨效应已经开始反映在通胀统计数据之中。

现象/趋势行业动态
18:50
公众号:卡尔的AI沃茨
77
开源「鲁班」Skill:用 Claude Fable 5 打磨 AI Skill 的工作流

Claude Fable 5(Mythos 安全公开版)6月22日前对 Pro/Max/Team 订阅用户开放,之后转 API。作者用 100 美元/月的 Max 会员,让 Fable 5 开发了开源“鲁班 Skill”,专用于打磨其他 AI Skill。该 Skill 通过前提验证(真实问题、安装理由、唯一性)、并行搜索同类(GitHub/ClawHub/skills.sh 等)、横纵分析、Darwin 式 9 维度评分(权重最高的实测表现)、SkillOpt 式单方向改写等步骤,将作者已有的 ai-news-radar 项目升级至 v0.7。Fable 5 自动录制操作视频并剪辑,追加了热点模式和时间轴模式,改进了消息评分算法并公开回测工具。鲁班 Skill 已开源至 github.com/LearnPrompt/luban-skill,强调 Skill 本质是清晰提示语而非复杂脚本。

智能体AnthropicGitHub开源/仓库
关联讨论 28 条TechCrunch:AI(RSS)X:OpenRouter (@OpenRouter)Anthropic:Newsroom(网页)X:Perplexity (@perplexity_ai)Simon Willison 博客The Verge:AI(RSS)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Testing Catalog (@testingcatalog)X:Claude Devs (@ClaudeDevs)X:Claude (@claudeai)X:Kim (@kimmonismus)Hacker News 热门(buzzing.cc 中文翻译)X:Eric Zakariasson (@ericzakariasson)X:宝玉 (@dotey)X:Rohan Paul (@rohanpaul_ai)X:Boris Cherny (@bcherny)X:Andrej Karpathy (@karpathy)Claude Code:GitHub Releases(RSS)X:歸藏 (@op7418)The Decoder:AI News(RSS)X:Artificial Analysis (@ArtificialAnlys)X:Berry Xia (@berryxia)Nathan Lambert:Interconnects(RSS)IT之家(RSS)公众号:数字生命卡兹克X:卡兹克 (@Khazix0918)X:小互 (@xiaohu)Tomer Tunguz 博客(VC 分析)
18:31
IT之家(RSS)
50
奇瑞汽车与引望签署协议,深化L3/L4级自动驾驶合作

奇瑞汽车与引望在安徽芜湖签署深化战略合作协议,将围绕L3级、L4级自动驾驶技术开展深度合作。奇瑞董事长尹同跃、引望董事长徐直军等出席签约。引望成立于2024年1月,涵盖华为乾崑智驾ADS、车控、车载光、车云及鸿蒙座舱HarmonySpace解决方案,华为持股80%,阿维塔和赛力斯各持股10%。奇瑞旗下捷途纵横G700已搭载华为乾崑智驾ADS 4,与捷豹路虎合作品牌FREELANDER神行者则全系标配华为乾崑智驾ADS V4.1。

端侧行业动态
18:31
IT之家(RSS)
57
京东发布国内首个智能体自主支付协议A2P2,划分L0至L5六个等级

京东6月11日发布国内首个智能体自主支付协议A2P2,将支付自主化划分为L0至L5六个等级,重点聚焦L3和L4。L3智能体可在单一任务内自主发起支付请求;L4在预设范围内自主完成支付。协议引入任务委托凭证(Mandate),将自然语言指令转为可校验凭证。资金安全方面首创ARI机制,支付时绑定真实用户、智能体身份与运行环境,三方核验通过才放行。另设专用隔离账户限制金额、场景、有效时间等。支付后形成证据闭环,通过存证链确保每笔AI交易可审计。

智能体产品更新安全/对齐
18:30
公众号:火山引擎
48
银河证券×火山引擎:TRAE嵌入研发全流程,交付周期缩短一半

银河证券与火山引擎合作,引入TRAE企业版并推进SDD(规格驱动开发)范式,将AI Coding嵌入研发全流程。研发需求交付周期缩短1/3至1/2,AI代码采纳率最高达87%,前端UI还原度稳定在90%以上(H5/Vue页面达98%以上)。子账户与融券系统重构周期从4个月压缩至2个月,Bug率降低25%,单元测试覆盖率提升30%,券池规模扩大10倍,服务客户量扩大20倍。通过MCP集成打通Ones、GitLab、DevOps等工具链,组织级Skill库减少60%手写测试工作量。TRAE企业版已覆盖银河证券100个研发席位,累计培训超130名研发人员。

MCP/工具教程/实践编码
18:30
公众号:面壁智能(MiniCPM)
明天见!面壁智能精彩日程全在这,智源大会等你
18:26
Bloomberg:Technology(RSS)
50
沃伦提案:华尔街须披露 AI 企业风险敞口

参议员 Elizabeth Warren 近日提出一项法案,要求金融机构披露其对人工智能公司的风险敞口。这是她持续推动加强对该行业资金监管的最新举措。

政策/监管行业动态
17:59
HuggingFace Daily Papers(社区热门论文)
67
语法约束解码可越狱大语言模型生成恶意代码:CodeSpear攻击与CodeShield防御

语法约束解码(GCD)本用于提升大语言模型(LLM)生成代码的语法可靠性,但研究发现其可被逆向用作攻击面。新攻击方法CodeSpear仅通过施加良性代码语法约束即可诱导LLM生成恶意代码。防御方法CodeShield在代码模态中对齐模型,使其在GCD下生成语义无害、结构多样的蜜罐代码,同时保留自然语言拒绝能力。在10个流行LLM、4个基准上的实验显示,CodeSpear比代表越狱基线的攻击成功率平均提高30个百分点以上,CodeShield能恢复安全并保持良性功能。该发现揭示了GCD的潜在安全风险。

安全/对齐编码论文/研究
17:59
HuggingFace Daily Papers(社区热门论文)
63
TRACE:面向高效智能体强化学习的统一 Rollout 预算分配框架

TRACE 针对多轮智能体 RL 中因提示复杂度差异和仅有最终奖励导致的奖励对比度不足问题,将每个 ReAct 轮次视为语义独立节点,把预算分配从 prompt 根节点扩展到中间前缀,形成树结构 rollout。它使用可共享预测器根据前缀历史估计条件成功概率,优先向易产生混合奖励的节点分配有限采样预算,从而增强策略更新信号。在典型智能体基准上,TRACE 以相同采样成本使 Qwen3-14B 在 Multi-Hop QA 上的准确率提升 2.8 个百分点。

智能体arXiv推理论文/研究
17:54
MarkTechPost(RSS)
59
Nous Research 发布 Hermes Agent Profile Builder:身份、模型、技能和 MCP 服务器一站式仪表盘流

Nous Research 为 Hermes Agent 仪表盘新增 Profile Builder,用户可在单一流程中构建包含身份、模型、技能和 MCP 服务器的完整 Agent 配置文件,替代以往多步 CLI 配置方式。

智能体MCP/工具产品更新
17:31
IT之家(RSS)
57
银河通用机器人智慧药房创人形机器人持续自主工作超一年世界纪录

银河通用机器人智慧药房创下人形机器人持续自主工作超一年的世界纪录。其24小时运行的机器人已承担夜间拣货任务,实现店铺夜间自主值守。银河通用还推出由人形机器人完全自主运营的智慧零售解决方案“银河太空舱”,已在20余个城市落地超百家门店,首家门店位于北京海淀,计划未来几年在全国扩展至1000家。

具身智能行业动态
17:31
IT之家(RSS)
精选71
阿里云发布 Meoo CLI:本地 AI 编程项目可一键部署上线

阿里云今日推出 Meoo(秒悟)开源命令行工具 Meoo CLI,面向开发者,支持 Claude Code、Codex、Cursor 等本地 AI 编程助手。通过调用阿里云云端能力,可自动完成数据库接入、用户登录、文件存储及项目发布,将本地项目一键部署上线并生成可分享的访问链接。该工具定位为本地 Agent 与秒悟云端能力的连接入口,已开放下载,支持主流 Linux、macOS 及 Windows 平台。

智能体产品更新开源/仓库部署/工程

推荐理由:本地AI编程工具产出的项目终于有了一条直通云端的管道,Meoo CLI 把数据库、鉴权、部署这些脏活全包了,非前端也可以把原型直接变成产品。
17:31
IT之家(RSS)
54
WPS 笔记发布:AI 原生多模态,重新定义个人知识管理

6月5日,金山办公发布AI原生多模态笔记产品WPS笔记,摒弃传统文件夹,采用多级AI自动标签组织内容。支持语音、图片、文字、网页等录入;语音转写具备AI实时纠正和声纹区分发言人功能,图片可提取公式并支持LaTeX编辑及梯形校正。全域多模态检索可同时搜索文字、图片、音频。内置WPS灵犀助手,能完成整理、摘要、润色、创建任务清单等操作,支持自定义Skill和记忆设置。开放外部MCP接入,允许Cursor、Claude等第三方AI应用直接读取笔记。

MCP/工具多模态教程/实践
17:00
公众号:千问APP(阿里)
精选72
千问推出首个足球预测AI助手,竞猜赢奖并捐建球场

千问上线首个足球预测AI助手,基于海量大数据(含历史比赛、球员数据、伤病、美加墨地貌及天气等)。以6月22日挪威对塞内加尔为例,预测“1:1平局”,理由为气候差异。活动:参与全部104场竞猜,预测超80场且准确率超千问可抽万元大奖(100个名额);预测超32场可抽千问AI眼镜G1(1000副),该眼镜支持赛后分析、拍屏识球员及赛事结果订阅。累积积分将向乡村学校捐建足球场,目标至少50所。

产品更新数据/训练

推荐理由:千问把AI预测和世界杯热点捆绑,玩法不算新鲜,但捐球场的设计让这件事多了点人情味。如果你对预测模型感兴趣,可以看看它怎么处理天气和地貌数据,虽然实际准确率还得踢了才知道。
16:58
HuggingFace Daily Papers(社区热门论文)
54
时间序列基础模型嵌入用于剩余使用寿命估计

提出一种轻量学习方法:使用冻结的预训练时间序列基础模型 Chronos-2 提取上下文窗口特征,结合小型回归神经网络进行多元传感器流的剩余使用寿命(RUL)预测。在两种设备类型的真实工业数据上,Chronos-2 嵌入特征在相同预处理和评估协议下,一致优于循环、卷积、Transformer 和梯度提升基线。研究还发现更长的上下文窗口显著提升预测性能,表明时间序列基础模型为工业 RUL 估计提供了实用且数据高效的替代方案。

端侧论文/研究
16:54
MarkTechPost(RSS)
67
Cohere 发布 North Mini Code:30B 参数 MoE 编码模型,3B 活跃参数,单卡 H100 运行,支持 256K 上下文

Cohere 推出首款开发者编码模型 North Mini Code,采用 30B 总参数的混合专家(MoE)架构,每次推理仅激活 3B 参数,可在单块 H100 GPU 上运行,支持 256K token 上下文窗口,专为智能体编码场景设计,模型权重开源。

模型发布编码
‹ 上一页
1…56789…50
下一页 ›