AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
精选全部日报更多
全部动态
全部一手资讯X论文
7月1日周二
6月10日周二
5月30日周五
5月29日周四
5月28日周三
5月21日周三
5月7日周三
4月30日周三
4月14日周一
4月10日周四
4月3日周四
3月25日周二
3月17日周一
2月17日周一
1月30日周四
1月20日周一
1月13日周一
12月26日周四
12月13日周五
12月5日周四
11月20日周三
11月18日周一
10月16日周三
9月18日周三
9月17日周二
9月6日周五
8月16日周五
7月24日周三
7月18日周四
7月16日周二
5月29日周三
4月17日周三
3月21日周四
2月26日周一
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
7月1日
08:00
OpenRouter:Announcements(RSS)
精选55
OpenRouter 发布新隐身模型 Cypher Alpha

OpenRouter 宣布推出 Cypher Alpha,这是一款免费、通用型隐身模型,内置工具调用功能,用户可直接尝试。

智能体模型发布

推荐理由:OpenRouter 自家出的免费通用模型,带工具调用,去年夏天发的,现在看只能算个入门级 Agent 玩具,但免费试不亏。
08:00
OpenRouter:Announcements(RSS)
47
新型隐形模型:Cypher Alpha

Cypher Alpha 是一款免费、通用、隐形模型,自带工具调用功能。

智能体MCP/工具模型发布
6月10日
00:00
Mistral AI:News(网页)
67
Mistral AI 发布首个推理模型 Magistral

Mistral AI 发布了其首个推理模型 Magistral,包含开源版 Magistral Small(24B 参数)和企业版 Magistral Medium。在 AIME2024 上,Magistral Medium 得分为 73.6%,Magistral Small 为 70.7%。该模型核心特点是支持透明的多步推理,并能在 Le Chat 中以 10 倍于多数竞品的速度运行。Magistral 原生支持包括英语、法语、简体中文在内的多语言推理。开源版 Magistral Small 以 Apache 2.0 许可证发布。

开源生态推理模型发布
5月30日
09:32
公众号:小米 MiMo
59
Xiaomi MiMo-VL:通向Agent时代的推理基座,小米多模态大模型开源

小米开源多模态大模型Xiaomi MiMo-VL,该模型定位为Agent时代的推理基座,旨在为智能体时代提供基础推理能力。

智能体多模态模型发布
5月29日
20:11
DeepSeek@deepseek_ai
精选68
🚀 DeepSeek-R1-0528 现已发布! 🔹 基准测试性能提升 🔹 前端能力增强 🔹 减少幻觉现象 🔹 支持 JSON 输出与函数调用 ✅ 立即试用:https://chat.deepseek.com/ 🔌 API 使用方式不变 - 文档在此:https://api-docs.deepseek.com/guides/reasoning_model 🔗 开源权重:https://huggingface.co/deepseek-ai/DeepSeek-R1-0528
DeepSeek开源生态推理模型发布
关联讨论 1 条X:DeepSeek (@deepseek_ai)
推荐理由:DeepSeek-R1 的常规迭代,幻觉降低和 JSON 输出是实用改进,但距离代际跃迁还差得远。开源权重直接可用,做推理链产品的团队值得花半小时跑一下。
20:06
公众号:DeepSeek(深度求索)
51
DeepSeek-R1 更新,思考更深,推理更强

DeepSeek-R1 更新,思考更深,推理更强。开启“深度思考”功能即可体验新版 R1 更加强大的思考与推理能力。

DeepSeek推理模型发布
5月28日
00:00
Mistral AI:News(网页)
61
Mistral AI 发布代码专用嵌入模型 Codestral Embed

Mistral AI 发布首个专为代码设计的嵌入模型 Codestral Embed。该模型在代码检索任务上性能显著超越当前领先的 Voyage Code 3、Cohere Embed v4.0 和 OpenAI 大型嵌入模型。它支持输出不同维度和精度的嵌入向量,即使在 256 维度 int8 精度下仍优于竞品。模型通过 API 以 `codestral-embed-2505` 名称提供,定价为每百万 token 0.15 美元,批量 API 享五折优惠。最大上下文长度为 8192 tokens,推荐使用 3000 字符(含 1000 字符重叠)分块以优化检索效果。

检索增强模型发布编码
5月21日
00:00
Mistral AI:News(网页)
63
Devstral 面向软件工程的智能体大语言模型发布

Mistral AI 与 All Hands AI 合作推出 Devstral,一款专注于解决真实世界 GitHub 问题的智能体大语言模型。该模型需在 OpenHands 或 SWE-Agent 等代码智能体框架中运行。在 SWE-Bench Verified 基准测试中,Devstral 获得 46.8% 的分数,超越此前的开源最先进模型超过 6 个百分点。在相同测试框架下,其表现优于 DeepSeek-V3-0324 和 Qwen3 232B-A22B,并且比闭源的 GPT-4.1-mini 高出超过 20%。Devstral 以 Apache 2.0 许可证开源,可在单张 RTX 4090 或配备 32GB 内存的 Mac 上本地部署,亦可通过 API 调用。

智能体开源生态模型发布编码
关联讨论 1 条Mistral AI:News(网页)
5月7日
00:00
Mistral AI:News(网页)
54
Medium is the new large.

Mistral AI 发布 Mistral Medium 3 模型,主打顶尖性能与高性价比。该模型在各项基准测试中达到或超过 Claude Sonnet 3.7 表现的90%,但成本显著更低(API 定价为 $0.4 / 百万输入 token 和 $2 / 百万输出 token)。其性能超越 Llama 4 Maverick 等开源模型及 Cohere Command A 等企业模型,成本也优于 DeepSeek v3。该模型擅长编码和多模态理解等专业任务,并支持混合或本地部署、定制微调及集成企业系统,现已可通过多个平台调用。

开源生态模型发布
4月30日
09:23
公众号:小米 MiMo
57
Xiaomi MiMo:为"Reasoning"而生!小米首个推理大模型开源
推理模型发布
4月14日
08:00
OpenRouter:Announcements(RSS)
24
Quasar Alpha 和 Optimus Alpha 亮相

Quasar Alpha 和 Optimus Alpha 是 OpenRouter 的早期测试版本,在测试期间均位居排行榜首位。

模型发布
08:00
OpenRouter:Announcements(RSS)
42
Quasar Alpha 与 Optimus Alpha 揭示

OpenRouter 公告显示,Quasar Alpha 与 Optimus Alpha 在测试期间均登顶排行榜,它们是早期测试阶段的模型版本。

模型发布
4月10日
08:00
OpenRouter:Announcements(RSS)
41
OpenRouter 推出第二个"隐身"模型 Optimus Alpha

OpenRouter 宣布推出其第二个“隐身”(stealth)模型 Optimus Alpha。该模型名称延续了“stealth”系列,但官方目前未公布具体技术参数、功能或应用细节。

模型发布部署/工程
08:00
OpenRouter:Announcements(RSS)
35
OpenRouter 发布第二个"stealth"模型 Optimus Alpha

OpenRouter 宣布推出其第二个“stealth”模型 Optimus Alpha,该模型为闭源产品,尚未公布参数规模、性能基准或价格等细节。

模型发布
4月3日
08:00
OpenRouter:Announcements(RSS)
36
OpenRouter 发布首个"隐身"模型 Quasar Alpha

OpenRouter 宣布其首个“隐身”模型 Quasar Alpha。该模型是 OpenRouter 首次推出的隐藏身份/来源的模型,具体参数、性能、可用性等细节尚未公布。

模型发布
08:00
OpenRouter:Announcements(RSS)
51
OpenRouter 推出首个"隐身"模型 Quasar Alpha

OpenRouter 宣布推出其首个名为 Quasar Alpha 的“隐身”模型。

模型发布
3月25日
21:23
公众号:DeepSeek(深度求索)
精选64
DeepSeek-V3 模型更新,各项能力全面进阶

DeepSeek-V3 新版已发布,关闭深度思考模式即可体验,模型权重同步开源。

DeepSeek开源/仓库推理模型发布
关联讨论 1 条公众号:DeepSeek(深度求索)
推荐理由:DeepSeek-V3 发布时是开源模型的有力竞争者,但这条一年多前的旧闻如今毫无新意,对关注 AI 动态的你来说,可以直接跳过。
3月17日
00:00
Mistral AI:News(网页)
58
Mistral AI 发布 Mistral Small 3.1 开源模型

Mistral AI 于2025年3月17日发布 Mistral Small 3.1。该模型在 Mistral Small 3 基础上改进,支持最高 128k tokens 上下文窗口,推理速度达 150 tokens/秒,并支持多模态理解。官方称其性能超越了 Gemma 3 和 GPT-4o Mini 等同量级模型。Mistral Small 3.1 以 Apache 2.0 许可开源,基础模型与指令微调模型均已发布。模型轻量化,可在单张 RTX 4090 或配备 32GB RAM 的 Mac 上运行,适用于对话助手、函数调用、专业领域微调及构建推理模型等多种场景。

开源生态模型发布端侧
2月17日
00:00
Mistral AI:News(网页)
56
Mistral AI 发布首个区域语言模型 Mistral Saba

Mistral AI 推出首个区域语言模型 Mistral Saba。这是一个参数量为 24B 的模型,基于来自中东和南亚的精选数据集进行训练。模型在提供比自身参数量大五倍的通用模型更准确的相关响应的同时,具备更快的速度和更低的成本。Mistral Saba 支持阿拉伯语及多种印度语言,在南印度语系如泰米尔语上表现尤为突出。它以 API 形式提供服务,同时也支持在客户的安全环境中进行本地部署。该模型轻量化,可在单 GPU 系统上运行,响应速度超过 150 tokens/秒。

模型发布
1月30日
00:00
Mistral AI:News(网页)
60
Mistral Small 3发布

Mistral AI 发布 Mistral Small 3,一款基于 Apache 2.0 开源、延迟优化的 24B 参数大语言模型。其性能可与 Llama 3.3 70B、Qwen 32B 等更大模型竞争,并作为 GPT-4o-mini 的开源替代。指令微调版本在代码、数学、通用知识等基准测试中表现出色,MMLU 准确率超 81%,推理速度达 150 tokens/s。该模型未使用强化学习或合成数据训练,提供预训练和指令微调两个检查点,适合本地部署,经量化后可在单块 RTX 4090 或 32GB 内存 MacBook 上运行。现已在 la Plateforme 平台提供,并与 Hugging Face、Ollama、Together AI 等合作推出。

开源生态推理模型发布
关联讨论 1 条Mistral AI:News(网页)
1月20日
20:10
公众号:DeepSeek(深度求索)
精选64
DeepSeek-R1 发布,性能对标 OpenAI o1 正式版

DeepSeek-R1 发布,性能对标 OpenAI o1 正式版。模型遵循 MIT License 开放 API,训练技术同步公开。

DeepSeek推理模型发布

推荐理由:虽已是旧闻,但 DeepSeek-R1 作为首个开源对齐 o1 的模型,其训练技术至今仍有参考价值,做推理方向的值得回溯。
1月13日
00:00
Mistral AI:News(网页)
52
Mistral AI 发布 Codestral 25.01 代码生成模型

Mistral AI 推出了代码生成模型 Codestral 25.01。相比前代 Codestral-2405,该模型采用了更高效的架构并改进了分词器,使代码生成与补全速度提升约 2 倍。Codestral 25.01 的上下文长度为 256k。在多项基准测试中,它在 HumanEval 平均基准上得分 71.4%,在 HumanEvalFIM(填充中间)平均基准上得分 85.9%,成为同量级模型中代码生成,尤其是填充中间(FIM)任务的 SOTA。

模型发布编码
12月26日
19:17
公众号:DeepSeek(深度求索)
精选67
DeepSeek-V3 正式发布

深度求索正式发布 DeepSeek-V3 模型,性能比肩世界顶尖模型,速度跃升,价格更新。

DeepSeek开源/仓库模型发布

推荐理由:DeepSeek-V3 是 2024 年底国产模型的一次真正跃迁,首次亮剑就逼近闭源顶尖,开源权重更是直接改变了开发者生态。时隔一年半回头看,它仍是理解 DeepSeek 路径的起点。
12月13日
20:14
公众号:DeepSeek(深度求索)
47
久等了,DeepSeek-VL2
DeepSeek多模态模型发布
12月5日
08:00
OpenRouter:Announcements(RSS)
36
亚马逊推出全新Nova模型家族

亚马逊推出了全新的Nova模型家族。这是亚马逊最新发布的Nova系列模型,现已正式到来。

多模态模型发布
11月20日
19:59
公众号:DeepSeek(深度求索)
精选66
DeepSeek 推理模型预览版上线,推理性能媲美 o1-preview,公开完整思维链

DeepSeek 上线推理模型预览版,其推理性能与 OpenAI 的 o1-preview 相当,并公开了模型的完整思维链。

DeepSeek推理模型发布
关联讨论 1 条公众号:DeepSeek(深度求索)
推荐理由:虽然已是旧闻,但 DeepSeek 首次公开推理模型完整思维链,对理解 o1 类模型的内部机制是个重要线索,做推理模型研究的值得回看。
11月18日
00:00
Mistral AI:News(网页)
60
Mistral AI 开源多模态模型 Pixtral Large 发布

Mistral AI 基于 Mistral Large 2 发布了开源多模态模型 Pixtral Large。该模型包含 123B 多模态解码器和 1B 视觉编码器,支持 128K 上下文窗口。性能方面,它在 MathVista、DocVQA、ChartQA 和 MM-MT-Bench 等基准测试中超越 GPT-4o 与 Gemini-1.5 Pro,并在 LMSYS Vision Leaderboard 上成为得分最高的开源模型。需要注意的是,该模型已停止维护,并被更新的视觉模型所取代。

多模态开源/仓库模型发布评测/基准
关联讨论 1 条Mistral AI:News(网页)
10月16日
00:00
Mistral AI:News(网页)
54
Mistral AI发布Ministral 3B和8B边缘模型

Mistral AI发布了两个新的边缘计算模型Ministral 3B和Ministral 8B。两者均支持高达128k的上下文长度。Ministral 8B采用了特殊的交错滑动窗口注意力模式,以实现更快、内存效率更高的推理。这些模型在知识、常识、推理、函数调用和效率方面为10B以下类别设定了新标杆,可用于设备端翻译、离线智能助手、本地分析和机器人等场景。在多项基准测试中,它们超越了同级别的Gemma 2 2B、Llama 3.2 3B等模型。Ministral 8B的API定价为$0.1 / M tokens,Ministral 3B为$0.04 / M tokens。

MCP/工具模型发布端侧
9月18日
20:06
公众号:DeepSeek(深度求索)
56
DeepSeek-V2.5 登上 LMSYS ChatBotArena,创国产模型历史最高分

DeepSeek-V2.5 在 LMSYS ChatBotArena(全球大模型竞技场)榜单中上榜,创下国产大模型在该竞技场的最高得分记录。

DeepSeek开源生态模型发布评测/基准
9月17日
00:00
Mistral AI:News(网页)
47
Pixtral 12B 发布公告

Mistral AI 发布了多模态模型 Pixtral 12B,该模型现已弃用,已被更新更强的版本取代。其基于 Mistral Nemo 构建,包含一个从头训练的 400M 参数视觉编码器,总参数为 12B。模型原生支持可变图像尺寸与宽高比,并能在 128K token 的上下文窗口中处理多张图像。在 MMMU 推理基准测试中,Pixtral 12B 达到 52.5% 的分数,超越了众多更大规模的模型。它在保持强大文本能力(如指令跟随,相对前代开源模型有 20% 提升)的同时,在多模态任务上表现出色。该模型采用 Apache 2.0 许可证。

多模态模型发布
9月6日
19:38
公众号:DeepSeek(深度求索)
精选61
DeepSeek-V2.5:融合通用与代码能力的全新开源模型

DeepSeek-V2.5 保留原有 Chat 模型的通用对话能力和 Coder 模型的代码处理能力,并更好地对齐人类偏好。

DeepSeekOpenAI开源/仓库模型发布

推荐理由:DeepSeek首次将通用对话与代码能力合一的开源模型,当时直接拉低了多任务成本,今天看仍是模型混合能力演变的早期标杆。
8月16日
20:46
公众号:DeepSeek(深度求索)
53
DeepSeek 发布开源数学定理证明模型

DeepSeek 发布了一款开源数学定理证明模型,目标是加速“数学定理证明的 AlphaGo 时代”的到来。

DeepSeek开源/仓库推理模型发布
7月24日
00:00
Mistral AI:News(网页)
65
Mistral Large 2发布

Mistral AI发布了大语言模型Mistral Large 2。该模型拥有128k上下文窗口和123B参数,支持数十种语言和80多种编程语言,专为单节点长上下文推理设计。在MMLU基准上,其预训练版本达到84.0%准确率,性能与GPT-4o、Claude 3 Opus和Llama 3 405B相当,并显著降低了模型幻觉倾向。模型通过Mistral的API平台和HuggingFace提供,采用Mistral Research License(研究用途)和商业许可(商用部署)。平台将整合为通用模型(Mistral Nemo、Mistral Large)和专用模型(Codestral、Embed)的组合。

推理模型发布
7月18日
00:00
Mistral AI:News(网页)
62
Mistral AI与NVIDIA联合推出开源模型Mistral NeMo

Mistral AI团队与NVIDIA合作发布了Mistral NeMo,这是一个12B参数的大语言模型。它提供高达128k tokens的上下文窗口,并在推理、世界知识和编码能力上达到了其规模的前沿水平。该模型基于标准架构,是Mistral 7B的即插即用替代品,并支持FP8推理。Mistral NeMo以Apache 2.0许可开源,包含预训练和指令微调版本,权重已发布在HuggingFace并可通过其API平台调用。新引入的Tekken分词器在超过100种语言上训练,在压缩多种语言文本时效率显著高于前代。

开源生态推理模型发布
7月16日
00:00
Mistral AI:News(网页)
49
Codestral Mamba 发布

Mistral AI 团队发布了 Codestral Mamba 模型。该模型由 Albert Gu 和 Tri Dao 协助设计,采用 Mamba 架构而非 Transformer,具备线性时间推理优势,并在代码与推理能力上进行了训练,以达到与 SOTA Transformer 模型相当的性能。模型在高达 256k tokens 的上下文检索能力上进行了测试。它是一个指令微调版本,参数规模为 7,285,403,648,以 Apache 2.0 许可证开源。用户可通过 mistral-inference SDK 或 TensorRT-LLM 进行部署,权重可从 HuggingFace 下载,也已在 la Plateforme 上提供。

开源生态模型发布编码
00:00
Mistral AI:News(网页)
37
Mistral AI 发布数学推理模型 Mathstral 7B

Mistral AI 发布了专注于数学推理的 7B 参数模型 Mathstral 7B。该模型基于 Mistral 7B 构建,旨在解决需要复杂多步推理的高级数学问题。它在 MATH 和 MMLU 基准上分别达到 56.6% 和 63.47%,在同等参数规模中实现 SOTA 性能。通过增加推理时计算,其在 MATH 上的分数可借助多数投票提升至 68.37%,使用强奖励模型则可达 74.59%。该模型为指令模型,权重已托管于 HuggingFace。

开源/仓库推理模型发布
5月29日
00:00
Mistral AI:News(网页)
57
Codestral:Mistral AI团队2024年5月29日发布

Mistral AI推出其首个专用代码模型Codestral。该模型拥有22B参数,开源权重,专为代码生成任务设计,支持80+编程语言,并具备32k的上下文窗口,在RepoBench评测中表现优于竞品。开发者可通过专用端点 codestral.mistral.ai 获得为期8周的免费Beta测试,也可通过 api.mistral.ai 按token计费使用。该模型已集成至LlamaIndex、LangChain以及Continue.dev和Tabnine等IDE工具。

开源/仓库推理模型发布编码
4月17日
00:00
Mistral AI:News(网页)
63
更便宜、更好、更快、更强 2024年4月17日 Mistral AI团队

Mistral AI发布其最新开放模型Mixtral 8x22B。该模型基于稀疏混合专家(SMoE)架构,在141B总参数中激活39B参数,拥有64K tokens上下文窗口,支持英语、法语、意大利语、德语和西班牙语,并具备强大的数学、编码及原生函数调用能力。在MMLU等标准基准测试中,其推理性能超越其他开源模型,且推理速度优于任何密集型70B模型。该模型以Apache 2.0许可证开源发布。

开源生态推理模型发布编码
3月21日
00:00
Suno:Blog(网页)
39
Suno 推出 v3 音乐生成模型

音乐生成平台 Suno 发布了 v3 模型,这是其首个能生成广播级质量音乐的模型,支持用户在数秒内创作完整的两分钟歌曲,现已对所有用户开放。v3 在音频质量、风格多样性及提示词遵循性上进行了改进,减少了模型幻觉并提升了歌曲结尾的自然度。该模型专为原创音乐设计,不支持对其他艺术家的参考,并部署了不可听水印技术以检测 AI 生成内容。v4 模型已在开发中。

多模态模型发布
2月26日
00:00
Mistral AI:News(网页)
64
Mistral AI发布最新旗舰大语言模型Mistral Large

Mistral AI发布了其最新旗舰大语言模型Mistral Large。该模型在MMLU基准测试中排名全球第二(仅次于GPT-4),拥有32K token上下文窗口,原生支持英语、法语、西班牙语、德语和意大利语,并具备函数调用能力。Mistral Large已可通过Azure AI Studio和Mistral自身的la Plateforme API访问。同时,Mistral还发布了优化低延迟的Mistral Small。

推理模型发布
‹ 上一页
1…24252627
下一页 ›