AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
精选全部日报更多
全部动态一手 · 399 条
全部一手资讯X论文
今天6月13日 周六
6月12日周五
6月11日周四
6月10日周三
6月9日周二
6月8日周一
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月13日
10:10
OpenRouter:Announcements(RSS)
44
OpenRouter 可靠性与自动故障转移:请求如何持续成功

OpenRouter 默认启用提供商故障转移(provider failover),模型回退(model fallbacks)则为选择加入。这两层机制分别应对不同类型的故障:提供商故障转移在 API 调用失败时自动切换至其他提供商,模型回退则在指定模型不可用时切换到备选模型。公告详细说明了各层的工作原理以及故障转移的停止条件。

教程/实践部署/工程
10:10
OpenRouter:Announcements(RSS)
54
OpenRouter 模型路由工作原理

OpenRouter 将每个请求路由到 60 多家提供商,用户可自定义提供商顺序、价格上限和回退链,从而灵活控制路由策略。

教程/实践部署/工程
10:10
OpenRouter:Announcements(RSS)
精选65
Hermes Agent 在 OpenRouter 上的使用指南:设置、模型与路由

Hermes Agent 已通过 OpenRouter 处理超过 17 万亿 tokens。使用指南包括设置流程、选择支持 64K 上下文窗口的模型,以及调整路由策略以兼顾成本与可靠性。

智能体教程/实践部署/工程

推荐理由:不是产品发布,但作为实战指南,对已经在用 OpenRouter 做 agent 的团队来说,直接抄配置能省半天调试时间。
06:29
GitHub Blog
39
GitHub Copilot CLI 在委托任务上变得更具选择性

GitHub Copilot CLI 通过更好的编排实现了更少的任务交接和更快的进度,且没有新增任何配置选项。

智能体GitHub产品更新
05:40
OpenRouter:Announcements(RSS)
精选59
如何在OpenRouter上获得最低成本的LLM推理

在OpenRouter上追加`:floor`可获取最便宜提供商,通过`max_price`设定花费上限,并可免费使用20多个零成本模型。同时需注意避免计费陷阱。

推理教程/实践部署/工程

推荐理由:我觉得这篇教程对 OpenRouter 重度用户有用,floor 参数和 max_price 是控制成本的实用技巧,但信息量不大,当作使用手册就行。
01:01
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选67
OpenAI 推出面向新时代工作的新 Academy 课程

OpenAI 发布三门 Academy 课程,帮助用户掌握实用 AI 技能、创建可重复工作流,并在日常工作中应用 AI 智能体。

智能体OpenAI教程/实践

推荐理由:这三门课不是那种泛泛的“AI 提高效率”鸡汤,而是直接教你怎么把 agent 做成可重复的工作流,产品经理和运营能立刻套用。
00:14
Anthropic:Newsroom(网页)
精选73
Anthropic首次公众调查:近半美国人盼AI治愈疾病,超六成担忧失业

Anthropic对近5.2万美国人调查显示:48%将治愈癌症等疾病列为首要期望,36%希望AI帮助残障人士。64%担忧AI导致失业,56%担忧认知依赖,52%担忧信息误导。超70%支持政府监管,最关注隐私(56%)、儿童安全(52%)和责任归属(49%)。仅15%信任AI公司决策。多数议题上观点不因党派或地域严重分裂。调查于2025年11-12月由YouGov线上执行并加权至人口普查基准。

Anthropic政策/监管现象/趋势

推荐理由:Anthropic发布了一份覆盖5.2万美国人的AI民意调查,首次系统揭示了公众的恐惧排名——失业第一、认知依赖第二。虽然他们借数据推广自家政策框架的意图明显,但这两组数字对产品人理解用户心态极有价值。
6月12日
22:46
Gary Marcus:The Road to AI We Can Trust(RSS)
24
Gary Marcus:今日幻觉速报

Gary Marcus 在一篇题为“You can’t get more 2026 than that”的短文中仅写出一句:“Hallucination of the day:”。该文未披露具体模型、版本号或任何数字细节,仅以简短方式指出现阶段AI仍存在模型幻觉现象。

其他大佬观点
05:05
OpenRouter:Announcements(RSS)
精选69
Advisor:让任何模型在生成过程中求助更强的模型

OpenRouter 推出 advisor 服务器工具,允许快速、便宜的模型在生成过程中向更强模型咨询。用户可用 GPT-4o Mini 处理常规任务,在关键环节调用 Claude Fable 进行更高质量的推理。

智能体产品更新部署/工程
关联讨论 2 条X:OpenRouter (@OpenRouter)OpenRouter:Announcements(RSS)
推荐理由:给便宜模型配了个聪明后台,做agent时小模型应付日常,遇到难题自动呼叫大模型兜底,成本和智商两头顾,捣鼓推理架构的可以试试。
05:05
OpenRouter:Announcements(RSS)
精选60
什么是 LLM 网关?应用与 AI 模型之间缺失的一层

缺少 LLM 网关时,供应商中断会直接变成用户可见的错误,AI 支出也难以追踪。文章从路由、合规性和设置时间三个维度比较了最佳方案。

教程/实践部署/工程

推荐理由:LLM 网关正在成为 AI 栈的必备层,这篇把路由、合规、部署时间这些选型维度拆得明白,正在做生产级集成的团队值得点开对照自己的架构。
03:35
OpenRouter:Announcements(RSS)
43
什么是 LLM Gateway?你的应用与 AI 模型之间的缺失层

LLM Gateway 能防止 API 提供商故障变成用户端可见错误,并让 AI 费用变得透明。通过路由、合规性和设置时间等维度,可以对比市面上最佳的网关方案。

教程/实践部署/工程
6月11日
21:45
Gary Marcus:The Road to AI We Can Trust(RSS)
精选58
OpenAI 正酝酿"大幅"降价,Gary Marcus 视其为示弱信号

OpenAI 正考虑大幅降价,Gary Marcus 认为这暴露了公司的疲软竞争力。

OpenAI大佬观点
关联讨论 3 条X:Rohan Paul (@rohanpaul_ai)Bloomberg:Technology(RSS)Hacker News 热门(buzzing.cc 中文翻译)
推荐理由:Gary Marcus 独家爆料 OpenAI 考虑大幅降价,仅一句话定调“这是疲软迹象”。没有细节但切中最大悬念,降价是对竞争压力的妥协还是战略主动,值得点开保持怀疑地看。
18:59
Hugging Face:Blog(RSS)
46
PyTorch 剖析系列(二):从 nn.Linear 到融合 MLP

本部分将手写 matmul-add 对替换为 nn.Linear(bias=True),堆叠三层 Linear 与激活函数构成多层感知机(MLP)块,在 NVIDIA A100 GPU 上剖析。Profile trace 显示 nn.Linear 内部调用 aten::addmm,将 bias 加法作为 epilogue 融合进矩阵乘法核,避免额外 HBM 访问;transpose 操作(aten::t)仅改写 CPU 端张量元数据(shape 和 stride),不启动 GPU 核。

Hugging Face教程/实践部署/工程
18:30
公众号:火山引擎
48
银河证券×火山引擎:TRAE嵌入研发全流程,交付周期缩短一半

银河证券与火山引擎合作,引入TRAE企业版并推进SDD(规格驱动开发)范式,将AI Coding嵌入研发全流程。研发需求交付周期缩短1/3至1/2,AI代码采纳率最高达87%,前端UI还原度稳定在90%以上(H5/Vue页面达98%以上)。子账户与融券系统重构周期从4个月压缩至2个月,Bug率降低25%,单元测试覆盖率提升30%,券池规模扩大10倍,服务客户量扩大20倍。通过MCP集成打通Ones、GitLab、DevOps等工具链,组织级Skill库减少60%手写测试工作量。TRAE企业版已覆盖银河证券100个研发席位,累计培训超130名研发人员。

MCP/工具教程/实践编码
09:45
Gary Marcus:The Road to AI We Can Trust(RSS)
56
也许 Section 230 终究不能为 AI 公司提供责任豁免

德国一项新裁决启发了颠覆性思路:Section 230 可能无法再保护 AI 公司免于承担法律责任,或将彻底改变行业规则。

大佬观点政策/监管
关联讨论 3 条The Decoder:AI News(RSS)Hacker News 热门(buzzing.cc 中文翻译)Gary Marcus:The Road to AI We Can Trust(RSS)
06:19
OpenAI:官网动态(RSS · 排除企业/客户案例)
45
天体物理学家用 Codex 模拟黑洞

天体物理学家 Chi-kwan Chan 借助 Codex 构建黑洞模拟程序,用于研究极端物理现象并检验爱因斯坦的广义相对论。

OpenAI教程/实践编码
04:29
OpenRouter:Announcements(RSS)
精选67
Gemini 2.5 Flash API - 定价、快速入门与提供商比较

Gemini 2.5 Flash API 支持配置思考预算(thinking budgets),用户可跨提供商进行比较,并在5分钟内完成首次API调用。

Google推理教程/实践

推荐理由:想给 Gemini 2.5 Flash 省钱调 thinking budget?这篇把各提供商的定价和配置一次说清,五分钟就能跑通第一个调用,做 API 集成的可以直接抄。
03:42
Tomer Tunguz 博客(VC 分析)
72
Anthropic Fable 模型的"玻璃天花板":最强性能与强护栏并存

Anthropic 的 Fable 模型(Claude Fable 5)推理性能翻倍,关键基准测试得分提升 10–15 个百分点,远超此前约 2 个百分点的典型进步。Stripe 借助该模型将 5000 万行 Ruby 代码库的迁移压缩至一天,数万行代码重构仅用 45 分钟。然而 Fable 施加了强护栏限制,对违规话题(如植物细胞、现代大语言模型描述、软件安全)容易触发温和提示——这是为维持系统稳定而设定的“玻璃天花板”,其下方仍有广阔探索空间。

Anthropic大佬观点安全/对齐模型发布
关联讨论 27 条公众号:卡尔的AI沃茨TechCrunch:AI(RSS)X:OpenRouter (@OpenRouter)Anthropic:Newsroom(网页)X:Perplexity (@perplexity_ai)Simon Willison 博客The Verge:AI(RSS)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Testing Catalog (@testingcatalog)X:Claude Devs (@ClaudeDevs)X:Claude (@claudeai)X:Kim (@kimmonismus)Hacker News 热门(buzzing.cc 中文翻译)X:Eric Zakariasson (@ericzakariasson)X:宝玉 (@dotey)X:Rohan Paul (@rohanpaul_ai)X:Boris Cherny (@bcherny)X:Andrej Karpathy (@karpathy)Claude Code:GitHub Releases(RSS)X:歸藏 (@op7418)The Decoder:AI News(RSS)X:Artificial Analysis (@ArtificialAnlys)X:Berry Xia (@berryxia)IT之家(RSS)公众号:数字生命卡兹克X:卡兹克 (@Khazix0918)X:小互 (@xiaohu)
00:44
Gary Marcus:The Road to AI We Can Trust(RSS)
精选59
回顾与 Steve Eisman 的访谈,以及可能的关键新闻

原文回顾了与 Steve Eisman 的最新访谈,并指出一些可能具有关键意义的新闻,未提供具体细节。

大佬观点安全/对齐

推荐理由:Gary Marcus又来给AI泼冷水了,这次他把采访和突发新闻串起来,预测‘终结如何开始’,虽然结论未必对,但反方视角总是市场最缺的清醒剂。
00:23
GitHub Blog
精选68
通过语言服务器为 GitHub Copilot CLI 提供真正的代码智能

GitHub Copilot CLI 现在可以通过安装和配置 LSP(Language Server Protocol)服务器来替代原始的暴力 grep 或反编译方式,从而获得真正的代码智能。

GitHub教程/实践编码

推荐理由:虽然只是 Copilot CLI 的一个功能指南,但用 LSP 替代 grep 带来的代码理解提升是实打实的,搞 CLI 开发的可以直接抄作业。
6月10日
14:50
公众号:千问APP(阿里)
21
千问高考志愿Agent上线,帮助考生估分选志愿

高考结束后,考生可通过千问完成志愿填报第一步:打开千问,点击首页底部【千问高考】,创建个人档案,然后跟随千问的指引选择志愿。

教程/实践
07:27
Nathan Lambert:Interconnects(RSS)
56
Claude Fable 5 与新的 AI 安全寓言

前沿 AI 系统的权力政治又向前迈进了一步。Claude Fable 5 及新 AI 安全寓言标志着这一进展。

大佬观点安全/对齐
关联讨论 27 条公众号:卡尔的AI沃茨TechCrunch:AI(RSS)X:OpenRouter (@OpenRouter)Anthropic:Newsroom(网页)X:Perplexity (@perplexity_ai)Simon Willison 博客The Verge:AI(RSS)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Testing Catalog (@testingcatalog)X:Claude Devs (@ClaudeDevs)X:Claude (@claudeai)X:Kim (@kimmonismus)Hacker News 热门(buzzing.cc 中文翻译)X:Eric Zakariasson (@ericzakariasson)X:宝玉 (@dotey)X:Rohan Paul (@rohanpaul_ai)X:Boris Cherny (@bcherny)X:Andrej Karpathy (@karpathy)Claude Code:GitHub Releases(RSS)X:歸藏 (@op7418)The Decoder:AI News(RSS)X:Artificial Analysis (@ArtificialAnlys)X:Berry Xia (@berryxia)IT之家(RSS)公众号:数字生命卡兹克X:卡兹克 (@Khazix0918)X:小互 (@xiaohu)
06:22
OpenAI:官网动态(RSS · 排除企业/客户案例)
44
Codex 为 Notion 解锁的能力

Notion 利用 Codex 一次性生成产品规格、构建面向网页的 AI 语音输入功能,并提升小团队的工程效率。

OpenAI教程/实践编码语音
05:55
Hugging Face:Blog(RSS)
精选74
将 GitHub CI 迁移到 Hugging Face Jobs

本文介绍了如何将 GitHub Actions 的 CI 作业迁移到 Hugging Face Jobs 上运行,以解决 GitHub Actions 速度慢、缺乏 GPU 支持等问题。通过使用 huggingface/jobs-actions 桥接,将 GitHub Actions 的 job 转为临时自托管运行器:GitHub App 监听 `workflow_job.queued` webhook,dispatcher Space 验证后启动对应硬件(CPU 或 t4-small、h200 等 GPU)的 HF Job,由 ephemeral runner 执行 CI 并上报结果。作者基于 Trackio 项目实际落地,CPU 作业时间减少约 30%,并新增了 GPU 测试套件。文章分步说明了复制 dispatcher Space、创建并安装 GitHub App、配置 webhook 和 HF_TOKEN 的具体步骤。

Hugging Face教程/实践部署/工程

推荐理由:HF 直接把 CI 桥接器开源了出来,教你把 GitHub Actions 迁到 HF Jobs 上跑 GPU 测试,ML 项目终于可以低成本配上显卡 CI,步骤清晰到能直接抄作业。
04:21
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选55
Nextdoor 工程师借助 Codex 与 GPT-5.5 无限制构建

Nextdoor 工程师利用 Codex 搭配 GPT-5.5 调查难以复现的问题、实现跨平台构建,并集中精力于产品成果。

OpenAI教程/实践编码

推荐理由:Nextdoor 用 Codex + GPT-5.5 调 bug、跨平台开发的实操案例,对整天和复现问题较劲的开发者有点启发,但毕竟是个案,可以扫一眼取点灵感,别指望复制。
02:40
Gary Marcus:The Road to AI We Can Trust(RSS)
39
The revenge of Claude Mythos
Anthropic大佬观点
02:09
Ethan Mollick:One Useful Thing(RSS)
精选66
Claude Fable 发布:Anthropic 带来的另一种推理体验

Anthropic 发布 Claude Fable,这是一款提供截然不同推理体验的 AI 模型。它擅长规划与生成复杂代码库,在需要精确构建代码结构或理解程序员深层需求的场景中,其表现相比 Claude Sonnet 有了大幅提升。用户描述与它协作更像与一位直觉敏锐的资深工程师合作,其对代码意图的捕捉和方案生成能力令人惊叹,但并非通用型 AI。

大佬观点现象/趋势

推荐理由:Ethan Mollick 把和 AI 协作的真实手感写透了,这篇不讲 benchmark 只讲直觉,但直觉比参数更能告诉你下一个跳跃是什么。
00:18
GitHub Blog
精选68
GitHub Copilot CLI 推出自定义 AI 智能体,将一次性终端提示转化为可重复工作流

GitHub Copilot CLI 新增自定义 AI 智能体功能,使 CLI 能够理解开发者的技术栈和团队工作流,将一次性终端提示转变为可重复、可审查的流程。

智能体GitHub教程/实践编码

推荐理由:GitHub Copilot CLI 的自定义代理把一次性提示变成可重复工作流,相当于给命令行配了个 AI 副驾驶,做自动化的朋友值得一试。
00:00
OpenRouter:Announcements(RSS)
精选72
Gemini 2.5 Flash API:定价、快速入门与提供商对比

Gemini 2.5 Flash API 的定价与快速入门指南,指导用户配置 thinking budgets、比较不同提供商,并在 5 分钟内完成首次 API 调用。

Google教程/实践部署/工程

推荐理由:OpenRouter 这篇把 Gemini 2.5 Flash 的 quickstart 和供应商价格表打包了,5 分钟跑通,价格对比部分尤其实在,想省钱的可以对着选。
6月9日
21:39
Cloudflare Blog
51
对抗前沿网络模型:Cloudflare 作为"客户零"的架构实践

Cloudflare 在 Project Glasswing 一文中提出,漏洞周围的架构比补丁速度更重要。本文详细阐述了这一架构的设计、它防御的威胁类型,以及 Cloudflare 如何以自家产品作为“客户零”(customer zero)来实际运行这套防御体系。

安全/对齐部署/工程
19:55
Hugging Face:Blog(RSS)
精选76
一个Agent如何通过链式调用两个HuggingFace Space构建3D巴黎画廊

一个编码Agent调用HuggingFace上的两个Space,从零构建了展示巴黎地标3D高斯散点图的交互式画廊。Agent先用ideogram-ai/ideogram4生成每个纪念碑的黑色背景图像,再通过VAST-AI/TripoSplat从单张图像重建3D高斯散点(.ply),自动完成坐标系校正、取景、压缩为.ksplat(体积缩小约3倍),并构建基于Three.js的滚动切换、拖拽旋转查看器,最终部署为静态Space。整个过程无需客户端库,每个Space通过`agents.md`暴露可调用API。

智能体Hugging FaceMCP/工具多模态

推荐理由:Hugging Face 把 agents.md 做成每个 Space 的标准说明书,agent 能直接读懂并链式调用图像和 3D 模型,这篇用 3D 巴黎画廊 demo 告诉你这事儿已经跑通了,做 AI 工具链的可以立刻照着试。
17:55
Hugging Face:Blog(RSS)
精选68
NeuroBait:微调AI助手,为ADHD大脑点燃多巴胺火花

NeuroBait是基于Google gemma-3-12b-it微调的AI对话助手,旨在帮助ADHD患者克服“知道该做什么但无法开始”的执行功能障碍。采用16-bit LoRA(r=16, alpha=16)在Unsloth上训练3个epoch,学习率2e-4,最大序列长度2048,使用单张H100 80GB GPU。数据集为基于真实ADHD场景手工合成的少量数据。部署于Hugging Face Space(ZeroGPU),使用Gradio和标准transformers+peft,运行时以4-bit NF4加载基础模型并应用LoRA适配器。NeuroBait不生成待办清单,而是根据用户上下文给出3-6句温暖流畅的回复,引导用户找到一件微小可立即执行的动作,从而激发多巴胺、降低启动阻力。

Hugging Face教程/实践数据/训练

推荐理由:对ADHD群体来说,这是一次真正从需求出发的AI尝试。它不做计划列表,而是用一个温暖的动感火花打破僵局,让AI从理论走向陪伴。如果你或身边人容易'卡住',可以试试这个Space。
17:40
公众号:通义实验室(千问)
精选67
仅凭一份文档,Qwen3.7-Max 从 0 交付双端应用

在无设计稿和后端代码的条件下,Qwen3.7-Max 仅凭一份约 15 万字的产品调研文档,于隔离环境中全自动完成移动端与 Web 端两套真实应用从 0 到 1 交付,单端耗时约 4 小时,中途无人工接管。模型不具备图像理解能力,通过像素坐标反推布局约束实现界面还原。实验采用“分阶段注入约束→逐层验收→带错纠正”的闭环控制系统:任务拆分为规划、架构、编码等阶段,验收覆盖静态检查、编译自检(0 error)、路由完整性(Web 端 34 条路由全部可达)、功能扫描及真机冷启动冒烟。失败时错误文本自动注入下一轮重试,使模型数小时内收敛。移动端产出可安装 APK,Web 端 typecheck 与构建均通过。

智能体教程/实践部署/工程
关联讨论 1 条X:阿里云 / Alibaba Cloud (@alibaba_cloud)
推荐理由:通义实验室没有炫技分数,而是把 Agent 逼到了长程交付的极限,约束闭环这套方法论比模型本身更值钱,所有做 Agent 开发的都该读一遍。
04:46
OpenAI:官网动态(RSS · 排除企业/客户案例)
精选56
OpenAI 公布让 AGI 造福所有人的计划

OpenAI 发布计划,阐述让 AGI 造福所有人的愿景。该计划聚焦于 AI 的可及性、安全性和共享繁荣,确保技术进步惠及每个人。

OpenAI大佬观点安全/对齐
关联讨论 1 条X:Sam Altman (@sama)
推荐理由:这份计划是 OpenAI 对“AGI 公益”的例行布道,提供了解其高层思维的窗口,但建议别指望找到产品路线图。
03:38
Gary Marcus:The Road to AI We Can Trust(RSS)
34
Gary Marcus:整个AI行业被疯狂的数学所支撑

Gary Marcus 在博文中引用“幻想之地”的比喻,指出整个 AI 行业建立在不合理的数学基础之上。

大佬观点现象/趋势
02:15
Dwarkesh Patel:Podcast & Blog(RSS)
精选69
样本效率黑洞:AI能力背后隐藏的数据需求深渊

将AI比作一个闪耀着能力的星系,其核心存在一个肉眼不可见的巨大黑洞——数据。这个比喻揭示了AI模型惊人能力背后对海量数据的依赖,样本效率的瓶颈如同引力中心,将各色能力凝聚在一起。

大佬观点数据/训练

推荐理由:「我们见到的 AI 如星河璀璨,但中心却是个看不见的、有着不可思议质量的样本效率黑洞」——这个比喻把 scaling law 背后被忽视的真相撕开给你看,做模型训练的人该读一读。
00:41
Tomer Tunguz 博客(VC 分析)
精选56
AI 替代浪潮:三大力量重塑成本结构

三大力量重塑 AI 成本:前沿闭源模型持续涨价,开源模型在多数场景已足够好,买家开始替代。Coinbase 将提示词路由至更便宜模型,成本持平但 token 用量指数增长。Lindy 全切至 DeepSeek v4,节省数百万美元且多项核心性能提升。Harvey 在 Legal Agent Benchmark 上通过 SFT 使 Kimi 2.6 all-pass 率达 15%,超越 Opus 的 14%,同一 100 任务成本 $84 vs $954(约 11 倍价差)。Cursor 后训练 Kimi K2.5 得到 Composer 2.5,称其“性能优异且效率高达同类模型 10 倍”。闭源越来越贵,开源平价且性能接近,选择决定企业单位经济学的斜率。

AnthropicDeepSeek开源生态推理

推荐理由:Tunguz 用 Coinbase、Lindy 等真实案例,把「用开源/便宜模型替代昂贵前沿模型」的趋势讲透了,做 AI 应用的人该重新算一下单位经济账。
6月8日
21:50
Hugging Face:Blog(RSS)
精选57
五个模型经济体中消失的崩溃:控制与涌现

用五个不同实验室的AI模型(OpenAI、NVIDIA、OpenBMB及一个自微调的5亿参数模型)各自驱动一个智能体构建经济市场,试图复现此前单一模型下出现的银行挤兑式价格崩溃。结果同一场景下模型不仅不抛售反而囤积,导致价格不跌反涨。通过纯谣言、库存泛滥、加大做空三种方式均无法重现崩溃。最终在结算环节直接覆盖价格,使崩溃成为设计事实。实验表明,AI智能体的涌现行为是偶然的而非稳健的,有效系统需在涌现纹理与确定性控制之间找到精确接缝。

智能体大佬观点

推荐理由:做 agent 的人必读,自己动手构建一个多模型经济体后才发现,涌现行为脆弱,控制要卡在结算层而非输入层,廉价模拟器会给你虚假信心。这篇复盘比成功案例更值钱。
20:00
OpenRouter:Announcements(RSS)
精选63
OpenRouter Agent SDK 推出 HITL 工具:满足 EU AI Act、Colorado ADMT 与 NIST AI RMF 合规要求

OpenRouter 的 Agent SDK 新增人类参与循环(HITL)工具,用于 AI 智能体的合规监督。该工具可帮助 AI 智能体满足欧盟 AI 法案、科罗拉多州自动化决策技术法(SB26-189)以及 NIST AI 风险框架(NIST AI RMF)的监管要求。

智能体安全/对齐教程/实践
关联讨论 1 条OpenRouter:Announcements(RSS)
推荐理由:欧盟AI法案的人类监督要求终于有现成方案了,OpenRouter这个教程把合规从法条翻译成具体代码,做Agent出海的产品经理可以拿来就用。
19:50
Hugging Face:Blog(RSS)
精选74
Pakistan Notice Helper:一款面向本地安全问题的轻量 AI 工具

Pakistan Notice Helper 是一款安全工具,帮助巴基斯坦用户在点击链接、拨打电话、分享 OTP 或支付前识别可疑消息。它接受文本或截图输入,返回风险等级、简短解释、可见警示标志和安全下一步建议。工具支持英文和乌尔都语,乌尔都模式采用从右向左布局并全界面翻译。最终部署选用 Qwen3.5 4B Q8 模型(通过 llama.cpp + CUDA),在 10 个测试用例中通过了所有高风险诈骗和截图场景。此前曾测试 Qwen3.6 27B(质量高但成本高)和 MiniCPM-V 4.6 Q8(速度慢且不稳定),最终选择了精度、速度和成本平衡的 4B 模型。项目受限于 hackathon 的 32B 模型上限规则。

Hugging Face多模态教程/实践

推荐理由:一个只有4B的小模型,把巴基斯坦本地诈骗文案分析得明明白白,比那些参数大但看不懂乌尔都语的通用模型实用得多。做给特定地区特定问题的小工具,这才是AI落地的真节奏。
‹ 上一页
123…10
下一页 ›