AIHOT

全部动态资讯 · 1325 条

6月4日周四

6月4日

21:42

Hugging Face：Blog（RSS）

精选75

Nemotron 3.5 ASR 是一个 600M 参数的多语言流式语音识别模型，单个检查点覆盖 40 种语言-地区（含英、西、德、法、意、日、韩、中、阿拉伯等）。采用 Cache-Aware FastConformer 编码器与 RNNT 解码器，缓存内部状态避免重复计算，实现低延迟流式转录且不损失精度。模型原生输出带标点和大写的生产级文本，无需后处理。支持指定语言（target_lang=es-ES）或自动语言检测（target_lang=auto）。通过注意力上下文大小（att_context_size）可在推理时直接调节延迟-准确率权衡，范围从 80ms 到 1.12s，无需重新训练。模型以 NeMo 检查点形式发布，可用于微调以适配特定语言、领域或口音。

教程/实践语音

推荐理由：一个模型搞定40种语言的实时语音转文字，NVIDIA还给了完整微调代码和实测数据，做语音Agent和字幕的可以照着抄作业。

21:09

The Verge：订阅版科技（RSS）

《The Verge》呼吁在线平台提供AI内容过滤选项

在线平台本可通过提供AI内容过滤选项来检验AI标签是否有效，但它们拒绝这样做——因为一旦开放过滤，它们将不得不面对现实。

GoogleMeta现象/趋势

21:07

公众号：百度智能云（文心）

百度伐谋助力北京工业大学攻克三大科研难题

北京工业大学苗扬团队借助百度伐谋（全球首个可商用自我演化决策智能体），在三个高可靠性科研场景实现突破：空间站色谱柱构型优化中，72小时演化出新构型，归一化误差降低8.17%，体积缩小40%，分离效率提升3倍；PEM电解槽故障检测准确率从92.26%提升至95.04%，综合评分升至0.9383，建模周期从数天压缩到小时级；旋转机械故障诊断准确率从98.9055%提升至99.9877%，预测误差降至原来1%，参数量下降34%。科研人员用自然语言描述目标和约束，伐谋自动演化逼近全局最优解。

智能体教程/实践

21:00

公众号：昆仑万维（天工）

精选64

SkyClaw-v1.0 深度实测：Agent专属模型，顶尖性能表现，极致价格优势

5月26日，昆仑万维发布SkyClaw-v1.0，定位面向复杂工具使用和真实世界任务执行的高性能Agent模型，输入仅0.5元/百万token、输出4元/百万。实测显示，其从零生成番茄钟和记账本应用时，能自主用Web Audio API合成音效、用SVG手绘图表，细节处理成熟。在现有代码库修改任务中，越难的任务表现越好：单点bug修复精准，能准确诊断iOS Safari滚动问题并给出克制式修复方案。但官方未报告SWE-bench成绩，表明其优势集中在从零生成与模式匹配场景，而非大型仓库精确修改。极致低价使其在批量Agent任务与快速原型生成上性价比突出。

智能体编码评测/基准

推荐理由：这篇实测把SkyClaw的「从零生成」和「老项目修改」摊开了揉碎了测，不看广告看疗效，让我看清Agent模型的分化到底意味着什么——便宜好用但有边界，想省钱做小工具的你值得细读。