StepAudio 2.5 Realtime是一款实时语音模型,能够深度理解用户语音中的语气、语速、停顿乃至微表情等副语言特征。它支持通过API接入自定义人格,允许设定个性、背景故事和语言风格,并提供了上万种原生人格选项,可组合出数百万种特征。产品还内置了5个可直接体验的预设人格,并经过RLHF调优,确保在复杂的角色扮演压力测试中也能保持角色一致性。该模型支持中文和英文。
关联讨论 1 条X:阶跃星辰 StepFun (@StepFun_ai)StepAudio 2.5 Realtime是一款实时语音模型,能够深度理解用户语音中的语气、语速、停顿乃至微表情等副语言特征。它支持通过API接入自定义人格,允许设定个性、背景故事和语言风格,并提供了上万种原生人格选项,可组合出数百万种特征。产品还内置了5个可直接体验的预设人格,并经过RLHF调优,确保在复杂的角色扮演压力测试中也能保持角色一致性。该模型支持中文和英文。
关联讨论 1 条X:阶跃星辰 StepFun (@StepFun_ai)CODEX LIMITS ARE FIXED!
Official today: Squidler is in @Replit MCP library. Build with #Replit. Test with Squidler. Replit Agent builds, Squidle...
Codex computer use entirely driving iphone simulator to bug bash a feature it just built
Superset (YC P26) 发布了一个面向智能体时代的集成开发环境(IDE),专为AI智能体开发提供优化工具。该项目在GitHub上开源,于2026年5月22日在Hacker News上以“Launch HN”形式推出,迅速获得100个点赞,显示社区对智能体时代开发平台的关注。IDE旨在适应AI发展趋势,提升智能体开发效率。
微星近日发布了 MAG 346CQDF E20 电竞显示器。它采用一块 34 英寸 1500R 曲率 Rapid VA 面板,核心特色是支持双模切换:在 UWQHD(3440×1440)分辨率下最高刷新率为 200Hz,而在 1720×720 分辨率下可达 400Hz。该显示器具备 0.5ms 灰阶响应时间、300nit 亮度、4000:1 对比度,色域覆盖达 95% DCI-P3。功能方面,它集成了智能准星、视觉增强、超低动态模糊等 AI 游戏技术,并提供包括 DisplayPort 1.4a 和 HDMI 2.0b 在内的多种接口。
BREAKING: Here is a sneak peek at Grok's new Memory Settings. Grok remembers everything about you now and you can view a...
DeepSeek 宣布其API完成输出提速与服务扩容,服务更加稳定,默认支持500个并发同时在线,企业用户可申请更高并发。同时,DeepSeek-V4-Pro模型API价格将于2026年5月31日优惠结束后调整为原定价的1/4,具体价格调整为:输入(缓存命中)0.025元/百万Tokens,输入(缓存未命中)3元/百万Tokens,输出6元/百万Tokens。
http://x.com/i/article/2057775296712196096
大众汽车(安徽)有限公司于5月23日发布新款与众06,推出Pure与Pure SE两款配置,限时权益价分别为13.49万元和14.49万元。新车外观变化不大,但在内饰、配置、动力及续航方面全面升级,搭载60kWh电池,CLTC续航528公里。智能座舱配备联发科8676芯片、全新VW OS系统及智谱清言大模型;智能驾驶提供纯视觉与激光雷达两种方案,支持高速NOA领航辅助及跨层泊车等功能。
OpenAI于5月23日宣布为ChatGPT新增“AI填表”功能。用户上传表单图像后,可通过语音或文字指令描述需填写内容,系统将自动识别表单字段并完成信息补全。该功能整合了图像理解、语音交互与内容生成技术,实现“对话式”自动填写。目前输出为静态图片而非可编辑文档,且对上传文件清晰度有一定要求。
v2.1.150版本包含内部基础设施优化。此次更新主要聚焦于后台系统的改进,未引入任何用户可见的功能、界面或体验变更。
广汽集团与华为乾崑联合打造的高端智能新能源品牌“启境汽车”宣布,其首款车型启境GT7将于5月29日正式开启预售并公布售价,计划于6月上市交付。新车定位中大型智能猎装轿跑,搭载华为乾崑智驾ADS 5系统,配备896线双光路激光雷达。其基于800V高压平台,三电机版0-100km/h加速仅需2.98秒;采用与宁德时代联合定制的麒麟电池,最大容量102.768kWh,CLTC最高续航900km,并支持6C超充。
雷鸟创新(RayNeo)推出旗舰级影音AR眼镜系列——雷鸟GT,将于5月27日联合TCL好莱坞中国剧院正式发布。该系列定位专业影视级体验,GT Max型号将视场角提升至59%,等效6米267英寸巨幕效果。它搭载新一代Micro-OLED屏、首颗AR画质芯片Vision 4000及自研空间计算芯片Zone 360,成为全球首款支持杜比视界的AR眼镜套组,并集成3DoF空间悬停功能。音频方面与B&O联合调校,引入硬件级空间音频。产品在集成高性能的同时,将重量控制在78g。同期发布的还有雷鸟V4 AI拍摄眼镜。
DeepSeek已将其V4 Pro API的临时75%降价转为永久性调价。新定价下,输入、输出及缓存输入价格均大幅降低,混合均价约为每百万token 0.18美元。根据测算,以新价格运行V4 Pro的综合成本仅约268美元,成本优势显著:约为Gemini 3.1 Pro Preview的三分之一,GPT-5.5的十二分之一,以及Claude Opus 4.7的十九分之一。此次调价使V4 Pro在“智能指数”与“运行成本”的帕累托前沿上占据了极具竞争力的位置。
开源GEO系统GEOFlow 2.0发布,一个月内GitHub星标超1.6k。此次关键版本升级,使其从内容生产工具演进为“GEO内容工程基础设施”。核心变化包括基于Laravel重构,实现多站点与多Agent管理;强化AI知识库与向量化检索;新增统一的数据分析页面,构建运营闭环。系统旨在帮助用户持续建设“可信内容资产”,并秉承“利他就是利己”的开源理念。
经过一个月的持续迭代,第一套GEO系统"GEOFlow 2.0"正式上线,GitHub地址见文末 一个月前,GEOFlow 1.0 上线,到现在,刚好过去一个月,Star数已经超过1.6k,这一个月来,收到了不少朋友的反馈和落地实践案例 这...
Meet Colin, Lexi, and Gizmo. One is part of Gradium's GTM team. One is his dog. And one is the AI assistant he built him...
近期发布了开源数据库Models.dev,专门收录人工智能模型的各项规格、定价及功能信息。该项目在GitHub公开,便于开发者查询和比较不同AI模型。其在Hacker News社区获得101点关注度,显示出技术社区对这类集中化、透明化的模型信息资源的较大兴趣。
YC P26孵化初创公司Runtime正式推出其沙箱式编程代理产品,旨在为团队所有成员(包括开发者和非技术角色)提供安全的代码执行环境。该产品在Hacker News上获得100个点数,目前已上线并可通过其官网访问。
Anthropic推出的AI网络安全合作项目Project Glasswing在首月便取得惊人成果:与合作伙伴共同在核心生产软件中发现超过一万条高危或关键级漏洞。这一成果远超传统安全团队年度挖掘数百个漏洞的水平。Anthropic表示,未来的Claude模型将持续加速漏洞挖掘进程,软件行业将面临海量漏洞的持续发现与修复压力,必须适应新的安全常态。
Last month we launched Project Glasswing, our collaborative AI cybersecurity initiative. Since then, we and our partners...
谷歌宣布Gemini应用月活用户已突破9亿。在此次更新中,Gemini正从工具演变为更主动的个人AI代理。主要更新包括新一代模型Gemini 3.5 Flash、全新的“Neural Expressive”设计语言,以及能将提示转化为高质量视频的Gemini Omni模型。核心亮点是两项代理功能:“Daily Brief”提供个性化每日简报,“Gemini Spark”则作为24/7的个人代理,在用户授权下主动管理任务与数字生活。这些更新标志着AI助手向更主动、更整合的方向发展。
A walkthrough of what PINOC does: 🧵 1. Upload a motion video, get clean skeletal animation. Export as .fbx/.glb, ready ...
本次 v2.1.149 更新包含功能增强、企业设置和多项修复。新增 `/usage` 命令的使用量分类显示功能,可区分技能、子代理、插件及每个 MCP 服务器的消耗;`/diff` 详情视图支持键盘滚动;Markdown 输出兼容 GFM 任务列表。企业版新增 `allowAllClaudeAiMcps` 设置以加载云 MCP 连接器。修复了 PowerShell 权限绕过、Git 工作树沙盒写入白名单越界、脚本路径含空格时 `otelHeadersHelper` 静默失败等安全问题。改进了 `/feedback` 报告,包含上下文压缩前的对话内容,便于排查长会话中的早期问题。
开源看板桌面应用KanBots正式发布,其核心功能是允许用户在每张看板卡片上运行并行代理。该应用旨在通过AI代理自动化任务流程,提升项目管理效率。项目在Hacker News社区获得102个点赞,展现了开发者社区对AI辅助工作流工具的浓厚兴趣。
Cerebras在其晶圆级芯片上实现了每秒981 tokens的推理速度,处理参数规模达1万亿的Kimi K2.6模型。该速度已获Artificial Analysis验证,是当前最快GPU云方案的6.7倍。其技术优势源于单一晶圆集成设计,大幅减少了芯片间通信延迟,从而突破了传统GPU集群因跨芯片数据搬运造成的性能瓶颈。这一速度提升对需要运行企业级编码代理等大型AI应用至关重要,能显著缩短测试、调试与迭代周期。
X Premium会员现已支持Openclaw、Opencode和Hermes的直接授权登录功能。这意味着会员可以使用Grok的配额来驱动这些产品,从而扩展服务的应用场景。Grok因其强大的功能尺度,能够处理多样化的任务,为用户提供了更多操作可能性。这一更新增强了X Premium会员的服务范围和使用体验,被视为重大利好。
🚨 "SuperGrok" subscribers will get access to Grok Build (Beta) soon! (Currently, only the "SuperGrok Heavy" subscribers...
OpenAI发布了ChatGPT的PowerPoint测试版插件,该插件可将笔记、文档或图片直接转化为演示文稿,并支持编辑现有幻灯片。此插件已在全球范围推出,所有用户层级均可使用。OpenAI同时提示用户在操作前保存重要演示文件,以避免插件可能造成的意外内容删除风险。
You can also connect to inference endpoints that follow the OpenAI Chat Completions API. This includes @OpenRouter, @Lit...
OpenAI为其编码助手Codex发布了名为Appshots的新功能。该功能面向Mac用户,允许他们通过一键操作,将当前任意应用程序窗口的内容(包括代码、文档或界面信息)直接发送给Codex。这使得Codex能够获取更精确、更实时的任务上下文,从而提升协助编写、修改或理解代码的效率和准确性。