理想汽车产品线负责人汤靖表示,自L9 Livis发布后,“几乎看不到说‘理想没技术’的观点了”。该车搭载三大技术:首个“完全体”线控底盘(含EMB线控机械制动)、行业首款5nm车规级AI芯片马赫100(算力2560TOPS,号称是英伟达Thor-U的3倍)及800V全独立主动悬架。新车售价50.98万元。
理想汽车产品线负责人汤靖表示,自L9 Livis发布后,“几乎看不到说‘理想没技术’的观点了”。该车搭载三大技术:首个“完全体”线控底盘(含EMB线控机械制动)、行业首款5nm车规级AI芯片马赫100(算力2560TOPS,号称是英伟达Thor-U的3倍)及800V全独立主动悬架。新车售价50.98万元。
文章围绕“下个词预测”技术,探讨了其在当前与未来的可能影响及面临的局限性。它提出了一个核心问题:这一技术将把我们带向何处。
一名开发者分享了利用AI编程,快速开发的一个Chrome新窗口(或新标签页)插件。该插件整合了番茄钟、音乐播放、Todo、便签、天气、换背景等多款独立开发者常用工具。功能上支持直接进行谷歌搜索,并能跳转至ChatGPT官网发送预设提示词;同时支持通过Command + K快捷键唤起,实现快速设置与搜索。该项目已开源。
Google其实比OpenAI更早做MoE。 我们专访到了Gemini前核心科学家Andrew Dai。Andrew回忆,Google Brain在 2021 年就已经做出了比GPT-3更强的MoE大模型GLaM,PaLM 2甚至在2023...
面壁智能联合清华大学与OpenBMB开源社区发布了ForgeTrain框架。该框架是全球首个完全由AI编写、零人类代码介入的生产级大模型训练框架。面壁智能已使用ForgeTrain在华为昇腾芯片上完成了其新一代「小钢炮」模型MiniCPM5-1B的预训练,其综合性能在AA榜单上位列2B规模以下Top 1。ForgeTrain框架代码及用于制造该框架的Agent Harness工具链已完全开源。
关联讨论 1 条IT之家(RSS)一种提升Codex表现的方法是让其自动从用户交互中学习。具体做法是让Codex扫描本周的对话记录,由AI提炼用户的开发经验与审美偏好等信息,并将其写入Skill(技能)中。这个过程可以让Codex持续、自动地更新其能力。参考案例显示,有开发者借此实现了其Skill waza的每周无痛更新,从而使工具“越来越聪明,越来越懂你”。
如何让你的Codex变的越来越聪明,越来越懂你? 上周跟 @HiTw93 直播时,很多人可能没注意他的一段话,他说他的开发Skill waza,每周都能无痛更新。 因为他会让Codex扫描本周对话记录,让AI提炼他的开发经验、审美偏好并写入...
everyone in ai infrastructure* is finally getting filthy rich and it is so nice to see them succeed *not the sexy ai res...
iPhone 上直接用 App Store 下载就行: 👉 Bonsai Studio - PrismML 官方 iOS 应用,免费安装,模型在手机本地跑 我觉得给学校老师做一些素材展示,或者幼儿园小朋友教学还是可以的。 不需要额外的TO...
近日OpenAI的AI智能体Codex热度飙升。教程涵盖完整使用流程:从官网下载安装,支持从Claude Code和Cowork一键导入配置;界面分对话区和项目区,权限可选默认、自动审查或完全访问;模型推荐GPT-5.5,推理等级用高或超高,速度可选快速(1.5倍速度、2倍token消耗)或标准;建议开启引导模式、记忆功能,并设置全局AGENTS.md规则(卡帕西模板);通过Skills和插件管理扩展能力;演示了开发网页(使用计划模式、批注功能圈选修改)和开发用药提醒App(需安装Xcode编译到手机)。
Anthropic 基于 Claude AI、Claude Code 和 Claude Cowork 的工程实践,系统总结了构建安全 AI 智能体的经验。核心原则是防御应随智能体能力演进,并优先使用沙箱来限制破坏性动作。文章详述了三层防御架构(环境层、模型层、外部内容层)及三款产品的隔离模式:Claude AI 使用短暂容器,Claude Code 采用人机协同沙盒,Claude Cowork 则部署密封虚拟机。关键数字包括:Claude Opus 4.7 在 Gray Swan Agent 红队基准上单次攻击成功率约 0.1%,100 次尝试后约 5-6%;Claude Code 自动模式拦截约 83% 的过度积极行为。通过真实攻击案例,强调了环境层防御(如出站阻断)的关键性。
New on the Engineering Blog: The access and permissions we grant agents should evolve with their capabilities. In our ow...
@dotey 宝玉老师,有没有比较好的skill管理工具推荐
PrismML发布官方iOS应用Bonsai Studio,用户可免费下载,在iPhone上本地离线运行其Bonsai Image 4B扩散模型。该模型基于FLUX.2 Klein,其1-bit压缩版仅0.93GB,比全精度版小8.3倍。在iPhone 15 Pro及以上机型生成512×512图像耗时约几十秒,内存占用约1.5GB。应用支持多种风格,但中文文字生成目前为乱码。Android用户可通过WebGPU网页版体验。
兄弟们,端侧生图模型又有新东西了! 之前有客户端Drawthing 客户端也是支持iPad 手机进行文生图~ 今天PrismML也来了一个好玩的... 他们发布了1-bit和Ternary版本的Bonsai Image 4B扩散模型。 1-...
文章指出,只有具备明确、可程序自动验收标准的Skill才能有效自我进化,例如优化代码性能。微软等机构提出的SkillOpt框架,通过让AI评估并迭代优化Skills,使GPT-5.5直接对话准确率提升23.5分。其核心机制是每次编辑需在验证集上得分提升才能合并,并引入学习率预算。论文主张Skill应作为外部状态被系统性“训练”,这标志着提示词工程与模型训练界限的融合。
什么?! skill 也能"训练"了? 以往大家都是凭经验让AI写 skill, 然后调试的时候也是运行几下感觉没bug就完事了. 但 skill 能运行就一定好吗? 于是微软联合上交复旦同济等机构发了一个新框架 SkillOpt, 直接让...
`curl`项目正面临前所未有的压力,原因是大量AI辅助生成的安全漏洞报告涌入。当前报告接收速度是2024年的4-5倍,是2025年的两倍,平均每天超过一份。报告的质量和详细程度远超以往,导致维护者工作时间显著增加。好消息是`curl`软件本身非常稳固,近年来发现的漏洞严重程度多为LOW或MEDIUM,最近一次severity HIGH的CVE发布于2023年10月。
I recently put together a 50-state legal research workflow in Codex. This is the kind of work that a team of associates ...
开发者 AlexFinn 在连续两个月、每天数小时并行使用 Codex 和 Claude Code 后,决定转向 Codex。其核心原因在于 Codex 拥有强大的自测闭环功能:每次代码改动后,它会在内置浏览器中自动验证,形成“改→测→修”的自动化循环。这一机制将首次交付有 bug 的改动比例从约 40% 显著降低至 ≤3%,可靠性大幅提升,更利于开发者保持心流。他建议开发者不要对任何公司忠诚,应始终使用当下最好的工具。
I'm 100% Codex pilled now Been using Codex and Claude Code side by side hours a day for 2 months straight No longer usin...
Google Gemma团队开源了AIventure项目,这是一款地牢爬行游戏。玩家可以向游戏中的NPC输入提示词,AI会实时构建可运行的Web应用。AI核心由Gemma 4驱动,负责理解指令、规划步骤并生成代码。项目将智能体工作流与氛围编程融入游戏,是面向开发者的实操大师课,从游戏设计到智能体集成均已开源。
Gemma 4 meets retro gaming! 🕹️✨ Introducing AIventure: an open-source dungeon crawler designed as a developer mastercla...
介绍如何使用基于 Qwen3、参数规模为 4B 的交叉编码器重排器 Zerank-2 Reranker 构建检索-重排流水线。该流水线先通过快速双编码器检索候选文档,再由 Zerank-2 进行重排以提升检索精度。
Anthropic披露三种Claude隔离架构,发现93%权限弹窗被无脑通过,因此转向容器化隔离以限制智能体能力边界。阿里通义AgentScope 2.0升级至生产级,涵盖模型重试容错、三级权限判断系统和结构化上下文管理,其Workspace抽象支持多执行环境无缝切换。腾讯云提出上下文卸载方案,配合Mermaid图谱,将超长Session的Token消耗降低61%,任务通过率提升52%。三者共同指向智能体工程落地的关键:可靠的隔离边界、稳定的容错机制以及高效的状态管理。
早报聚焦Agent系统工程,介绍三篇实践。Anthropic披露Claude的三种隔离架构,并指出93%权限弹窗被无感通过。阿里AgentScope 2.0将调试升级为涵盖权限边界、容错机制的生产级系统工程。腾讯云通过上下文卸载与Mermaid结构化图谱,将超长Session的Token消耗降低60%,任务通过率提升52%。三者共同强调,Agent时代的核心在于支撑稳定运行的工程基础。
Stack Overflow 上月新提问量降至 6866 个,与 2008 年上线时持平,受 ChatGPT、Cursor、Claude 等 AI 编程助手冲击。然而公司年收入翻倍至 1.15 亿美元,亏损收窄。增长源于两方面:将社区数据转化为企业知识库产品,已有 2.5 万家公司使用;并将数据授权给 AI 公司用于模型训练。CEO 指出,消失的多是简单问题,复杂问题仍会流向平台,而这正是大模型训练所需的高质量数据。一个隐忧是,这可能导致一个循环:用户流向 AI,AI 依赖旧数据,但新的高质量问答数据却不再产生。
@madiator Death by LLM
It took me like 2 months, but I've grown to love gpt-5.5. You have to prompt entirely different and put some time into y...
Today we're releasing DeepSWE, a new standard for agentic coding benchmarks. On public leaderboards, top models often lo...
Google 发布了其多模态模型 Gemini Omni 的视频生成功能使用指南。该模型可通过 Gemini 应用、Google Flow 等平台体验。指南包含五项提示词技巧:利用模型已有的现实世界知识进行简洁描述;精确控制文本在视频中的渲染与排版;使用专业镜头指令(如推拉摇移)像电影摄影师一样调度画面;通过迭代编辑高效修改视频;以及在生成中直接调整角色的动作节奏或情绪。其核心在于通过精准的提示词引导模型生成复杂且可控的视频内容。
关联讨论 11 条X:Gemini (@GeminiApp)Google DeepMind:Blog(RSS)X:Demis Hassabis (@demishassabis)X:Google DeepMind (@GoogleDeepMind)X:Berry Xia (@berryxia)X:Ethan Mollick (@emollick)X:Sundar Pichai (@sundarpichai)Hacker News 热门(buzzing.cc 中文翻译)X:阿易 AI Notes (@AYi_AInotes)IT之家(RSS)X:Google AI (@GoogleAI)// Language Models Need Sleep // Let your agents "sleep", folks. On a serious note, this is a fascinating paper on getti...
社交媒体平台上的帖子内容正变得越来越相似。这种趋同现象可能意味着大量内容正在被AI生成或同质化处理,引发了人们对于内容原创性与人类独特视角的讨论。
推文对比了AI智能体在安全领域的应用。Anthropic的Mythos智能体在真实curl代码库中发现了1个漏洞。而来自中国的360安全团队的漏洞挖掘智能体,在更广泛的OpenClaw生态中独立发现了23个漏洞,包括严重的远程代码执行漏洞和大规模的提示词注入绕过。推文指出,真正的安全问题并非模型能否找漏洞,而在于智能体的运行时行为——代码、提示词、工具、本地服务与权限在系统执行文件操作、网络连接或命令运行前发生的复杂交互。
We're getting another round of THE AI BUBBLE IS POPPING stories, with the news about Uber/Microsoft pulling back on AI s...