We gave the same code audit to Claude Opus 4.8 and MiniMax M3. Same codebase. Same prompt. 17 known bugs planted in adva...
We gave the same code audit to Claude Opus 4.8 and MiniMax M3. Same codebase. Same prompt. 17 known bugs planted in adva...
Real-world AI is about solving for the edge case, not the average case
"I don't prompt Claude anymore. I have loops running that prompt Claude and figuring out what to do. My job is to write ...
Claude Desktop 打开内置的网页预览的那一刻我惊呆了,一个屏幕居然能放下这么多 Panels! 这产品经理应该是用 Zoom 开视频会议的时候灵机一动想出来这么牛逼的设计的!
We need to figure out how to have the option for a coordinated slowdown in the face of recursive self-improvement.
Astral Labs
If leading AI companies are indeed approaching the point of recursive self-improvement, a coordinated, verifiable, and u...
Anthropic 年度开发者大会上,Claude Code 负责人 Boris Cherny 描述了过去 6 个月的转变:他曾经手写所有代码,现在全部由 Claude 编写。他只需用 prompt 与 Claude 对话,让 Claude 构建功能、测试并展示结果,然后给出修改指令。更进一步,他不再手动 prompt,而是运行循环自动 prompt Claude 并决定行动——他的工作变成了写这些循环。Cherny 称这一转变将在今年剩余时间持续。
"I don't prompt Claude anymore. I have loops running that prompt Claude and figuring out what to do. My job is to write ...
Thousand Token Wood v2使用四个不同实验室的小模型(gpt-oss-20b、MiniCPM3-4B、Nemotron-Mini-4B及微调Qwen 0.5B)驱动金融模拟游戏的智能体。核心发现是异构服务层摩擦在于vLLM 0.22.1需CUDA工具包,而非模型本身。通过容忍性JSON解析层,添加模型只需一条配置。信息隔离确保内幕标志不在提示词中,扫描测试验证无泄露。记忆用情绪摘要截断避免淹没。微调0.5B模型实现0%自成交、100%有效报价,真相防火墙零泄露。小模型是可靠格式生成器但不可靠推理器,可通过结构化、提示词和微调弥补。
一名前日本公务员(不会种地)在北海道用AI管理100公顷农场。他借助ChatGPT和Codex自行编写代码,构建全自动农场系统:ESP32+LINE机器人远程控制温室通风/卷帘电机;温度监测+自动通风机器人;Airtable农场数据库(田地、任务、传感器、材料);卫星NDVI作物健康地图叠加在田地上;AI生成布线图。展示了普通人用AI解决实际问题的正确方式。
http://x.com/i/article/2063237792746831872
Start with an image of a building and prompt for a projection mapping with Omni.
博主阿易 AI Notes 强烈推荐桌面智能体(Agent)Codex,认为它优于国内大厂产品。他逐一批评了字节 Coze(不智能、仅支持命令行)、阿里悟空(内测不好用)、腾讯 workbuddy(基础不智能)和腾讯马维斯(能力较全面但仅限浏览器操作)。文章断言国内外众多桌面 Agent 中“只用 Codex 就够了”,特别适合零基础小白和文科生,无需折腾其他方案。
http://x.com/i/article/2063237792746831872
这几天陪老家的亲戚,都是六七十年代生人。有几个很深的感触: 1、微信、拼多多、抖音非常伟大。基本上涵盖了老一辈用手机的所有场景。其他应用确实都没有存在的必要。除了豆包,逐步有老人家提及,并在研究怎么用,能明显感觉到那种提及时的兴奋感。 2、...
跟Tom聊完了,直播中讨论的大模型前端审美主观排名: Claude opus 4.8 > kimi2.6 > GPT 5.5 > Deepseek v4 pro > GLM 5.1> deepseek v4 flash 不知道和你的实际使用...
What are people going to do after AGI wait in line of course
软银创始人兼CEO孙正义表示,AI的市场规模可能比互联网泡沫大50倍,下一个万亿美元公司将来自机器人领域。他指出,互联网泡沫在2000年破裂后实际增长远超当时顶峰,而AI目前才刚刚起步,未来的利润和增长机会极为巨大。
用Codex或者Claude Code,可以轻松改造任何闲置设备。
Gary Marcus 在文章中分享了对 AI 领域刚刚发生事件的看法,表达了对当前 AI 发展方向的思考。
Claude Design 分享系列小贴士,涵盖产品设计心法、日常实用妙招和 Claude 交互技巧。设计心法强调:交互原型需被点击才有意义;设计系统应自然不刻意;像素应克制争夺注意力;留白如乐符停顿;颜色不超过三种;用户心理模型是唯一规范。日常妙招包括:用冰块冻结口香糖去除、湿纸巾加热清洁微波炉、核桃油修复木划痕、木勺防止沸水溢出等。Claude 操作技巧:⌘G 语音输入、⌘V 粘贴截图、挂载本地文件夹实时读取代码库、旋钮模式拖拽调整 CSS 数值、原型功能从线框图到交互应用、保存模板复用工作流。
文章指出,安装 create-plan、gh-fix-ci 等核心 Skill 后,Codex 能从会写代码的聊天机器人变成靠谱的工程师团队。核心资源仓库包括 openai/skills 和 ComposioHQ/awesome-codex-skills(star 数均 20k+)。按场景精选 Skill:规划元能力、GitHub/CI/CD、测试/安全等。安装推荐用 Codex 内置工具,也可手动将 Skill 文件夹放入对应目录后重启。进阶玩法包括任务组合多张 Skill、自定义单一职责的 SKILL.md、跨平台迁移至 Claude Code/Cursor 等。持续更新资源可关注 skillregistry.dev 等。
Massive output uptick due to agentic AI. Complete flat adoption.
宝玉回应称“Vibe Coding”易联想垃圾代码。未来前后端程序员主流都是人指挥AI写代码,角色变为Tech Lead:分解任务、架构选型、审查调试。建议:适应指挥AI、用最聪明模型、复杂任务先设计、AI生成后必须审查、刻意练习手写代码理解AI输出。
@dotey 世纪之问:现在吹弄Vibe Coding的都是前端狗?C# 和 Java等后端狗不屑于此?
Hugging Face 发布 Job Searcher,一个基于 AI 的求职搜索工具。用户上传简历并设定偏好后,系统使用教师模型 DeepSeek V4 Pro 生成 LinkedIn 搜索查询,通过 JobSpy 抓取职位,再对学生模型 Qwen3-8B(8B 参数)进行 LoRA 微调,对每个职位从技能匹配、经验相关性、教育背景、行业领域契合度和资历对齐五个维度给出评分和推理。训练在 Modal 平台单张 A100 上完成。推理部署于 Hugging Face ZeroGPU Space,使用 llama.cpp 实现流式输出。项目开源。
不少账号使用AI生成与推文内容相关的评论,几乎出现在各个博主下面。这种行为疑似购买某种服务,目的是命中X算法或引起博主关注。但这些AI生成的评论内容质量拙劣,极易被识别。