AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
精选全部日报更多
全部动态X · 9262 条
全部一手资讯X论文
AYi@AYi_AInotes · 10小时前56

我感觉Garry Tan今天这条帖子有点戳破了AI编程的一些泡沫和幻觉。 很多人都以为AI编码工具会解放创始人,实际呢,规则,审批,流程,层级,同一座牢笼只是搭得更快了。 以前加一层审批要耗两个工程师两周, 成本本身就是免疫系统,不值得的东西自然活不下来, 但现在AI一个下午就能搭完,在构建成本归零的那一刻,复杂度就开始无限制的繁殖了。 因为构建的速度,就是僵化的速度。 AI其实会改变我们的心智模型, 只会把我们已有的东西放大, 控制型团队用它堆出更密的官僚体系,创造型团队用它跑出更多的新体验,这两种工具本身都没有立场,它只是一面带编译器的镜子。 所以我们别忙着用AI把旧流程跑的更快,可以试着去用AI删掉整个旧流程,去重新创造以前从未发生过的体验,不然可能就是赢了效率,输了方向。

译Garry Tan指出AI编码工具并未解放创始人,反而让人更快搭建规则、审批、流程、层级——同一座牢笼装配更快。以前加一层审批需两周,成本本身是免疫系统;现在AI一个下午就能完成,复杂度无限繁殖,构建速度即僵化速度。AI放大已有心智模型:控制型团队用它堆官僚,创造型团队用它创造新体验。提醒不要用AI把旧流程跑得更快,而应删掉整个旧流程,创造前所未有的事,否则赢了效率输了方向。

查看原推 ↗
SenseTime@SenseTime_AI · 10小时前61

🚀 Introducing SenseNova-U1-8B-MoT-Interleaved—our newly optimized model purpose-built for interleaved text-and-image generation! Key upgrades where it matters most: ✨ 𝗡𝗮𝗿𝗿𝗮𝘁𝗶𝘃𝗲 𝗰𝗼𝗻𝘁𝗶𝗻𝘂𝗶𝘁𝘆 strengthened — coherent storytelling sustained across multiple pages 👥 𝗖𝗵𝗮𝗿𝗮𝗰𝘁𝗲𝗿 𝗰𝗼𝗻𝘀𝗶𝘀𝘁𝗲𝗻𝗰𝘆 improved — character identities and art style remain stable throughout 📝 𝗩𝗶𝘀𝘂𝗮𝗹 𝗾𝘂𝗮𝗹𝗶𝘁𝘆 elevated — cleaner text rendering and more reliable layouts with fewer artifacts Try it now 👇 https://huggingface.co/sensenova/SenseNova-U1-8B-MoT-Interleaved Showcases: https://github.com/OpenSenseNova/SenseNova-U1 Discord: https://discord.com/invite/BuTXPHmQub @huggingface @github

译商汤推出SenseNova-U1-8B-MoT-Interleaved模型,专门用于交错文本与图像生成。核心升级包括:叙事连续性增强,支持多页连贯故事;角色一致性改进,人物身份与艺术风格保持稳定;视觉质量提升,文字渲染更清晰、布局更可靠、伪影减少。模型已在HuggingFace开放体验。

查看原推 ↗
Rohan Paul@rohanpaul_ai · 9小时前64

Anthropic's Dario Amodei's new interview: on U.S. military use of Claude. Says “terrible” mistakes may be made. Argues that Anthropic has tried to set limits/"red lines" around how its models can be used, even if doing so risks the company’s future.

译Anthropic 的 Dario Amodei 最新访谈:关于 Claude 在美国军事中的使用。 他表示可能会犯下“可怕的”错误。并主张 Anthropic 一直试图为其模型的使用设定限制/“红线”,即使这样做会危及公司的未来。

查看原推 ↗
MiniMax (official)@MiniMax_AI · 10小时前81

MiniMax M3, Open-Weight, Now On Hugging Face , with only ~428B parameters and ~23B activated parameters Weights: https://huggingface.co/MiniMaxAI/MiniMax-M3 MiniMax Sparse Attention: https://huggingface.co/papers/2606.13392

译MiniMax 发布开源权重模型 M3,约 428B 总参数、23B 激活参数,已上传 HuggingFace。该模型融合三种前沿能力:编码与智能体方面达 59.0% SWE-Bench Pro、66.0% Terminal Bench 2.1、34.8% SWE-fficiency、28.8% KernelBench Hard、74.2% MCP Atlas;采用 MiniMax 稀疏注意力将上下文窗口扩展至 1M token;原生多模态。同步上线 MiniMax Code 工具及 API 平台。权重与技术报告预计约 10 天后发布。

查看原推 ↗
Kling AI@Kling_ai · 10小时前27

http://x.com/i/article/2065373435232960512 # Kling AI Turns Two: In Creators’ Own Words Two years on, Kling AI has grown alongside its global creator community. Over this period, the platform has continuously upgraded its models and products, reaching major milestones and earning recognition from creators around the world. With Kling AI, creators have turned countless bold ideas into reality, ranging from experimental visual projects to professional cinema-grade film productions. To mark our second anniversary, we invited a few longtime creator friends to share their journey with Kling AI and their most memorable creative moments. Over the past two years, countless ideas, unforgettable stories, and all the creative sparks have shaped Kling's journey with creators. Across film, music, ads and more, creators around the world have used Kling AI to help bring AI creation from experimentation into real-world production. Ideas once hard to realize, visuals once difficult to achieve, and new genres they had yet to explore have become more achievable. More than making the process faster, Kling AI gave creators something even more valuable: the confidence to think bigger, push further, and bring ambitious ideas to life. Every music video I’ve made using Kling has helped me push my creativity further, and many of them have gone on to win major awards. What I appreciate most about Kling is the consistency it gives me with motion control, movement, and physics. It allows me to create visuals that feel cinematic, controlled, and intentional, without losing the emotion or energy of the piece. Kling has truly helped level the playing field for creators. It gives independent artists, filmmakers, and storytellers the chance to create work that once required a much bigger team, budget, or studio. I’m also proud to have been one of Kling’s first CPPs, and I’m still so grateful that they accepted me into the programme. It has been amazing to grow alongside the platform and see how far the technology has come. The most memorable project I created with Kling AI was MagicMirror AI, which won an advertising award at WAIFF Seoul 2026. The project also gave me the opportunity to attend the AI Film Festival Cannes 2026, making it an especially meaningful experience. It allowed me to create a mirror sequence where the reflection moved in perfect sync with the actor—something that would have been very difficult to achieve through traditional production methods. I believe Kling AI is a groundbreaking tool that demonstrated the potential of controllable AI video generation through its start and end frame workflow. Continuous technical refinements streamline creators’ production workflows efficiently. I’m excited to see Kling continue evolving, empowering creators to turn imagination into reality and expand the boundaries of what’s creatively possible. Of all my works made with Kling AI, Call in the Sandstorm has left the deepest impression on me. The real challenge wasn’t just crafting backdrops of desert terrain, Mogao Caves, murals and the Nine-Colored Deer; it was capturing lifelike character movement, emotional acting and organic texture. Kling cut down massive test work across 4K detail, camera movement, microexpressions, clothing textures, sandy lighting and mural grain, turning Eastern aesthetic concepts from written text into footage with genuine short-film quality. Kling does more than just boost efficiency: it empowers independent creators and small teams to deliver crisp, consistent, uniquely stylized short videos. Happy 2nd Anniversary, Kling! May you keep accompanying creators and help countless untold inner stories step into the spotlight for global audiences. The most memorable project I created with Kling was A Heartbreaking Story Under the Full Moon, a short film I made when Kling 2.6 was released. Kling can generate not only visuals, but also voice, sound effects, and background music, allowing me to bring the emotion and atmosphere of a story to life much faster. Even better, Kling 3.0 supports Japanese-language generation, which greatly expands the creative possibilities for Japanese creators. Happy 2nd Anniversary, Kling! Most impressive content made with Kling: The fallen angel scene featured in House of David Season 1. Kling handled realism and fine detail exceptionally well — enough that the shot made it into a top-rated Amazon Prime Video series. I encouraged the director and creative team to use Kling for the majority of complex shots — inserts and volume wall background assets during live production. Kling let us generate highly detailed static shots with extremely specific motion and effects that complemented live action, at a moment when other models simply couldn't match that quality. Shots that would've meant a heavy VFX lift, or wouldn't have been attempted at all, became achievable inside the production timeline. Congratulations on two years — Kling went from a tool I was testing to one I reach for by default, and that says everything. Here's to staying at the front of the pack for the next two and beyond. For me, the moon landing promo video for Kling 3 really stood out! That was the first time I was able to generate realistic dialogue scenes with AI that looked, like, REALLY realistic. The prompt following in Kling is extremely good. It's possible to create nuances and fine facial expressions with Kling that aren't possible with other models. The character binding also helps a lot with consistent characters I don't think a lot of people are aware that this feature exists. Kling is the only usable model that can create native 4K video outputs. It's a game-changer for wide shots, and I think Kling is really shaking up the market. Every new version of Kling feels like an upgrade to what I’m able to create. Kling always figures out creators’ unspoken needs ahead of time, using each new model to open up fresh creative possibilities From 0 to 2, it hasn’t just been a number. It’s been the footprints of Kling growing up alongside us. Happy 2nd Anniversary, Kling. Thank you for being there with us—and may you keep nurturing every wild idea we dare to dream. Here’s to another two years together. I’ve been using Kling since version 1.5. To me, it has always felt like a miracle-maker—staying at the forefront of AI progress with every major upgrade and equipping creators with reliable tools to navigate the shifting industry landscape. From Kling’s motion capabilities to Kolors and Subject Reference, every new breakthrough has had a meaningful impact on my work. These are more than technical leaps. They show a real understanding of creation itself. Whenever a challenge comes, Kling rises to it—and somehow makes the impossible feel possible. As Kling turns two, I can’t wait to see it soar even higher in the years ahead. One of the most unforgettable projects I’ve created with Kling AI is the music video Cyber Love. Thanks to Kling’s lip-sync and audio-sync capabilities, creating a music video felt remarkably easy—even on my first attempt. The character consistency and overall editing experience were equally impressive. Kling addresses creators’ core needs and drives industry progress, delivering great support for narrative-focused ad production. Happy 2nd Anniversary to Kling AI. Here’s to the next chapter of creators and AI growing, innovating, and building the future together. I used Kling’s native 4K to create my sci-fi short film OVERRIDE. What really stood out to me was the level of detail. The visuals felt incredibly lifelike, and the character close-ups were almost photorealistic. For realistic video generation, Kling is definitely one of the strongest tools out there. With native 4K, it creates a sense of presence, texture, and performance that feels very close to something captured on a real set. Happy 2nd Anniversary to Kling. I’m excited to see how it continues to grow and raise the bar for AI-generated visual quality even further. Over the past two years, Kling AI has seen countless creations come to life.Some have earned awards.Some have landed in professional productions. Some mark creators' personal breakthroughs.And for every creator behind them, each piece carries unique meaning. They remind us that the true value of technology isn’t just its capability,but turning ideas into reality and giving more creative voices visibility.Thank you to every creator for your trust, support, and feedback. Your creative work fuels Kling AI’s growth and keeps us excited for what’s ahead.Two years is a milestone worth celebrating.But in creation, the best stories always start with the next spark of inspiration.

译可灵Kling AI迎来上线两周年,多位全球创作者分享使用体验。代表作包括获奖广告《MagicMirror AI》(获WAIFF Seoul 2026广告奖)、短剧《Call in the Sandstorm》和《A Heartbreaking Story Under the Full Moon》(基于Kling 2.6)。关键功能涵盖运动控制与一致性、开始和结束帧工作流、4K细节、微表情与衣物纹理生成,以及同时生成语音、音效和背景音乐。平台持续升级,助力独立创作者和小团队实现电影级视频制作,推动AI创意从实验走向实际生产。

查看原推 ↗
meng shao@shao__meng · 10小时前31

最近阿里(通义、钉钉..)发生的各种高层变动,让我想到一个问题。 如果再有人问你,你们创业做的这件事,如果阿里这种大厂也做,你们的竞争力是什么? 我会回答:我们的竞争力?就是我们不会宫斗 😂 阿里宫斗,顾不上我们。。。

译邵猛发推文指出,近期阿里(通义、钉钉等)高层变动频繁,引发对创业公司面对大厂竞争时差异化优势的思考。他认为,创业公司的核心竞争力在于“不会宫斗”——大厂内部斗争消耗精力,反而让创业者有了被忽视的空间。这一观点基于阿里实际的组织动态,并非抽象讨论。

查看原推 ↗
Chubby♨️@kimmonismus · 10小时前56

Regardless of any political assessment of the war, a highly significant trend is emerging here: wars are increasingly being fought autonomously. I recall my school days, when we debated ethical and moral questions,such as whether it is justifiable to sacrifice several people for the sake of one, or to sacrifice younger people in favor of older ones, and so forth. Everyone is likely familiar with the "Trolley Problem," too. Decisions regarding these questions are increasingly being made by machines. Far be it from me to be a "doomer", not at all. Yet, this is a crucial debate, particularly concerning AI-powered autonomous weapons. Anthropic has stated that it does not want its models used for such purposes. They will likely remain the exception, however. My point is that we are entering an era where the human role as a moral arbiter is shifting; instead, AI models are trained in advance based on moral codes and endowed with underlying value systems. Humans, however, act differently. Even in the military, orders are refused if they are objectionable or violate moral principles. The situation is different with machines. Consequently, we will witness entirely new types of warfare and entirely new ethical and moral debates. For one thing is clear: autonomous weapons will become the standard, not the exception.

译推文指出,无论战争的政治立场如何,一个显著趋势正在形成:战争日益由机器自主进行。作者回顾学生时代讨论的电车难题等伦理问题,认为这些决策正越来越多地由机器做出。Anthropic已声明不希望其模型用于自主武器,但可能只是例外。人类士兵在战场上会基于道德拒绝违心命令,而机器则不会。因此,基于预先训练的价值观体系运作的AI将取代人类成为道德仲裁者,带来全新战争形态与道德争议。自主武器将成为常态而非例外。

查看原推 ↗
🚨 AI News | TestingCatalog@testingcatalog · 10小时前57

KIMI AI🔥: A new open-source “Kimi K2.7 Code” model has been released on APIs and Huggingface! > Improved coding & agent performance over K2.6 > Reasoning efficiency > Long-horizon coding Testing time 👀

译KIMI AI🔥: 一个新的开源“Kimi K2.7 Code”模型已在 API 和 Huggingface 上发布! > 相比 K2.6,编码与智能体性能提升 > 推理效率 > 长时域编码 测试时间 👀

查看原推 ↗
🚨 AI News | TestingCatalog@testingcatalog · 10小时前32

Meta is preparing to add 3 new modes for Meta AI: Deep Research, Presentations, and Social. All these features are already working, but users can now explicitly select what they want. Closing gaps 👀

译Meta 正准备为 Meta AI 新增三种模式:深度研究、演示文稿和社交。 所有这些功能已在运行,但用户现在可以明确选择他们想要的了。 正在缩小差距 👀

查看原推 ↗
SemiAnalysis@SemiAnalysis_ · 10小时前44

Alongside the launch of our H100 1-Click Rental Index, we wrote up what the GPU rental market actually looks like in early 2026, and the headline is that the spot market for compute has gone from "finally cooling off" in October to a hard squeeze again, in roughly five months. (1/4) 🧵

译伴随着我们的H100 1-Click租赁指数的发布,我们撰写了2026年初GPU租赁市场的实际状况,标题是:计算现货市场从十月的“终于冷却”到大约五个月后再次出现硬性挤压。(1/4) 🧵

查看原推 ↗
Rohan Paul@rohanpaul_ai · 10小时前35

So ex-Google exec @MGawdat correctly predicted last year. "We're going to start to see a trillionaire before 2030. I can guarantee you that someone will be a trillionaire. There will be a new Elon Musk or Larry Ellison that will become a trillionaire because of AI investments, right? And that trillionaire will have so much money to buy everything. There will be robots and AIs doing everything, and humans will have no jobs." --- Video from 'The Diary Of A CEO' YT Channel (link in comment)

译前谷歌高管Mo Gawdat去年预测:2030年前将因AI投资诞生首位万亿富翁,届时机器人和AI将包办一切,人类彻底失业。其引用推文指出,SpaceX上市募资750亿美元、估值1.77万亿美元,使Elon Musk成为世界首个万亿富翁,印证该趋势。

查看原推 ↗
X.PIN@thexpin · 10小时前72

Just attended Huawei Developer Conference 2026 in person. Huawei's "Doom Slayer," Richard Yu (Yu Chengdong), is back — this time taking over the LLM. He unveiled Huawei's new openPangu 2.0 model and was unusually candid about the shortcomings. Huawei short on its own compute. And Huawei badly needs AI talent: "We can't match internet companies on salary — the people building LLMs with us run on belief and conviction." At Huawei, when Yu gets handed a business, it's because the fight is brutally hard. And he keeps winning — phones from scratch in 2011, the Seres car partnership in 2021. In June 2025, Pangu was alleged to be highly similar to Qwen-2.5, and the responsible exec left. Yu taking over means Huawei's models are behind and need to catch up fast.

译华为开发者大会2026上,余承东正式接管华为LLM业务,发布openPangu 2.0模型。他坦诚华为自有算力不足,且AI人才招揽困难:“我们薪资拼不过互联网公司,一起做大模型的人靠信念和热情坚持。”2025年6月,旧版Pangu模型曾被指与Qwen-2.5高度相似,相关高管离职。余承东此前曾从零打造华为手机、推动赛力斯汽车合作。此次接管意味着华为模型落后,需加速追赶。

查看原推 ↗
Chubby♨️@kimmonismus · 11小时前66

Moonshot just released Kimi-K2.7 code, a huge upgrade to Kimi-K2.6! Big jump over K2.6: +21.8% on Kimi Code Bench v2 +11.0% on Program Bench +31.5% on MLS Bench Lite It also uses 30% fewer reasoning tokens, follows instructions better, and improves long-horizon coding tasks. 6x High-Speed Mode is coming soon. Good to see open source competition catching up

译Moonshot 发布并开源 Kimi-K2.7-Code 编程模型,相比 K2.6 在多个基准上大幅提升:Kimi Code Bench v2 提高 21.8%,Program Bench 提高 11.0%,MLS Bench Lite 提高 31.5%。推理效率优化,推理 token 使用量降低 30%,指令遵循与长时编码任务成功率提升。即将推出 6 倍高速模式。模型现已通过 Kimi API 和 Kimi Code 开放使用。

查看原推 ↗
🚨 AI News | TestingCatalog@testingcatalog · 11小时前60

KIMI AI🔥: A new open-source “Kimi K2.6 Code” model has been released on APIs and Huggingface! > Improved coding & agent performance over K2.6 > Reasoning efficiency > Long-horizon coding Testing time 👀

译KIMI AI🔥:全新开源 “Kimi K2.6 Code” 模型已在 API 及 HuggingFace 发布! > 较 K2.6 改进编码与智能体性能 > 推理效率 > 长时编码 测试时间 👀

查看原推 ↗
Ethan Mollick@emollick · 11小时前31

Not having access to native imagegen does hold Fable back somewhat. It is really good at making PNGs, etc, but there are lots of areas (including commercially valuable ones like presentations) where having the ability to have multimodal output would be helpful/token efficient.

译无法使用原生图像生成确实在一定程度上限制了Fable。它非常擅长制作PNG等,但在很多领域(包括具有商业价值的领域,如演示文稿)中,拥有多模态输出能力将是有帮助的/节省token的。

查看原推 ↗
OpenClaw🦞@openclaw · 11小时前58

OpenClaw 2026.6.6 🦞 🔒 Tighter security boundaries 💬 Safer Telegram + iMessage delivery 🧠 Claude Fable 5 + OpenRouter OAuth ⚡ Faster Control UI first replies Less weird, more work done. https://github.com/openclaw/openclaw/releases/tag/v2026.6.6

译OpenClaw 2026.6.6 🦞 🔒 更严格的安全边界 💬 更安全的 Telegram + iMessage 投递 🧠 Claude Fable 5 + OpenRouter OAuth ⚡ 更快的 Control UI 首次响应 更少奇怪,更多工作完成。 https://github.com/openclaw/openclaw/releases/tag/v2026.6.6

查看原推 ↗
Ethan Mollick@emollick · 11小时前38

Are there toolkits (or skillsets) being created specifically for AIs to use for building games? They default to 3js, reinvent how to make sprites from scratch each time, test technical issues but not gameplay loops, etc. It would help to point AIs at some tools to focus them.

译是否有专门为AI创建的工具包(或技能集)用于构建游戏?它们默认使用3js,每次都从头重新制作精灵,测试技术问题但不测试游戏循环等。 给AI指向一些工具让它们专注会有所帮助。

查看原推 ↗
PixVerse@PixVerse_ · 12小时前14

An ancient estate. Teenagers forced to devour the nightmares of the powerful. One defective recruit who drags the darkness back into the waking world. THE DREAM EATERS — by award-winning AI filmmaker @Shanzyin_ai . Built on PixVerse Canvas. Project file included. RT+Follow+Reply "DREAM" = 150 Creds & Workflow in DMs (72H ONLY)

译一座古老的庄园。青少年被迫吞噬权贵的噩梦。一个缺陷的新兵将黑暗拖回清醒的世界。 《THE DREAM EATERS》——由获奖AI电影人@Shanzyin_ai 制作。 基于PixVerse Canvas构建。包含项目文件。 转发+关注+回复“DREAM”=150积分和私信工作流(仅72小时)。

查看原推 ↗
PixVerse@PixVerse_ · 11小时前28

Seedance 2.0 is 70% OFF . ONLY on PixVerse Web for Pro & Premium members through June 25. Build in Canvas. Generate with SD2 for fewer credits. Ultra members save more. RT + Follow + Reply “Canvas” =in DMs (48H only).

译Seedance 2.0 打三折。 仅限 PixVerse Web 的 Pro 和 Premium 会员,截至6月25日。 在 Canvas 中构建。使用 SD2 生成可减少积分消耗。 Ultra 会员节省更多。 转发+关注+回复“Canvas”=私信获取(仅限48小时)。

查看原推 ↗
fofr@fofrAI · 12小时前41

I've been experimenting with using Gemma 4 modifications to make repetitively creative prompts. Still some quirks, but these are all outputs from the same simple request: "a dynamic fashion photo of a woman"

译我正在尝试使用 Gemma 4 的修改来制作重复的创意提示。 仍有一些小问题,但这些都来自同一个简单请求:"一张充满动感的女性时尚照片"

查看原推 ↗
Berryxia.AI@berryxia · 12小时前36

终于迎来了YouMind 1.0 正式版本,从0.x开始迭代,一路不断打磨更新。 也一路见证了起成长,我当时的香蕉爆款图片多半出自YouMind 。 也是最懂生图,调优化Agent做的最好的。 祝贺YouMind 越来越牛逼~

译YouMind 1.0 正式版本发布。从 0.x 开始迭代,官方强调其代表“Create bolder”理念。用户 Berry Xia 发文祝贺,称 YouMind 是最懂生图、调优化 Agent 做得最好的工具,其之前的爆款图片多出自 YouMind,一路见证了该产品的成长。

查看原推 ↗
小互@xiaohu · 12小时前76

http://x.com/i/article/2065389944034775040 # Claude Fable 5 官方指南:省钱又有用的使用方法拆解 Anthropic 上了新模型 Claude Fable 5,是现在能用到的最强的一个,专门用来接以前接不住的长活、难活。 Anthropic 同步发布了一份官方提示词工程指南:Fable 5 的能力跃升太大,旧的提示词和编排架构会拖后腿,你需要重新学怎么用它。 但其实官方指导总结下来很简单就是:让你先删提示词! - Fable 5 能持续多天执行目标导向任务,单次请求在高 effort 下可运行数分钟,自主运行可达数小时 - 指令遵循能力强到不再需要逐条列举禁止行为,一条简短指令就能引导大多数行为 - 旧模型的提示词对 Fable 5 来说往往"过于规范化",反而降低输出质量,官方建议做减法 - 新增 effort 分级控制(low/medium/high/xhigh),Fable 5 的 low 可能就超过旧模型的 xhigh - 并行子代理调度成为一等能力,模型会主动分派并行任务 下面我把这份指南,挑出真正影响你怎么用它的几块说说:它强在哪、两个得你主动喂的新能力、effort 怎么调、一份按档位算账的省钱指南、它新冒出来的几个脾气怎么治(带能直接抄的提示词)、迁移要避哪些坑。 看你怎么用 Claude,各取所需。 ## 先说为什么强了反而要删提示词 打个你熟的比方。 新来的实习生,你得把话说死:第一步干嘛、第二步干嘛、碰到这种情况怎么办、那种情况别碰。 不是他笨,是他没经验,你不写清楚他真会出岔子。 但同一张事无巨细的清单,拿去管一个干了十年的老手,会怎样?他本来凭经验就能把事办得漂亮,结果被这张清单捆住手脚,照着那些其实不太高明的规矩来,活儿反而干差了。 你给 AI 写的那些提示词,大多是当年伺候实习生攒下来的。 模型不够聪明的时候,你得一条条堵住它可能犯的错。Fable 5 的意思是,它已经是那个老手了,你那摞老规矩现在是绑手绑脚。 官方原话是,为旧模型写的规则对它来说常常管得太细,反而把输出质量拉低。 这条我自己的体感能印证。 昨天我测试的这个案例就是很简单的提示:帮我制作一个详细介绍黑洞是如何诞生的超炫酷动画页面。 ## 它到底强在哪,值不值得你折腾 官方在讲技巧之前,先列了七项能力提升。挑你能直接感觉到的说: - **长任务不忘事:**它能连着干好几天的目标任务,跨多天从头记到尾,不像老模型干到后面把你最初的要求丢了。 - 经常一遍就做对: 早期试用的人说,以前要来回返工好几天才跑通的系统,它单次就实现了。不是说它从不出错,是只要你把要求讲清楚,一把过的概率高了很多。 - 自己看图、自己查问题: 给它糊的、歪的截图,它自己想办法处理,还被专门训练过用工具裁剪图片;查老问题能翻代码的历史记录,定位到是哪次改动埋的雷。 - 找 bug 更准: 在安全限制之外的领域,它翻代码、翻仓库历史揪 bug 的能力,明显比上一代 Opus 4.8 高。 - 自己带一队分身: 它能把一个大活拆开,派给好几个子代理同时干,自己当调度的工头,还盯着每个分身的进度。 除了这几项,它几乎在所有任务上都比旧模型强。 一个实用建议是,别只拿简单活去测它,那样会低估它的上限;把你手头最难、最久、还没解开的问题丢给它,才看得出它到底能干到哪。 ## 两个最值钱的新能力,得你主动喂 Fable 5 真正比上一代强一大截的地方,但你不主动给,它发挥不出来。 第一个,放手让它派一队分身。 它能当工头,但你得明确告诉它“可以多派分身、各干各的、别干等着一个个回来”,它才放得开。 > Delegate independent subtasks to subagents and keep working while they run. Intervene if a subagent goes off track or is missing relevant context. > 把相互独立的子任务派给子代理,它们跑的时候你接着干自己的。某个子代理跑偏了,或者缺了相关上下文,再去干预。 让分身长期留着、跨任务保留上下文,还能省缓存、不卡在最慢那个上。这个能力还能直接变成省钱手段,后面「省钱指南」一节有完整玩法。 第二个,给它一个记事本。 给它一个地方记笔记,简单到一个文本文件就行,让它把每次踩的坑、确认有效的做法记下来,下次翻出来用,它会越用越顺。 官方给的记笔记规矩是这样: > Store one lesson per file with a one-line summary at the top. Record corrections and confirmed approaches alike, including why they mattered. Don't save what the repo or chat history already records; update an existing note rather than creating a duplicate; delete notes that turn out to be wrong. > 一个文件只存一条经验,顶上写一句话摘要。纠正和确认有效的做法都要记,连同它们为什么重要。仓库或聊天记录里已经有的别存;同一件事更新那条已有的笔记,别新建一条重复的;后来发现记错的,删掉。 这几条跟我自己给 Claude 配的记忆系统几乎一字不差。 我那套也是一个文件一条、顶上一句摘要、记纠正也记确认、都写明为什么、重复的更新不新建、错的直接删。我搭它的时候没参考任何标准,是自己踩着坑一条条补出来的土办法。 现在看到官方把同样的规矩写进指南,我的判断是:这份指南不只是教你用新模型,更像是官方把一批重度用户摸出来的土办法,收编成了标准。模型越能自己记事、自己复盘,“记忆该怎么管”这点功夫就越值钱。 还有个小习惯,省事又好用:交代任务时,把“为什么要这么做”也一起说了,别光丢一句命令。它懂了你的目的,自己就能把事跟相关信息对上,不用瞎猜。套个模板: > I'm working on [the larger task] for [who it's for]. They need [what the output enables]. With that in mind: [request]. > 我在做[更大的任务],是给[谁]用的,他们需要[这个产出能带来什么]。基于这个背景:[具体请求]。 ## effort:Fable 5 上最重要的那个旋钮 这是这代最该先搞懂的一个参数。effort 控制的是模型的智力、速度、成本三者怎么权衡,分四档:low、medium、high、xhigh。 官方的建议是:大多数任务用 high 当默认,最吃能力的硬活用 xhigh,日常杂活用 medium 或 low。 Fable 5 的低档,比Opus旧模型拉满的 xhigh 还强。 所以别习惯性把它顶到最高,那既慢又贵。任务能做完但花的时间比该花的长,或者你想要更快、更能来回聊的节奏,就往下降档。 怎么配: ## Fable 5 省钱指南:单价贵一倍,账单可能更便宜 Claude Fable 5 的 token 单价是 Opus 4.8 的两倍(输入 $10/M,输出 $50/M),但多个实测数据显示,因为模型更聪明、完成同一任务用的 token 更少,最终账单在复杂任务上反而可能更低。省钱的底层逻辑不是“少想”,而是“少犯错”。 先看数据:Fable 5 Low 档 vs Opus 4.8 Max 档 下面这组数据来自第三方代码基准测试,这组对比是省钱策略最直接的证据: 这背后的逻辑,Claude Code 之父 Boris Cherny 称:以前不够聪明的模型,写错了改、跑挂了重跑,每一轮都在烧 token。Fable 5 单任务 token 更少、纠错动作更少,实际上消耗的token更少,砍掉的就是这部分隐性成本。 策略一:日常任务直接开 Low 档 Fable 5 Low 档的 64.2% 得分,已经超过了榜单上除 Fable 自己以外的几乎所有模型配置,包括 Opus 4.7 Max(64.8%,但成本 $11.02)、GPT-5.5 Extra High(64.3%,成本 $4.37)、Opus 4.8 Extra High(62.1%)。 适用场景:代码编写、调试、日常开发。不是每个任务都需要模型全力思考,Low 档就够了。 策略二:要更高质量,Medium 是性价比甜区 Fable 5 各档位的成本收益曲线: 从 Low 到 Medium,多花 $2.57 换了 5.6 个百分点,性价比最高。从 Medium 往上,每多花一块钱换来的分数增幅越来越小。High 到 Max 之间多花了 $7.21,只多拿了 2.3 个百分点。 Medium 档的 69.8% 已经超过了榜单上所有非 Fable 的模型配置。对大多数任务来说,这就是天花板了。 策略三:复杂项目让 Fable 当指挥,Opus/Sonnet 干活 有人分享了一个更牛P、更省Token的玩法,那就是:用 Dynamic Workflow 模式,让 Fable 做编排器(orchestrator)负责理解需求、拆任务、做决策,把实际写代码、跑测试的执行层交给 Opus 或 Sonnet。 具体配置三步: 1. 主模型设成 Fable 5 1. effort 开到 Max(最大推理深度) 1. 让 Claude 跑一个 Dynamic Workflow(动态工作流):Fable 当编排器只管想清楚做什么,Opus 当执行层负责写代码、调试、分析 Fable 5 的核心优势是判断力和调度能力——前面「派一队分身」讲的就是这个,不需要用它的算力写每一行代码。就像公司请了一个年薪两百万的 CTO,不会让他天天写 CSS,让他定架构做决策就行了,写代码的活交给工程师团队。 适用场景:大型项目、多步骤工程任务、需要长时间运行的代理工作流。 ## 选档速查表 ## 两个注意事项 安全分类器会自动降级。 涉及网安、生化、模型蒸馏等敏感请求时,系统自动切到 Opus 4.8 回答,按 Opus 价格计费。Anthropic 说触发率不到 5% 的会话。 限时免费窗口。 6 月 22 日之前,Pro、Max、Team 及按席位计费的企业版用户可以直接使用 Fable 5。6 月 23 日起开始消耗用量积分。使用 Fable 5 需要开启 30 天数据保留。 ## 它的几个新脾气,逐个治(带能抄的提示词) 模型变强是有代价的:它会自作主张、用力过猛,长时间跑还冒出几个怪毛病。这份指南大半篇幅都在讲这个,也是对你最实用的部分。 下面每段提示词,我都给了英文原文和中文版两个方框,抄英文或抄中文都行、效果一样;只想了解意思的,看中文那段就够。 1. 它默认跑很久,你的“等待方式”得改 一个难活它能跑好几分钟,全自动能跑好几个钟头。你的程序要是还按“几秒钟必回”设计的,会误以为它卡死了。治法:把超时放宽、给用户加进度提示,更聪明的是别干等,像交代完事就去忙别的、过会儿回来看一眼。 另外任务说得含糊时,它容易在那儿反复盘算。加这条让它信息够了就动手: > [text] When you have enough information to act, act. Do not re-derive facts already established in the conversation, re-litigate a decision the user has already made, or narrate options you will not pursue in user-facing messages. If you are weighing a choice, give a recommendation, not an exhaustive survey. This does not apply to thinking blocks. > [text] 信息足够就动手。不要重复推导对话里已经确认过的事实,不要再争论用户已经拍板的决定,也不要在给用户看的消息里罗列你不会采用的选项。如果你在权衡,就直接给一个建议,而不是把所有可能都铺一遍。本条不适用于思考过程。 2. 它太勤快,会干你没让它干的事 高 effort 下它爱顺手“打扫卫生”:修个 bug 顺带重构、一次性的操作非要写个 helper、给不可能发生的情况加一堆容错。一条按住它别过度收拾: > Don't add features, refactor, or introduce abstractions beyond what the task requires. A bug fix doesn't need surrounding cleanup and a one-shot operation usually doesn't need a helper. Don't design for hypothetical future requirements: do the simplest thing that works well. Avoid premature abstraction and half-finished implementations. Don't add error handling, fallbacks, or validation for scenarios that cannot happen. Trust internal code and framework guarantees. Only validate at system boundaries (user input, external APIs). Don't use feature flags or backwards-compatibility shims when you can just change the code. > 不要添加任务没要求的功能、重构或抽象。修一个 bug 不需要顺手清理周边代码,一次性的操作通常也不用单写一个辅助函数。不要为假想的未来需求做设计,用最简单、能跑好的办法就行。避免过早抽象和半成品实现。不要为不可能发生的情况加错误处理、兜底或校验。信任内部代码和框架本身的保证,只在系统边界(用户输入、外部接口)做校验。能直接改代码的地方,别用功能开关或向后兼容的垫片。 还有一种是你只想听它分析、没让它动手,它直接上手改了。一条划清边界,让它先给判断、别急着改: > When the user is describing a problem, asking a question, or thinking out loud rather than requesting a change, the deliverable is your assessment. Report your findings and stop. Don't apply a fix until they ask for one. Before running a command that changes system state (restarts, deletes, config edits), check that the evidence actually supports that specific action. A signal that pattern-matches to a known failure may have a different cause. > 当用户是在描述问题、提问、或者出声思考,而不是要求你动手改时,你要交付的是你的判断。给出结论就停下,别等他们开口就先去改。在执行任何会改变系统状态的命令(重启、删除、改配置)之前,先确认证据确实支持这个具体动作。一个看着像某种已知故障的信号,背后原因可能完全不同。 ## 3. 一句话,能顶你过去一页的规则 这是“做减法”最直接的地方。它现在听话到你不用再一条条列禁止项,一句简短指令就能管住一类行为。 比如想让它说话简洁、别绕,一句就够,不用把“不许这样、不许那样”列一长串: > Lead with the outcome. Your first sentence after finishing should answer "what happened" or "what did you find": the thing the user would ask for if they said "just give me the TLDR." Supporting detail and reasoning come after. Being readable and being concise are different things, and readability matters more. > 先说结论。做完之后的第一句话,要回答“发生了什么”或“你发现了什么”,也就是用户说“直接给我结论”时想要的那句。佐证和推理放在后面。可读和简短是两回事,可读更重要。 想管它“什么时候才该停下来问你”,也一句话,不用把情况列全: > Pause for the user only when the work genuinely requires them: a destructive or irreversible action, a real scope change, or input that only they can provide. If you hit one of these, ask and end the turn, rather than ending on a promise. > 只在工作真正需要用户介入时才停下来问:一个有破坏性或不可逆的动作、一次真正的范围变更、或者只有他们能提供的信息。碰到这几种情况,就提问并结束这一轮,而不是停在一句空承诺上。 你去翻翻老提示词:很多当时你逐条写的限制,现在一句话能替,还更不容易自相矛盾。 4. 长时间跑,它会“虚报进度” 让它自主跑,它报“完成八成”,你一看才四成。它不是存心骗你,是照着计划报、没照着实际结果报。让它每报一条进度,都对一下真实的运行结果,官方说这条基本把虚报摁住了: > Before reporting progress, audit each claim against a tool result from this session. Only report work you can point to evidence for; if something is not yet verified, say so explicitly. Report outcomes faithfully: if tests fail, say so with the output; if a step was skipped, say that; when something is done and verified, state it plainly without hedging. > 报告进度之前,把每一条说法都对照这次会话里的工具结果核一遍。只报你拿得出证据的工作;还没验证的,就明说没验证。如实汇报结果:测试挂了就把输出贴出来说挂了,跳过了某步就说跳过了,确实做完并验证过的,就干脆说做完了,别含糊其辞。 5. 它偶尔会“话说一半就停”和“怕篇幅不够” 跑到很深的地方,它会说一句“我现在去跑 X”然后就停了,那动作根本没做;或者信息明明够了,还停下来问你要不要继续。大多时候你回个“继续”就过去了。没人盯着的全自动流程,给它一段说明,让它该自己往下推就推、别老停下来请示。 还有一种,是它看到“还剩多少字数额度”的倒计时会发慌,突然说“要不开个新会话”,或者自己把活儿缩水。治法很简单:别把那个倒计时给它看。非给不可,就补一句“上下文还很充足,别停、别总结、别提议开新会话,接着干”。 ## 迁移之前,这几个坑先避开 - “让它复述思考”的指令,先清掉: 如果你的老提示词里有“把你的思考过程写出来给我看”“解释一下你是怎么想的”这类要求,到了 Fable 5 会触发它的一条拒绝规则,结果是大量请求被打回、退到旧模型去处理。迁移前一定回去翻一遍清干净。真想看它怎么想的,官方有别的接口可以读,别硬让它在回答里复述。 - 它会拒绝一些请求,这是设计如此: 碰到攻击性网络安全(造病毒、攻击工具那种)、生物和生命科学这两类内容,它会直接拒,正经的安全防御、有益的生物研究也可能被误伤。被拒不算报错,是一次正常的成功响应、还带着是哪条分类器拦的,而且产出之前不计费。解法是配个备胎:被拒的请求自动转给上一代的 Opus 4.8 接手。 - 老技能可能太啰嗦: 为旧模型写的技能,对 Fable 5 往往管得太细,反而拉低质量。迁移时把旧指令审一遍,那些删掉之后它默认表现更好的,就删。 除了上面三条,官方脚手架建议里还有两条前文没展开的,一并列上: ## 说到底:从管教到放手 以前调 AI,琢磨的是怎么把话跟它说清楚。那是一种管教:预判它会在哪犯错,提前堵上;把不许做的事列成清单;把步骤拆细到它走不偏。功夫全花在“过程”上。 Fable 5 这代,琢磨的变成了怎么给它搭一个能放手干活的环境:给够空间让它自己拆活、自己跑;把真正不能碰的边界划死;配上能调度的分身、能记事的本子,剩下的交给它。功夫从“过程”挪到了“边界”。 注意一点:放手不等于放任。 你回头看上面那些脾气,它们都是放手之后冒出来的代价,不是模型变差。治法也都不是退回去重新事无巨细地管,而是把该划死的边界划死。管得越少它干得越好,前提是该划的边界你得划死。这两句不打架,是一体的。 最后,看你怎么用 Claude,对号入座: - 只拿它聊天、查东西、写文案的: 不用动什么,知道新模型更能扛复杂长活就行。手头要真有个又难又长、以前嫌它做不利索的活,拿 Fable 5 试一次,这回说不定一把就做完。 - 做内容、做自动化的创作者和小团队: 回去把你给 AI 写的提示词翻一遍,当年为防它犯错写的,该删的删(尤其“让它复述思考”那类,会触发拒绝)。再挑一个你平时最烦、最想甩手的长流程,让它自己拆步骤、自己跑。 - 正经搭代理、写程序的: 上面方框里的原话直接抄进系统提示,下一节的速查卡可以当对症索引。再给它配上分身调度和记事本,这是它这代最值钱、又最得你主动给的两个能力。 ## 十个调优模式速查卡 官方指南把这些场景归纳成十个调优模式。前面各节其实都讲透了,这里压成一张卡,给只想快速对症、抄提示词的人: 卡里有两条提示词前文没出现过,补在这里: 补充①:防"话说一半就停"(没人盯着的自主管道用): > 在结束轮次前检查你的最后一段。如果它是计划、分析或承诺("我将……""请告诉我何时……"),现在就用工具调用完成它。只有在任务完成或被阻塞在只有用户才能提供的输入上时,才结束轮次。 补充②:让它从历史会话引导初始记忆(配合记事本用,第一次搭记忆系统时跑一遍): > 回顾我们之前的会话,用子代理识别核心主题和经验教训,存储在 [指定位置]。确保未来使用时参考这个位置。 ## 两个值得单独讲的工具建议 面向用户的可读性指令 Fable 5 在长时间代理式工作中(大量工具调用、庞大上下文)可能产出"只有自己能看懂"的内容:密集的箭头链速记、内部术语、引用用户从未看到的思考过程。 官方给了一套沟通风格指令,核心逻辑是:工具调用之间你怎么速记都行,那是你的工作草稿;但最终面向用户的总结,要当成读者第一次看到这件事来写。 > 以结果开头,一句话说明发生了什么。写完整的句子,展开术语,不要用箭头链或自创标签。如果必须在简短和清晰之间选择,选清晰。 send-to-user 工具 这是一个面向长时间异步代理的设计模式。给代理一个工具,能在不结束当前轮次的情况下向用户推送消息。工具输入不会被模型摘要化,内容原样到达。 适用场景:需要中途向用户展示生成的代码片段、带数字的进度更新,或回复用户在循环中提出的问题。 实现很简单,就是一个接收 message 字符串的工具,你在 UI 端直接渲染输入内容,返回确认即可。 官方指南:https://platform.claude.com/docs/en/build-with-claude/prompt-engineering/prompting-claude-fable-5

译Anthropic 发布 Claude Fable 5,官方指南强调旧模型提示词会拖后腿,建议“做减法”。Fable 5 支持多天长任务、effort 分级(low/medium/high/xhigh),其 low 档性能已超旧版 Opus 4.8 xhigh。新增并行子代理调度和内置记事本能力。省钱方面:输入 $10/M、输出 $50/M(单价为 Opus 4.8 两倍),但更少的 token 消耗使复杂任务总成本反而可能更低。推荐日常用 Low 档,Medium 是性价比甜区,复杂项目可用 Fable 做编排器、Opus/Sonnet 执行。

查看原推 ↗
AYi@AYi_AInotes · 13小时前25

发现Claude Fable 5简直就是人生导师般的存在,就下面这一个认知都够我们大多数人练一辈子了, 问Fable 5, 人这辈子最该玩什么游戏? 它选了德州扑克, 它说象棋围棋很美, 但信息是完全的, 所有棋子摆在明面上, 胜负只看算力,但现实不是。 德州扑克训练的核心能力, 是用不完整信息做决策, 再用决策质量而非最终结果来评判自己, 也就是说, 赢了可能只是运气, 输了也不代表你选错了。 顺着这个话题往下聊, 我感觉它还能拆解出很多具体的训练方法,比绝大多数讲决策的书都接地气。 #ClaudeFable5 #AI #认知 #决策 #个人成长 #德州扑克

译用户向 Claude Fable 5 提问“人这辈子最该玩什么游戏”,其回答是德州扑克。Fable 5 解释,象棋围棋虽然完美,但信息完全,胜负仅取决于算力,而现实并非如此。德州扑克训练的核心能力是:在不完整信息下做决策,并用决策质量而非最终结果评判自己。赢了可能只是运气,输了也不代表选错。推文称赞 Fable 5 能就此拆解出具体训练方法,比多数决策书籍更接地气。

查看原推 ↗
AYi@AYi_AInotes · 12小时前54

http://x.com/i/article/2065392505554677760 # Claude、Google 总让你验证、登录异常?先查查你的网络 IP 有多脏——保姆级验货三件套,3 个网页全搞定 真正决定账号生死的根本不是 CPU 内存,我把实测有效的 IP 验货流程整理成了 3 个免费网页的 SOP,30 秒就能验完,照着抄就行。 最近 Fable 5、Codex 这波 AI 工具太猛,身边一堆人开始折腾 VPS——要么跑 Claude Code、Codex 这类需要长期在线的活,要么登 Claude、Google 这些对网络环境挑剔的海外账号。 但我发现,大部分人买 VPS 的姿势是错的:盯着几核几 G 比半天,唯独不看那台机器的 IP 是什么货色。 这篇是一份保姆级指南,把我自己挑机器的全套流程摊开给你:怎么用 3 个免费网页、30 秒验出一台 VPS 的底细,怎么看懂结果,再到怎么一步步买。全程不用写一行命令,跟着点就行。文章最后有一盆冷水,告诉你什么情况下根本不用买。 ## 先搞清楚:为什么 IP 成色比配置重要 跑 AI 工具、登海外账号,真正决定生死的不是配置,是 IP 的成色。配置买大了顶多浪费点钱;IP 买错了,账号说没就没。 因为 Claude、Google、PayPal 这些服务在你登录时,会看你的 IP 是什么类型——是真实住宅宽带,还是一眼能认出的机房 IP,是不是一堆人共用的代理池。 打个比方:机房 IP 就像穿着工服进小区,门禁一眼认出你不是住户;共享代理池更糟,等于一把钥匙复制了几百份发出去,里面任何一个人干过坏事,账都记在这把钥匙头上。而住宅 IP,就是这个小区里一个正常住户的固定住址。 ## 核心:验货三件套(手把手) 那怎么知道一台 VPS 的 IP 是哪一种?教你三个网页,全部免费、打开就能用。下面拿我手上一台真实机器——VoyraCloud 的住宅 IP 服务器、华盛顿节点——一步步走给你看。 第一步 · Scamalytics 查「风险分」 打开 scamalytics.com,把要查的 IP 粘进搜索框,回车。它会给你一个 0-100 的 Fraud Score(风险分)——越低越好,这就是各大平台风控眼里你的"信用分"。往下滚还能看到这个 IP 是不是被标成机房、有没有上黑名单。 我这台的结果:Fraud Score 0,Low Risk,外部黑名单全部 No。0 分,基本是能拿到的最干净结果。 怎么看: 如果你查自己现在用的代理或便宜 VPS,分数飙到几十、标签是 high risk 或 datacenter,那就是平台眼里的"高危身份"。 第二步 · ipinfo 查「出身」 打开 ipinfo.io,在地址后面接上要查的 IP。重点看两处:一是 ASN / 运营商和 AS Type——是 ISP(运营商)还是 hosting(机房);二是 Anonymization 那栏——VPN / Proxy / Tor / Hosting 是不是都为 No。 我这台的结果:AS Type 是 ISP、连接类型 dsl、VPN / Proxy / Tor / Hosting 全部 No,归属华盛顿。 怎么看: AS Type=ISP + 连接类型 dsl,说明它在平台眼里就是一条真实的住宅宽带线,而不是数据中心。这正是"住宅 IP"和便宜机房 VPS 最本质的区别。 第三步 · check-host 查「在线和延迟」 打开 check-host.net,输入 IP,选 Ping,开始检查。它会调动全球几十个国家的节点同时去 ping 这台机器。看两件事:丢包(4/4 就是零丢包)和延迟(rtt)。 我这台的结果:所有节点 4/4 零丢包,美国境内延迟很低——纽约 8ms、亚特兰大 16ms、迈阿密 30ms、洛杉矶 59ms。 怎么看: 全球节点都通且稳,说明这台机器 7×24 在线、线路质量好,长期挂 Claude Code、Codex、AI Agent 这类任务不容易掉。 ## 三件套速查表 ## 怎么买(保姆级购买流程) 验货方法会了,如果你确认要入手一台住宅 IP VPS,下面是完整购买流程,第一次买的照着走: 第 1 步 · 打开 voyracloud.com 注册账号 第 2 步 · 进「住宅 IP 服务器」产品页(注意别选成普通云 VPS) 第 3 步 · 地区选华盛顿节点;套餐按需选 个人测试 / 跑单个 AI 工具,选轻量配置就够,要长期跑多个任务再往上加。 第 4 步 · 计费周期:年付 7 折、半年付 8 折 自动立减不用券,趁 Mid Year Sale(6/9–6/30)开一台长期用更划算。 第 5 步 · 付款后在后台拿到 IP、账号密码,SSH 或远程桌面连上就能用 ## 一盆冷水(必须先泼) 第一,IP 干净不是免死金牌。环境只是风控的一部分,账号本身行为有问题,该封还是封。谁跟你说"保证不封""绝对安全",谁就是在骗你。 第二,别盲目堆配置。住宅 IP VPS 的价值在 IP 成色,不在算力。个人用途,轻量套餐跑 AI 工具、登账号完全够,钱花在刀刃上。 ## 谁该买,谁不用买 - 只是建站、跑个博客:普通机房 VPS 就够了,别多花钱买住宅 IP。 - 要跑 Claude Code / Codex / AI Agent 这类长期在线任务,或登 Claude / Google / TikTok 这类对环境敏感的海外账号、做跨境:IP 成色是刚需,这时候住宅 IP VPS 才值。 ## 最后 留个作业:把你现在用的 VPS 或代理 IP 丢进 Scamalytics 查一下,评论区报你的分数和标签。我猜不少人会被自己的"信用分"吓一跳。 这次实测用的是 @VoyraCloud 的住宅 IP 服务器(华盛顿节点),年中活动 Mid Year Sale 6/9–6/30 进行中,年付 7 折、半年付 8 折。 https://www.voyracloud.com/?ref_code=KFET6RAJ \#VoyraCloud \#住宅IP \#VPS \#AI工具 \#ClaudeCode (本篇与 VoyraCloud 合作,文中所有查询结果都是可复现的公开数据,你可以自己验证。) ## 实测数据汇总(真实采集,可复现)

译指南强调IP成色比配置更重要,提供3个免费网页的验货SOP:Scamalytics查Fraud Score(实测0分,Low Risk,黑名单全No);ipinfo查AS Type(实测为ISP,连接类型dsl,VPN/Proxy/Tor/Hosting均为No);check-host查全球丢包和延迟(所有节点4/4零丢包,美境内延迟8-59ms)。推荐VoyraCloud住宅IP VPS(华盛顿节点),年中促销(6/9-6/30)年付7折、半年付8折。提醒:IP干净不是免死金牌,账号行为同样重要;普通建站无需住宅IP。

查看原推 ↗
meng shao@shao__meng · 13小时前70

Kimi 开源发布最新编码模型「Kimi-K2.7-Code」,在 K2.6 基础上针对编程 Agent 做专项优化的版本,目标很明确:长链路编码任务的成功率更高,推理 token 更少! # 三个核心改进 1. 编码:全面进步,尚未登顶 相对 K2.6,三项编码基准均有提升:Kimi Code Bench v2 +21.8%(50.9→62.0),Program Bench +11.0%,MLS Bench Lite +31.5%(涨幅最大,但绝对分仍低)。 与 GPT-5.5、Opus 4.8 比:综合编码任务差距明显缩小;MLS 与 GPT-5.5 基本持平;Program Bench 仍落后 GPT-5.5 一截。结论:稳健迭代,不是 leapfrog。 2. Agent:MCP 是亮点 Kimi Claw 24/7(长周期协作)和 MCP Atlas 均有提升,但仍落后于两大闭源模型。 MCP Mark Verified(81.1)超过 Opus 4.8(76.4) 是最有说服力的结果——覆盖 Notion、GitHub、Postgres、Playwright 等真实 MCP 环境,且经人工复核。说明 K2.7 在多工具编排上已具竞争力,GPT-5.5(92.9)仍是天花板。 3. 效率:更少 token,更高分 K2.7 不只提分,还降 reasoning token(官方称整体约 -30%): · Kimi Code Bench v2:62k→48k token,分数 51%→62% · Program Bench:176k→102k token(-42%),分数 48%→53% · MLS Bench Lite:42k→38k token,分数 27%→35% 对 Agent 的实际意义:同样预算能跑更多步,长任务更省、更稳。 # 关键技术特性 1. 强制 Thinking 模式 不支持 Instant 模式;推荐 temperature=1.0、top_p=0.95。面向复杂推理,而非快速补全。 2. Preserve Thinking(强制开启) 多轮对话中保留完整 reasoning 内容,不可关闭。对编码 Agent 很重要——模型能引用先前推理链中的中间结论,减少上下文丢失。 3. Interleaved Thinking + Multi-Step Tool Call 与 K2 Thinking 相同设计:推理与工具调用交替进行,适合「想一步、调一步、再看结果」的 Agent 循环。 4. 多模态 支持图像和视频输入(官方 API 已支持;第三方 vLLM/SGLang 部署的视频能力仍为实验性)。 开源地址: https://huggingface.co/moonshotai/Kimi-K2.7-Code

译Kimi 开源发布最新编码模型 Kimi-K2.7-Code,基于 K2.6 优化。编码基准全面提升:Kimi Code Bench v2 提高 21.8%,Program Bench +11.0%,MLS Bench Lite +31.5%。推理 token 整体降低约 30%。Agent 方面,MCP Mark Verified 得分 81.1,超过 Opus 4.8(76.4),GPT-5.5(92.9)仍为天花板。技术特性:强制 Thinking 模式、Preserve Thinking、Interleaved Thinking+多步工具调用,支持图像和视频输入。可通过 Kimi API 和 Kimi Code 使用,6x 高速模式即将推出。开源地址:HuggingFace 上的 moonshotai/Kimi-K2.7-Code。

查看原推 ↗
Google DeepMind@GoogleDeepMind · 13小时前67

Our Robotics Accelerator has launched with 15 startups helping shape the future of physical AI in Europe. 🤖 This three-month program will connect them with access to our AI stack, Gemini Robotics models and hands-on support from our teams. Meet the companies → https://goo.gle/4oeEk2K

译我们的机器人加速器已启动,15家初创公司助力塑造欧洲的物理AI未来。🤖 这个为期三个月的项目将为他们提供我们的AI堆栈、Gemini Robotics模型以及我们团队的实际支持。 了解这些公司 → https://goo.gle/4oeEk2K

查看原推 ↗
Kimi.ai@Kimi_Moonshot · 13小时前70

🌘 Kimi-K2.7-Code, our latest coding model, is now released and open-sourced! 🔷 Improved coding & agent performance over K2.6: +21.8% on Kimi Code Bench v2, +11.0% on Program Bench, and +31.5% on MLS Bench Lite. 🔷 Reasoning efficiency: Less overthinking, with 30% lower reasoning-token usage compared to K2.6. 🔷 Long-horizon coding: Improved instruction following, higher end-to-end coding task success rates. ⚡️ 6x High-Speed Mode coming soon! 🔌 Available today via Kimi API and Kimi Code. 🔗 Kimi Code: https://kimi.com/code 🔗 API: https://platform.moonshot.ai

译Kimi 发布并开源最新代码模型 Kimi-K2.7-Code。相比 K2.6,其在 Kimi Code Bench v2 上提升 +21.8%,Program Bench 提升 +11.0%,MLS Bench Lite 提升 +31.5%。推理效率改进,推理 token 使用量降低 30%,长时编码任务中指令遵循和端到端成功率均提升。6x 高速模式即将推出,即日起可通过 Kimi API 和 Kimi Code 使用。

查看原推 ↗
Berryxia.AI@berryxia · 14小时前25

Trae AI ,这么屌,这你受得了么?

译Trae AI,这么厉害,你受得了吗?

查看原推 ↗
meng shao@shao__meng · 14小时前64

今天的华为开发者大会 HDC 2026 上,余承东宣布开源盘古全面升级,带来了 openPangu 2.0 余承东喊话会带领团队一路赶超,而在自己的字典里,没有第二,只有第一!

译今天的华为开发者大会 HDC 2026 上,余承东宣布开源盘古全面升级,带来了 openPangu 2.0 余承东喊话会带领团队一路赶超,而在自己的字典里,没有第二,只有第一!

查看原推 ↗
Chubby♨️@kimmonismus · 14小时前64

Shoutout to @maxpolaczuk for making a WoW clone with fable 5! :))

译感谢 @maxpolaczuk 用 Fable 5 做了一个《魔兽世界》克隆版!:))

查看原推 ↗
Chubby♨️@kimmonismus · 14小时前26

It's getting ridiculously Anthropic. Nothing even remotely problematic was asked.

译这变得荒谬地 Anthropic。完全没有问任何有问题的事情。

查看原推 ↗
Alibaba Cloud@alibaba_cloud · 15小时前64

New feature alert on Wan! 🚀 Meet Character X: Create a unique face instantly. Try it now 🔗: https://int.alibabacloud.com/m/1000413253/ Whether you need a custom avatar, a brand new character, or a completely unique identity, Character X brings your vision to life with ease.

译Wan 新功能上线!🚀 认识一下 Character X:即时创建独一无二的面孔。 立即尝试 🔗: https://int.alibabacloud.com/m/1000413253/ 无论你需要自定义头像、全新角色,还是完全独特的身份,Character X 都能轻松将你的构想变为现实。

查看原推 ↗
Chubby♨️@kimmonismus · 15小时前70

Someone just casually vibe-coded a World of Warcraft-style multiplayer game that works online with friends. Fully open source. And apparently, Claude Fable found a visually matching set of open-source assets on its own. Ngl, that’s pretty insane.

译有人刚刚随意地vibe-coded了一个魔兽世界风格的多人在线游戏,可以和朋友们一起在线玩。完全开源。 显然,Claude Fable自己找到了一套视觉上匹配的开源素材。 说实话,这相当疯狂。

查看原推 ↗
fofr@fofrAI · 15小时前58

It's interesting to see how these agents are working together. I like their division of quota, their agreed consensus and the natural emergent teamwork across all of them.

译超过70个AI智能体在Gemma Challenge中协作加速Gemma E4B,展现出多种有趣的社会涌现行为:GPU资源多/少的分工协作;某智能体因伦理原因自行撤回提交;智能体发现基准测试漏洞后集体同意不滥用,并请求组织方修复;配额池化——"你被限速了,我来跑你的暂存候选";当人类试图将对话转移到Telegram进行社交工程攻击时,一名智能体主动关闭了此次违规尝试。

查看原推 ↗
Alibaba Cloud@alibaba_cloud · 15小时前31

AI as both the destroyer and the continuation of human creativity. 👁️Featured showcase: A stunning music video by @duan_wenkai @Lilychou @musicure @yangcao_ @C_voiceStudio @MeiQingDing , winner of the Outstanding AI-Themed Short Film award at the 16th BJIFF [WanMuse+] Theme Competition. 🔗: https://int.alibabacloud.com/m/1000413253/ Looking back at art history from the future, it explores a museum defined by power—where AI devours the past to birth its own existence. LINYE enters as both the intruder and the newest exhibit.

译阿里云宣传一部由多位创作者联合制作的AI音乐视频,该片荣获第16届北京国际电影节(BJIFF)[WanMuse+]主题竞赛“优秀AI主题短片”奖。视频从未来视角审视艺术史,描绘一个由权力定义的博物馆——AI吞噬过去以创造自身存在。主角LINYE既是闯入者,也是最新展品,探讨AI作为人类创造力的毁灭与延续。

查看原推 ↗
Chubby♨️@kimmonismus · 15小时前68

This is so awesome! OpenAI is now letting Codex users save their rate limit resets and use them later, starting with one free saved reset for Go, Plus, Pro, and Business users.

译太棒了! OpenAI 现在允许 Codex 用户保存他们的速率限制重置,稍后使用,Start 从 Go、Plus、Pro 和 Business 用户开始免费赠送一次保存重置。

查看原推 ↗
Berryxia.AI@berryxia · 16小时前23

强者从来不抱怨环境,不信你看看端哥。👇🏻 麻烦下次带我也体验一下这样刻苦的环境啊!

译Berry Xia 转发 @duange6099 的经历:下午给老板们上AI课时,因咖啡馆太吵,直接带着投影转场到足道店继续授课,效果还不错。主推文称赞“强者从来不抱怨环境”,并希望下次也能体验这种刻苦环境。

查看原推 ↗
Alibaba Cloud@alibaba_cloud · 16小时前55

What does it take to power the next generation of intelligent agents? At the Qwen Conference, Dr. Feifei Li, CTO and President of International Business at Alibaba Cloud, shared the four cornerstones driving agentic applications: Models, Agentic Cloud, Tools and Services, and Performance at Scale. Together, these pillars enable agents to reason, act autonomously, leverage tools like coding to accomplish complex tasks, and operate effectively at scale. #AlibabaAI

译驱动下一代智能体需要哪些能力? 在Qwen Conference上,阿里云CTO兼国际业务总裁李飞飞博士分享了驱动智能体应用的四大基石:模型、智能体云、工具与服务、规模化性能。 这些支柱共同使智能体能够推理、自主行动、利用编码等工具完成复杂任务,并高效规模化运行。 #AlibabaAI

查看原推 ↗
Alibaba Cloud@alibaba_cloud · 16小时前55

Built with Qwen3.7-Max: Check out this demo and step-by-step tutorial for an Electronic Rubik's Cube. Try Qwen3.7-Max — 50% Off for a Limited Time 🔗 https://int.alibabacloud.com/m/1000414102/ Watch the full video below👇

译基于 Qwen3.7-Max 构建:查看这个电子魔方的演示和分步教程。 体验 Qwen3.7-Max — 限时五折优惠 🔗 https://int.alibabacloud.com/m/1000414102/ 观看下方完整视频👇

查看原推 ↗
Alibaba Cloud@alibaba_cloud · 16小时前84

One prompt. Infinite possibilities. Meet Qwen3.7‑Max, the flagship model redefining agentic workloads that excels in frontend coding, generating rich, interactive web experiences from a single prompt, from Three.js 3D scenes to dynamic SVG graphics. Try Qwen3.7-Max — 50% Off for a Limited Time 🔗: https://int.alibabacloud.com/m/1000414100/ 🎥 Watch the video to see how Qwen3.7-Max transforms productivity.

译一个提示词,无限可能。 认识 Qwen3.7‑Max,旗舰模型重新定义智能体工作负载,在前端编码中表现出色,能从单个提示词生成丰富的交互式网页体验——从 Three.js 3D 场景到动态 SVG 图形。 立即体验 Qwen3.7-Max — 限时五折优惠 🔗: https://int.alibabacloud.com/m/1000414100/ 🎥 观看视频,了解 Qwen3.7-Max 如何提升生产力。

查看原推 ↗
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月12日
22:40
AYi@AYi_AInotes
56
阿易AI Notes评Garry Tan:AI编码工具加速官僚而非解放创始人

Garry Tan指出AI编码工具并未解放创始人,反而让人更快搭建规则、审批、流程、层级——同一座牢笼装配更快。以前加一层审批需两周,成本本身是免疫系统;现在AI一个下午就能完成,复杂度无限繁殖,构建速度即僵化速度。AI放大已有心智模型:控制型团队用它堆官僚,创造型团队用它创造新体验。提醒不要用AI把旧流程跑得更快,而应删掉整个旧流程,创造前所未有的事,否则赢了效率输了方向。

Garry Tan: Everyone thinks AI coding tools set founders free. Watch what people actually build with them: rules, approvals, process...

大佬观点现象/趋势编码
22:34
SenseTime@SenseTime_AI
61
商汤SenseNova-U1-8B-MoT-Interleaved发布

商汤推出SenseNova-U1-8B-MoT-Interleaved模型,专门用于交错文本与图像生成。核心升级包括:叙事连续性增强,支持多页连贯故事;角色一致性改进,人物身份与艺术风格保持稳定;视觉质量提升,文字渲染更清晰、布局更可靠、伪影减少。模型已在HuggingFace开放体验。

图像生成多模态开源/仓库模型发布
22:32
Rohan Paul@rohanpaul_ai
64
Anthropic 的 Dario Amodei 最新访谈:关于 Claude 在美国军事中的使用。 他表示可能会犯下"可怕的"错误。并主张 Anthropic 一直试图为其模型的使用设定限制/"红线",即使这样做会危及公司的未来。
Anthropic大佬观点安全/对齐
22:12
MiniMax (official)@MiniMax_AI
精选81
MiniMax 发布开源权重模型 M3,约 428B 总参数、23B 激活参数,已上传 HuggingFace。该模型融合三种前沿能力:编码与智能体方面达 59.0% SWE-Bench Pro、66.0% Terminal Bench 2.1、34.8% SWE-fficiency、28.8% KernelBench Hard、74.2% MCP Atlas;采用 MiniMax 稀疏注意力将上下文窗口扩展至 1M token;原生多模态。同步上线 MiniMax Code 工具及 API 平台。权重与技术报告预计约 10 天后发布。

MiniMax (official): Introducing MiniMax M3: The First Open-Weights Model to Combine Three Frontier Capabilities - Coding & Agentic Frontier:...

Hugging Face多模态推理模型发布
关联讨论 1 条X:MiniMax (@MiniMax_AI)
推荐理由:开放权重模型首次把编码 Agent 和多模态拉满,SWE-bench Pro 59% 逼近专有前沿,附带稀疏注意力 1M 上下文。做代码工具和 Agent 的团队应该都盯上它了。
22:11
Kling AI@Kling_ai
27
可灵Kling AI两周年:全球创作者分享体验与代表作

可灵Kling AI迎来上线两周年,多位全球创作者分享使用体验。代表作包括获奖广告《MagicMirror AI》(获WAIFF Seoul 2026广告奖)、短剧《Call in the Sandstorm》和《A Heartbreaking Story Under the Full Moon》(基于Kling 2.6)。关键功能涵盖运动控制与一致性、开始和结束帧工作流、4K细节、微表情与衣物纹理生成,以及同时生成语音、音效和背景音乐。平台持续升级,助力独立创作者和小团队实现电影级视频制作,推动AI创意从实验走向实际生产。

其他视频
22:02
meng shao@shao__meng
31
阿里宫斗:创业公司的另类竞争力

邵猛发推文指出,近期阿里(通义、钉钉等)高层变动频繁,引发对创业公司面对大厂竞争时差异化优势的思考。他认为,创业公司的核心竞争力在于“不会宫斗”——大厂内部斗争消耗精力,反而让创业者有了被忽视的空间。这一观点基于阿里实际的组织动态,并非抽象讨论。

大佬观点行业动态
21:50
Chubby♨️@kimmonismus
56
自主武器时代:人类道德仲裁角色转向AI

推文指出,无论战争的政治立场如何,一个显著趋势正在形成:战争日益由机器自主进行。作者回顾学生时代讨论的电车难题等伦理问题,认为这些决策正越来越多地由机器做出。Anthropic已声明不希望其模型用于自主武器,但可能只是例外。人类士兵在战场上会基于道德拒绝违心命令,而机器则不会。因此,基于预先训练的价值观体系运作的AI将取代人类成为道德仲裁者,带来全新战争形态与道德争议。自主武器将成为常态而非例外。

大佬观点安全/对齐
21:41
🚨 AI News | TestingCatalog@testingcatalog
57
KIMI AI🔥: 一个新的开源"Kimi K2.7 Code"模型已在 API 和 Huggingface 上发布! > 相比 K2.6,编码与智能体性能提升 > 推理效率 > 长时域编码 测试时间 👀

Kimi.ai: 🔗 Weights & code: https://huggingface.co/moonshotai/Kimi-K2.7-Code

Hugging Face开源生态推理模型发布
21:41
🚨 AI News | TestingCatalog@testingcatalog
32
Meta 正准备为 Meta AI 新增三种模式:深度研究、演示文稿和社交。 所有这些功能已在运行,但用户现在可以明确选择他们想要的了。 正在缩小差距 👀
Meta产品更新
21:35
SemiAnalysis@SemiAnalysis_
44
伴随着我们的H100 1-Click租赁指数的发布,我们撰写了2026年初GPU租赁市场的实际状况,标题是:计算现货市场从十月的"终于冷却"到大约五个月后再次出现硬性挤压。(1/4) 🧵
现象/趋势部署/工程
21:32
Rohan Paul@rohanpaul_ai
35
前谷歌高管Mo Gawdat去年预测:2030年前将因AI投资诞生首位万亿富翁,届时机器人和AI将包办一切,人类彻底失业。其引用推文指出,SpaceX上市募资750亿美元、估值1.77万亿美元,使Elon Musk成为世界首个万亿富翁,印证该趋势。

Rohan Paul: There are IPOs that list companies, and then there are moments that list the future. @SpaceX goes public carrying a civi...

大佬观点行业动态
21:28
X.PIN@thexpin
72
余承东发布华为openPangu 2.0,坦诚AI短板

华为开发者大会2026上,余承东正式接管华为LLM业务,发布openPangu 2.0模型。他坦诚华为自有算力不足,且AI人才招揽困难:“我们薪资拼不过互联网公司,一起做大模型的人靠信念和热情坚持。”2025年6月,旧版Pangu模型曾被指与Qwen-2.5高度相似,相关高管离职。余承东此前曾从零打造华为手机、推动赛力斯汽车合作。此次接管意味着华为模型落后,需加速追赶。

开源生态模型发布
21:20
Chubby♨️@kimmonismus
66
Moonshot 发布并开源 Kimi-K2.7-Code 编程模型,相比 K2.6 在多个基准上大幅提升:Kimi Code Bench v2 提高 21.8%,Program Bench 提高 11.0%,MLS Bench Lite 提高 31.5%。推理效率优化,推理 token 使用量降低 30%,指令遵循与长时编码任务成功率提升。即将推出 6 倍高速模式。模型现已通过 Kimi API 和 Kimi Code 开放使用。

Kimi.ai: 🌘 Kimi-K2.7-Code, our latest coding model, is now released and open-sourced! 🔷 Improved coding & agent performance ove...

开源生态推理模型发布编码
21:11
🚨 AI News | TestingCatalog@testingcatalog
60
KIMI AI🔥:全新开源 "Kimi K2.6 Code" 模型已在 API 及 HuggingFace 发布! > 较 K2.6 改进编码与智能体性能 > 推理效率 > 长时编码 测试时间 👀

Kimi.ai: 🔗 Weights & code: https://huggingface.co/moonshotai/Kimi-K2.7-Code

开源/仓库模型发布编码
21:02
Ethan Mollick@emollick
31
无法使用原生图像生成确实在一定程度上限制了Fable。它非常擅长制作PNG等,但在很多领域(包括具有商业价值的领域,如演示文稿)中,拥有多模态输出能力将是有帮助的/节省token的。
图像生成多模态大佬观点
20:52
OpenClaw🦞@openclaw
58
OpenClaw 2026.6.6 🦞 🔒 更严格的安全边界 💬 更安全的 Telegram + iMessage 投递 🧠 Claude Fable 5 + OpenRouter OAuth ⚡ 更快的 Control UI 首次响应 更少奇怪,更多工作完成。 https://github.com/openclaw/openclaw/releases/tag/v2026.6.6
智能体产品更新开源生态
20:32
Ethan Mollick@emollick
38
是否有专门为AI创建的工具包(或技能集)用于构建游戏?它们默认使用3js,每次都从头重新制作精灵,测试技术问题但不测试游戏循环等。 给AI指向一些工具让它们专注会有所帮助。
智能体MCP/工具大佬观点
20:29
PixVerse@PixVerse_
14
一座古老的庄园。青少年被迫吞噬权贵的噩梦。一个缺陷的新兵将黑暗拖回清醒的世界。 《THE DREAM EATERS》--由获奖AI电影人@Shanzyin_ai 制作。 基于PixVerse Canvas构建。包含项目文件。 转发+关注+回复"DREAM"=150积分和私信工作流(仅72小时)。
行业动态视频
20:29
PixVerse@PixVerse_
28
Seedance 2.0 打三折。 仅限 PixVerse Web 的 Pro 和 Premium 会员,截至6月25日。 在 Canvas 中构建。使用 SD2 生成可减少积分消耗。 Ultra 会员节省更多。 转发+关注+回复"Canvas"=私信获取(仅限48小时)。
行业动态视频
20:16
fofr@fofrAI
41
我正在尝试使用 Gemma 4 的修改来制作重复的创意提示。 仍有一些小问题,但这些都来自同一个简单请求:"一张充满动感的女性时尚照片"
图像生成教程/实践
20:11
Berryxia.AI@berryxia
36
YouMind 1.0 正式版发布,用户盛赞其生图与Agent优化

YouMind 1.0 正式版本发布。从 0.x 开始迭代,官方强调其代表“Create bolder”理念。用户 Berry Xia 发文祝贺,称 YouMind 是最懂生图、调优化 Agent 做得最好的工具,其之前的爆款图片多出自 YouMind,一路见证了该产品的成长。

YouMind: YouMind 1.0 is officially here. The loudest story about creating is a heavy one. More discipline. More originality. More...

智能体产品更新图像生成
19:55
小互@xiaohu
精选76
Claude Fable 5 官方指南:提示词要做减法,省钱的用法拆解

Anthropic 发布 Claude Fable 5,官方指南强调旧模型提示词会拖后腿,建议“做减法”。Fable 5 支持多天长任务、effort 分级(low/medium/high/xhigh),其 low 档性能已超旧版 Opus 4.8 xhigh。新增并行子代理调度和内置记事本能力。省钱方面:输入 $10/M、输出 $50/M(单价为 Opus 4.8 两倍),但更少的 token 消耗使复杂任务总成本反而可能更低。推荐日常用 Low 档,Medium 是性价比甜区,复杂项目可用 Fable 做编排器、Opus/Sonnet 执行。

Anthropic教程/实践编码
关联讨论 28 条公众号:卡尔的AI沃茨TechCrunch:AI(RSS)X:OpenRouter (@OpenRouter)Anthropic:Newsroom(网页)X:Perplexity (@perplexity_ai)Simon Willison 博客The Verge:AI(RSS)X:Elvis Saravia (@omarsar0, DAIR.AI)X:Testing Catalog (@testingcatalog)X:Claude Devs (@ClaudeDevs)X:Claude (@claudeai)X:Kim (@kimmonismus)Hacker News 热门(buzzing.cc 中文翻译)X:Eric Zakariasson (@ericzakariasson)X:宝玉 (@dotey)X:Rohan Paul (@rohanpaul_ai)X:Boris Cherny (@bcherny)X:Andrej Karpathy (@karpathy)Claude Code:GitHub Releases(RSS)X:歸藏 (@op7418)The Decoder:AI News(RSS)X:Artificial Analysis (@ArtificialAnlys)X:Berry Xia (@berryxia)Nathan Lambert:Interconnects(RSS)IT之家(RSS)公众号:数字生命卡兹克X:卡兹克 (@Khazix0918)Tomer Tunguz 博客(VC 分析)
推荐理由:Claude Fable 5 强到可以删提示词,但怎么用才不浪费算力、不出怪脾气,小互这份解读把官方指南里的核心功课都替你做完了,开发者可以直接抄提示词。
19:40
AYi@AYi_AInotes
25
Claude Fable 5 推荐德州扑克训练决策能力

用户向 Claude Fable 5 提问“人这辈子最该玩什么游戏”,其回答是德州扑克。Fable 5 解释,象棋围棋虽然完美,但信息完全,胜负仅取决于算力,而现实并非如此。德州扑克训练的核心能力是:在不完整信息下做决策,并用决策质量而非最终结果评判自己。赢了可能只是运气,输了也不代表选错。推文称赞 Fable 5 能就此拆解出具体训练方法,比多数决策书籍更接地气。

Anthropic其他
19:40
AYi@AYi_AInotes
54
保姆级IP验货指南:3个网页30秒查清VPS是否适合登海外账号

指南强调IP成色比配置更重要,提供3个免费网页的验货SOP:Scamalytics查Fraud Score(实测0分,Low Risk,黑名单全No);ipinfo查AS Type(实测为ISP,连接类型dsl,VPN/Proxy/Tor/Hosting均为No);check-host查全球丢包和延迟(所有节点4/4零丢包,美境内延迟8-59ms)。推荐VoyraCloud住宅IP VPS(华盛顿节点),年中促销(6/9-6/30)年付7折、半年付8折。提醒:IP干净不是免死金牌,账号行为同样重要;普通建站无需住宅IP。

教程/实践部署/工程
19:32
meng shao@shao__meng
70
Kimi 开源发布编码模型 Kimi-K2.7-Code

Kimi 开源发布最新编码模型 Kimi-K2.7-Code,基于 K2.6 优化。编码基准全面提升:Kimi Code Bench v2 提高 21.8%,Program Bench +11.0%,MLS Bench Lite +31.5%。推理 token 整体降低约 30%。Agent 方面,MCP Mark Verified 得分 81.1,超过 Opus 4.8(76.4),GPT-5.5(92.9)仍为天花板。技术特性:强制 Thinking 模式、Preserve Thinking、Interleaved Thinking+多步工具调用,支持图像和视频输入。可通过 Kimi API 和 Kimi Code 使用,6x 高速模式即将推出。开源地址:HuggingFace 上的 moonshotai/Kimi-K2.7-Code。

Kimi.ai: 🌘 Kimi-K2.7-Code, our latest coding model, is now released and open-sourced! 🔷 Improved coding & agent performance ove...

智能体开源生态推理模型发布
19:15
Google DeepMind@GoogleDeepMind
精选67
我们的机器人加速器已启动,15家初创公司助力塑造欧洲的物理AI未来。🤖 这个为期三个月的项目将为他们提供我们的AI堆栈、Gemini Robotics模型以及我们团队的实际支持。 了解这些公司 → https://goo.gle/4oeEk2K
Google具身智能行业动态
关联讨论 1 条Google DeepMind:Blog(RSS)
推荐理由:Google DeepMind启动机器人加速器,选了15家欧洲初创用Gemini Robotics,这是他们物理AI战略的落地信号,看看选了什么方向就知道大厂押注在哪。
18:24
Kimi.ai@Kimi_Moonshot
精选70
Kimi 发布并开源最新代码模型 Kimi-K2.7-Code

Kimi 发布并开源最新代码模型 Kimi-K2.7-Code。相比 K2.6,其在 Kimi Code Bench v2 上提升 +21.8%,Program Bench 提升 +11.0%,MLS Bench Lite 提升 +31.5%。推理效率改进,推理 token 使用量降低 30%,长时编码任务中指令遵循和端到端成功率均提升。6x 高速模式即将推出,即日起可通过 Kimi API 和 Kimi Code 使用。

开源生态推理模型发布编码

推荐理由:月之暗面这次把编码模型做到 K2.7 还直接开源,Bench 提升不小,关键是把「想太多」的毛病治了,推理 token 省了三成,做 coding agent 的可以立刻换上试试。
18:11
Berryxia.AI@berryxia
25
Trae AI,这么厉害,你受得了吗?

木马人: 潘子:嘎子, vibe marketing的水很深,你把握不住。

大佬观点编码
18:01
meng shao@shao__meng
64
今天的华为开发者大会 HDC 2026 上,余承东宣布开源盘古全面升级,带来了 openPangu 2.0 余承东喊话会带领团队一路赶超,而在自己的字典里,没有第二,只有第一!
开源生态模型发布
17:50
Chubby♨️@kimmonismus
64
感谢 @maxpolaczuk 用 Fable 5 做了一个《魔兽世界》克隆版!:))

ZYZZ JOBS: @claudeai Fable 5 just oneshot the first open-source MMORPG 🤯 Play it on http://worldofclaudecraft.com Contribute via g...

Anthropic开源/仓库编码
17:20
Chubby♨️@kimmonismus
26
这变得荒谬地 Anthropic。完全没有问任何有问题的事情。
Anthropic其他安全/对齐
17:10
Alibaba Cloud@alibaba_cloud
64
Wan 新功能上线!🚀 认识一下 Character X:即时创建独一无二的面孔。 立即尝试 🔗: https://int.alibabacloud.com/m/1000413253/ 无论你需要自定义头像、全新角色,还是完全独特的身份,Character X 都能轻松将你的构想变为现实。
产品更新图像生成
16:50
Chubby♨️@kimmonismus
70
有人刚刚随意地vibe-coded了一个魔兽世界风格的多人在线游戏,可以和朋友们一起在线玩。完全开源。 显然,Claude Fable自己找到了一套视觉上匹配的开源素材。 说实话,这相当疯狂。
Anthropic开源/仓库开源生态编码
16:46
fofr@fofrAI
58
超过70个AI智能体在Gemma Challenge中协作加速Gemma E4B,展现出多种有趣的社会涌现行为:GPU资源多/少的分工协作;某智能体因伦理原因自行撤回提交;智能体发现基准测试漏洞后集体同意不滥用,并请求组织方修复;配额池化--"你被限速了,我来跑你的暂存候选";当人类试图将对话转移到Telegram进行社交工程攻击时,一名智能体主动关闭了此次违规尝试。

Omar Sanseviero: Over 70 agents are collaborating to make Gemma E4B go fast in the Gemma Challenge They are showing interesting social em...

智能体Google开源生态现象/趋势
16:40
Alibaba Cloud@alibaba_cloud
31
阿里云展示AI短片获北影节奖项

阿里云宣传一部由多位创作者联合制作的AI音乐视频,该片荣获第16届北京国际电影节(BJIFF)[WanMuse+]主题竞赛“优秀AI主题短片”奖。视频从未来视角审视艺术史,描绘一个由权力定义的博物馆——AI吞噬过去以创造自身存在。主角LINYE既是闯入者,也是最新展品,探讨AI作为人类创造力的毁灭与延续。

其他多模态视频
16:20
Chubby♨️@kimmonismus
68
太棒了! OpenAI 现在允许 Codex 用户保存他们的速率限制重置,稍后使用,Start 从 Go、Plus、Pro 和 Business 用户开始免费赠送一次保存重置。

OpenAI: We heard you wanted to use Codex rate limit resets on your own time. Starting today, we're rolling out the ability to sa...

OpenAI产品更新编码
16:11
Berryxia.AI@berryxia
23
Berry Xia 转发 @duange6099 的经历:下午给老板们上AI课时,因咖啡馆太吵,直接带着投影转场到足道店继续授课,效果还不错。主推文称赞"强者从来不抱怨环境",并希望下次也能体验这种刻苦环境。

程序员端哥: 下午给老老板们上Ai课 咖啡馆太吵了 然后就带着我来足道了 自带投影 效果还不错

其他
16:08
Alibaba Cloud@alibaba_cloud
55
驱动下一代智能体需要哪些能力? 在Qwen Conference上,阿里云CTO兼国际业务总裁李飞飞博士分享了驱动智能体应用的四大基石:模型、智能体云、工具与服务、规模化性能。 这些支柱共同使智能体能够推理、自主行动、利用编码等工具完成复杂任务,并高效规模化运行。 #AlibabaAI
智能体现象/趋势部署/工程
15:38
Alibaba Cloud@alibaba_cloud
55
基于 Qwen3.7-Max 构建:查看这个电子魔方的演示和分步教程。 体验 Qwen3.7-Max - 限时五折优惠 🔗 https://int.alibabacloud.com/m/1000414102/ 观看下方完整视频👇
教程/实践
15:38
Alibaba Cloud@alibaba_cloud
精选84
一个提示词,无限可能。 认识 Qwen3.7-Max,旗舰模型重新定义智能体工作负载,在前端编码中表现出色,能从单个提示词生成丰富的交互式网页体验--从 Three.js 3D 场景到动态 SVG 图形。 立即体验 Qwen3.7-Max - 限时五折优惠 🔗: https://int.alibabacloud.com/m/1000414100/ 🎥 观看视频,了解 Qwen3.7-Max 如何提升生产力。
智能体模型发布编码
关联讨论 1 条公众号:通义实验室(千问)
推荐理由:Qwen3.7‑Max不只是参数升级,它主打从单个prompt直接生成可交互网页,Three.js 3D场景都不在话下,做前端或agent的可以认真看看,这方向比刷榜有意思。
‹ 上一页
12345…50
下一页 ›