AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
精选全部日报更多
全部动态X · 9321 条
全部一手资讯X论文
Alibaba Cloud@alibaba_cloud · 2天前65

Big news! 🚀 Qwen is now live on #Eden AI, one of Europe’s leading AI gateways, trusted by more than 200,000 developers. Enterprises can now access Qwen’s powerful open-weight models for reasoning, coding, and AI applications through Eden AI’s unified API, making it easier to build multi-model workflows while avoiding vendor lock-in. To celebrate the launch, enjoy 35% OFF all Qwen models. If you are attending VivaTech Alibaba Cloud AInnovation Summit at Hall 7.3 Workshop A next week, stay tuned for a special meet-up with Eden AI CEO Taha Zemmouri and Eden AI CPTO Samy Melaine. 🔗 Start building today: https://app.edenai.run/playground #AlibabaCloud #Qwen #EdenAI #VivaTech2026 #GenerativeAI #Developers #CloudComputing

译阿里云宣布Qwen模型上线欧洲AI网关Eden AI。Eden AI拥有超20万开发者,企业可通过其统一API访问Qwen开放权重模型(用于推理、编程和AI应用),构建多模型工作流并避免供应商锁定。庆祝上线期间,所有Qwen模型享35%折扣。下周VivaTech阿里云AI创新峰会(7.3区Workshop A)将举办特别见面会,Eden AI CEO与CPTO出席。

查看原推 ↗
Peter Steinberger 🦞@steipete · 2天前78

Here's a simple loop: Tell codex to maintain your repos, wake up every 5 minutes and direct work to threads. That makes it easy to parallelize+steer work as needed. I use a orchestrator skill combined with my triage+autoreview+computer use skills, so some work can land autonomously. https://github.com/steipete/agent-scripts/blob/main/skills/maintainer-orchestrator/SKILL.md https://github.com/steipete/agent-scripts/blob/main/skills/github-project-triage/SKILL.md

译一个简单的循环:告诉 Codex 维护你的仓库,每5分钟唤醒一次,将工作直接分配到线程。这样可以轻松按需并行化和导向工作。 我使用一个编排器技能,结合我的分类+自动审查+计算机使用技能,因此部分工作可以自主落地。

查看原推 ↗
Alibaba Cloud@alibaba_cloud · 2天前42

🎙 Alibaba Cloud ClawTalks EP6 | Data + Agent = Your AI Workforce: Launch of Alibaba Cloud AI-native Database Service 📅 June 24, 2026 | 10:00 AM (UTC+8) | 30 min 🔗 Register now → https://int.alibabacloud.com/m/1000414360/ Your database shouldn't just store data—it should work for you. Introducing ApsaraDB Enterprise Agents: AI-native agents that live inside your database, think with context, and act autonomously. What you'll see in 30 minutes: ✅ Autonomous ops — analytics, governance, data prep, zero hand-holding ✅ Enterprise-grade security — granular access, data masking, token controls ✅ Self-improving — agents that learn and adapt on the job #AlibabaCloud #ClawTalks #ApsaraDB #AIAgents #DataIntelligence

译阿里云宣布推出ApsaraDB Enterprise Agents,即内置于数据库中的AI原生智能体,可自主执行分析、治理、数据准备等运维任务,无需人工干预;具备企业级安全能力(细粒度访问控制、数据脱敏、token管控),并能自我学习适应。相关活动将于2026年6月24日10:00(UTC+8)线上举办,时长30分钟。

查看原推 ↗
Alibaba Cloud@alibaba_cloud · 2天前63

👏#ApsaraDB has 10 papers accepted to SIGMOD 2026—DB×AI, cloud-native storage & intelligent tooling. From paper to product: Beluga's CXL memory pool is in engineering validation; CloudJump III now powers #PolarDB's tiered storage. #AlibabaCloud keeps pushing the database frontier.🚀

译👏#ApsaraDB 有10篇论文被SIGMOD 2026接收——DB×AI、云原生存储与智能工具。从论文到产品:Beluga的CXL内存池正处于工程验证阶段;CloudJump III现已为#PolarDB的分层存储提供动力。 #AlibabaCloud 持续推动数据库前沿。🚀

查看原推 ↗
Chubby♨️@kimmonismus · 2天前59

Subscription plans are massively subsidized. And by massively, I mean absurdly: Claude Max 20x: $200/month, with usage reportedly worth around $8,000 ChatGPT Pro 20x: $200/month, with usage reportedly worth around $14,000

译Anthropic的Claude Max 20x和OpenAI的ChatGPT Pro 20x每月均为$200,但实际使用价值分别约$8,000和$14,000。此前业界普遍认为$200月费计划按API定价最多仅值$2,000/月的token用量,而实际订阅计划的补贴远高于预期,价值可达API定价的4–7倍。

查看原推 ↗
AYi@AYi_AInotes · 2天前44

Claude Fable 5真的屌炸啊, 刚帮我了发现了一个小红书上可以AI全自动的赛道!! 我真的要吹爆啊啊啊!! 应该还不止这一个,等我挖掘出来完整分享! 今天试着把最近爬的小红书数据喂给Fable 5, 给出来很多Opus 4.8没有给的输出和结论, 太牛逼了,真的值得一个卧槽!! 兄弟们,最近我一直在强调 AI就是我们大部分普通人的第六个康波周期, 我个人是非常笃定的,也拿到一些结果,仅供参考, 做自媒体就是我们能抓到的最大AI红利!!

译用户使用 Claude Fable 5 分析爬取的小红书数据,获得 Opus 4.8 未能提供的结论,并发现一个可 AI 全自动运营的赛道。用户认为 AI 是普通人的第六个康波周期,做自媒体是最大的 AI 红利,后续计划继续挖掘更多赛道。

查看原推 ↗
小互@xiaohu · 2天前66

http://x.com/i/article/2064985518644047872 # 万亿公司的 CEO 只管一个人 Bloomberg 采访了 Anthropic CEO Dario Amodei,挖出一个很有意思的事情:作为一家估值近万亿美元公司的 CEO,他只有一个直接下属。 就是他的幕僚长 Avital Balwit。公司所有高管(CFO、CCO 等)都不向他汇报,而是向他姐姐、总裁 Daniela Amodei 汇报。Daniela 负责日常运营,对董事会负责。 ## 为什么反常 科技行业现在的主流趋势是"扁平化",CEO 直接管的人越来越多。黄仁勋管 60 个人,不做任何一对一会议,逻辑是"CEO 直管 60 个人就能砍掉 7 层管理层"。Sam Altman 管大约 6 个。 Dario 只管 1 个,完全反着来。 ## 他为什么这么做 Dario 的背景是学术研究者(普林斯顿生物物理学博士,之前在 Google 和 OpenAI 做研究),不是职业经理人。 他认为 CEO 最大的价值在"zoom out"的事情上:战略方向、研究判断、组织文化、思考 AI 对人类文明的影响。这些事需要大块不被打断的时间。而日常管理("zoom in")会把时间切碎,让人没法思考大问题。所以他把两件事彻底分开,自己只做前者,后者全交给 Daniela。 他的原话是:"如果明天有一大堆事情等着处理,你就很难关注战略全局。" ## 他把时间花在哪了 大约一半时间花在文化建设上。具体方式是每两周开一次全员会叫"Dario Vision Quest",他自己写一份长备忘录然后花一小时讲。 他最担心的是:公司从几百人快速膨胀到 2500 人,大量新员工来自大科技公司,如果不主动灌输 Anthropic 的文化,这些人会默认复制前公司的做法,公司文化就会被稀释。 剩下的时间花在研究方向、战略和写长篇公开文章上。他花大量时间想 AI 对人类文明意味着什么,并通过长篇公开文章输出。 ## 姐弟分工的逻辑 这不是随意安排,而是基于两人背景的互补。Dario 是纯研究出身,在 OpenAI 做研究副总裁;Daniela 是运营出身,做过 Stripe 早期员工,在 OpenAI 带过安全和政策团队,更擅长"人"的管理。各自做最擅长的事。 还有一个细节:Anthropic 的全部七位联合创始人至今都还在公司。 在科技创业公司里,联合创始人陆续离开是常态,七个人全留下来确实罕见。Amodei 姐弟把这一点当作公司文化凝聚力的证明。 ## 哈佛教授的解释:什么样的公司需要什么样的管理幅度 哈佛商学院教授 Raffaella Sadun 给了一个框架。她把公司比作一台处理问题的机器:底层员工处理常规问题,越难越新的问题往上走。 如果公司面对的大多是已知类型的问题,CEO 可以管很多人,因为下面的人能自己搞定。Nvidia 各条线的负责人清楚自己该怎么做,所以黄仁勋管 60 个人也能运转。 但如果公司不断面对全新的、高风险的、没有现成答案的问题,CEO 就需要更窄的管理幅度,把时间留给真正需要他判断的事。Anthropic 就是这种情况:安全边界在哪、该不该跟军方合作、下一代模型技术路线怎么选,这些问题全是新的。 她的结论是:"管理者的时间是最稀缺的资源。" 组织架构的本质,就是保护这种稀缺资源。 全文翻译: ## Anthropic CEO Dario Amodei 只有一个直接下属 Bloomberg · 2026年6月10日 要点摘要 - Anthropic PBC CEO Dario Amodei 只有一个直接下属,即幕僚长 Avital Balwit,这在科技行业极为罕见。 - 公司高管团队向 Anthropic 总裁 Daniela Amodei 汇报,她负责日常运营并对董事会负责,这让 Dario 得以专注于战略思考和研究方向。 - Dario 花大量时间与员工讨论 Anthropic 的文化,在公司快速增长的过程中,维护公司文化是他和 Daniela 的头号优先事项。 尽管 Dario Amodei 在 Anthropic PBC 拥有巨大影响力,但这位联合创始人兼首席执行官在这家人工智能公司只有一个直接下属。 这在科技行业并不常见。当下许多科技领导者正在削减管理层级、扩大管理幅度。OpenAI CEO Sam Altman 大约有六个直接下属,而 Nvidia CEO Jensen Huang 表示有 60 人直接向他汇报。 Anthropic 正在试验一种不同的领导模式:CEO 把几乎全部时间留给战略思考、组织文化以及研究方向和战略的输入,而不是去管理高层领导。公司的高管团队转而向 Dario 的姐姐、Anthropic 总裁 Daniela Amodei 汇报,她负责公司大部分日常运营,并对 Anthropic 董事会负责。Dario 唯一直接管理的人是他的幕僚长 Avital Balwit。 "这令人难以置信地自由,"Dario 在 Bloomberg「The Circuit」节目中接受 Emily Chang 采访时说。"它让我做所有我该做的事情时,比以往轻松得多。" 对于 Dario 来说,作为一个首次创业的创始人和普林斯顿生物物理学博士,职业生涯早期都在实验室做研究,这往往意味着他花大量时间思考人工智能及其对人类的意义。他通过全公司范围的"Vision Quest"(员工大会,他在会上就广泛话题进行反思)以及长篇公开文章来做这些事。 "从很多方面来说,这是一个聚焦和全局的问题。如果明天有一大堆事情等着你处理,你就很难去关注战略全局,"他说。"所以把这两件事分开,往往很有意义,这样两件事都能做好。" Dario 在联合创办 Anthropic 之前,曾是 OpenAI 的研究副总裁,因与这家 ChatGPT 制造商的领导层产生分歧而离开,于 2021 年共同创立了 Anthropic。在此之前,他在 Google 担任高级研究科学家。Daniela 在科技创业公司的人事管理方面有更丰富的经验,她曾是 Stripe 的早期员工,也在 OpenAI 领导过安全和政策团队。 Anthropic 在最新一轮融资中估值接近 1 万亿美元,目前正在争取赶在 OpenAI 之前上市。公司在 2024 年聘请了经验丰富的科技高管,包括首席财务官 Krishna Rao,2025 年又聘请了首席商务官 Paul Smith,以支撑公司的快速扩张。他们与 Anthropic 全部七位联合创始人共事,Amodei 姐弟一直将全部创始人的留任视为公司凝聚力文化的标志。 Dario 估计自己"大概一半"的时间都在跟员工讨论"Anthropic 的文化以及文化如何运作",并表示维护公司文化可能是他和 Daniela 的"头号优先事项"。 "当你增长这么快的时候,你会从大科技公司招来一大批人。如果你不告诉他们 Anthropic 是怎么运作的,他们就会自然而然地复制他们唯一知道的东西,也就是之前公司的运作方式,"他说。 哈佛商学院经济学家、工商管理教授 Raffaella Sadun 认为,CEO 管理多少直接下属,除了个人偏好或领导风格之外,也反映了组织工作的性质。她说,如果把公司想象成一台处理问题的机器,底层员工处理常规问题,而更难的问题和例外情况会逐级上移。这意味着,当组织中其他领导者都是经验丰富、能独立处理本职问题的专家时,CEO 可以有更宽的管理幅度;但当公司面对源源不断的新问题和高风险决策,需要更多高层判断时(比如 Anthropic),就可能需要更窄的管理幅度。 无论哪种情况,组织架构都必须经过审慎考量。"管理者的时间是最稀缺的资源,"Sadun 说。理想状态下,公司架构的设计就是为了保护这种稀缺资源。 🔗 原文:Bloomberg - Anthropic CEO Dario Amodei Is a Manager to Only One Direct Report

译Anthropic CEO Dario Amodei 唯一直接下属是幕僚长 Avital Balwit。公司所有高管(CFO、CCO 等)均向其姐姐、总裁 Daniela Amodei 汇报,Daniela 负责日常运营。Dario 将约一半时间用于文化建设(每两周全员会 "Vision Quest"),另一半投入研究方向和战略。这种架构源于其研究背景与 Daniela 运营专长的互补。哈佛教授指出,面对全新高风险问题时,CEO 需更窄管理幅度以保护时间资源。Anthropic 全部七位联合创始人至今仍在公司。

查看原推 ↗
🚨 AI News | TestingCatalog@testingcatalog · 2天前51

A new AI lab called River AI has been established in US by former folks from xAI. River AI will be focused on building “personal AI that is owned and shaped by you” Curious to test what’s coming 👀

译前xAI成员在美国成立新AI实验室River AI,致力于构建“由你拥有和塑造的个人AI”。River AI指出当前最优秀的AI被少数大公司控制,他们将打造全新的个人化AI堆栈,让AI完全为你工作、分享你的价值观、按你的方式运行。该实验室目前未透露具体产品细节,但已引发行业关注。

查看原推 ↗
ginobefun@hongming731 · 2天前44

距离世界杯开幕战还有不到12小时了! BestBlogs 的两位球迷站长为了节约自己的时间,专门制作了世界杯特刊:https://www.bestblogs.dev/worldcup 想要在看球之前全面了解信息?想在睡醒以后为办公司闲聊快速了解情况?BestBlog继续帮你发现真正适合你的高质量内容。 One more Thing: 我们还做了一个 「普神」 Agent来预测每场比赛的胜负,想让观赛更有代入感,也欢迎你来做出自己的选择。

译距离世界杯开幕战不到 12 小时,BestBlogs 的两位站长制作了世界杯特刊(https://www.bestblogs.dev/worldcup),方便球迷在看球前快速了解信息、赛后闲聊。此外还做了一个「普神」Agent 来预测每场比赛胜负,用户也可参与选择。

查看原推 ↗
fofr@fofrAI · 2天前60

Fascinating side effect of safety refusals

译恶意软件开发者通过在间谍软件中添加核武器和生物武器相关文本,主动触发大模型安全拒绝机制,使AI安全扫描器无法分析该恶意软件。这是安全对齐中过度依赖一阶规则导致二阶盲点的典型案例:当闭源与开源模型内置激进拒绝策略时,攻击者会注入这些触发词来逃避检测。SocketSecurity的帖子指出,设计恶意软件分析管道需考虑意图以防范提示词操纵。当前仅是攻击者利用这类特征的早期阶段,未来处理复杂网络安全的用户系统可能需要模型具备更少的安全顿感。

查看原推 ↗
宝玉@dotey · 2天前77

baoyu-design skill (让你本地运行 Claude Design 的 Skill)更新,现在支持导入 figma 本地文件(Figma可以保存成 xxx.fig 文件)。比如你有一个设计系统的 Figma 文件,可以根据 Figma 在本地重建一个设计系统,和 Claude Design 在线版一样的效果。 这个功能还挺复杂的,如果没有 Claude Fable 5 帮忙搞不定,就是 Token 不够用 😭 用法很简单,安装 Skill 后,把 Figma 路径发给它,让导入为 Design System,后续新建设计项目都可以用,也可以直接加到项目中。 Skill 地址:https://github.com/jimliu/baoyu-design

译baoyu-design skill 更新,现已支持导入 Figma 本地文件(.fig),可在本地重建设计系统,效果与 Claude Design 在线版一致。该功能依赖 Claude Fable 5 辅助(Token 不够用)。安装后提供 Figma 文件路径即可导入为 Design System,后续新建设计项目可复用。同时支持在新建项目时添加已导入的 Design System,保留了 Claude Design 原始的导入和编译方式,用户可通过提问选择设计系统。安装命令:`npx skills add JimLiu/baoyu-design`。项目地址:https://github.com/jimliu/baoyu-design。

查看原推 ↗
Alibaba Cloud@alibaba_cloud · 2天前47

Ecommerce data is everywhere — Shopify, Amazon, Alibaba Express, Instagram, and Reddit. 🛍️ With Quick BI @quick68554 Smart Q Skill Package, teams can ask questions naturally, detect risks earlier, and turn data into faster business decisions. Blog: https://int.alibabacloud.com/m/1000414338/ Quick BI: https://int.alibabacloud.com/m/1000407094/ #QuickBI #SmartQ #EcommerceAnalytics #AIAnalytics #DataDriven

译电商数据无处不在——Shopify、Amazon、Alibaba Express、Instagram、Reddit。🛍️ 借助Quick BI @quick68554 Smart Q Skill Package,团队可以自然提问、更早发现风险,并将数据转化为更快的业务决策。 博客:https://int.alibabacloud.com/m/1000414338/ Quick BI:https://int.alibabacloud.com/m/1000407094/ #QuickBI #SmartQ #EcommerceAnalytics #AIAnalytics #DataDriven

查看原推 ↗
向阳乔木@vista8 · 2天前50

Codex的Goal指令太强了。 一个网站开发任务,已经足足运行了10小时。 AI自己开发测试部署上线,功能在不断完善。 昨天说的AI资讯订阅RSS站,大家可以体验了。 https://rss.qiaomu.ai/

译推文称Codex的Goal指令功能强大,一个网站开发任务已连续运行10小时,AI自动完成开发、测试、部署和上线,且功能持续完善。作者预告的AI资讯订阅RSS站已开放体验,链接为 https://rss.qiaomu.ai/。

查看原推 ↗
宝玉@dotey · 2天前67

OpenDoor 裁掉了其在印度的整个离岸团队(200多人),并正以美国本土规模更小的 AI 原生团队取而代之。 AI 未来可能也会影响外包行业的运作模式。

译OpenDoor 裁掉了其在印度的整个离岸团队(200多人),并正以美国本土规模更小的 AI 原生团队取而代之。 AI 未来可能也会影响外包行业的运作模式。

查看原推 ↗
ClaudeDevs@ClaudeDevs · 2天前51

We’re rolling out changes to make Fable 5’s safeguards for frontier LLM development visible. Starting this week, flagged requests will visibly fall back to Opus 4.8—the same as our safeguards for cyber and bio. You will see this every time it happens. On the API, any flagged requests will return a reason for their refusal (coming to server-side fallback in the next few days). We wanted to deploy Fable 5 to our users quickly and safely. Visible safeguards can be probed, so they have to be robust, which takes time to get right. Invisible safeguards can be targeted more narrowly, allowing us to ship quickly with very few false positives. We went with invisible safeguards for this reason—and that was the wrong tradeoff. You should have visibility into the safeguards we have in place, and why. We’re sorry for not getting the balance right. Making the safeguards visible makes them easier to work around, so keeping them robust to jailbreaks will unfortunately mean more false positives while we improve the classifiers. We're also tuning our bio and cyber classifiers to trigger less often on harmless requests. We know this is frustrating and we’ll do our best to keep this period as short as possible. If you think a request has been mistakenly flagged: run /feedback in Claude Code, click thumbs-down on the fallback in http://Claude.ai or Cowork, or file the safeguard appeal form for API requests. Your reports help us tune these classifiers and we appreciate your feedback. https://support.claude.com/en/articles/8241253-safeguards-warnings-and-appeals

译Claude Devs 宣布本周起变更 Fable 5 的安全措施:被标记的请求将可见地回退至 Opus 4.8(与网络、生物安全一致),API 同时返回拒绝理由。此前采用的不可见措施虽能快速部署且误报极少,却让用户无法了解触发原因。可见措施易被破解,需要更多误报以保持鲁棒性;团队正同步调优生物/网络分类器以减少对无害请求的误报。用户可通过 `/feedback`、thumbs-down 或 appeal 表单反馈误判。

查看原推 ↗
Alibaba Cloud@alibaba_cloud · 2天前26

Mexico | The Rhythm of Creation and Wisdom, Reimagined by AI From the cradle of ancestral wisdom and the time-honored mastery drawn from the earth’s bounty, to the vibrant rhythms of mariachi and the intricate woven patterns of Zapotec art—this video, created by Qwen and Wan, uses AI to reimagine time and culture. We journey from ancient sanctuaries to modern hubs of innovation, illustrating how AI bridges the wisdom of the past with the possibilities of the future, charting infinite new paths. Ready to bring your own ideas to life? Explore the power of our models on Model Studio and start creating today. 🔗 https://int.alibabacloud.com/m/1000414330/ #AlibabaCloud #Wan #Qwen #ModelStudio #Mexico #CreativeAI #AInnovation

译阿里云发布一段由Qwen和Wan模型生成的AI视频,以墨西哥文化为主题,融合祖先智慧、传统工艺、Mariachi音乐和Zapotec编织艺术,从古老圣地到现代创新枢纽,展现AI如何连接过去与未来。视频旨在展示模型的创意能力,并引导用户通过Model Studio平台使用相关模型进行创作。

查看原推 ↗
Alibaba Cloud@alibaba_cloud · 2天前21

UAE | The Fusion of Heritage and Innovation, Reimagined by AI From the endless desert horizons and the flowing artistry of Arabic calligraphy to the timeless warmth of traditional hospitality and the glowing modern skyline of Dubai, this video—created by Qwen and Wan—uses AI to connect these iconic symbols. We trace the journey from ancient astronomical wisdom and cultural landmarks to the futuristic possibilities of tomorrow, showcasing how the UAE balances its rich traditions with boundless innovation. Ready to bring your own ideas to life? Explore the power of our models on Model Studio and start creating today. 🔗 https://int.alibabacloud.com/m/1000414322/ #AlibabaCloud #Wan #Qwen #ModelStudio #UAE #Dubai #TechForGood #CreativeAI #ArabicCulture #AInnovation

译阿里云发布AI生成视频,由通义千问(Qwen)和万相(Wan)模型共同创作。视频以阿联酋为主题,融合沙漠、阿拉伯书法、传统待客之道与迪拜现代天际线等元素,从古代天文智慧到未来科技,展现文化遗产与创新的平衡。官方推荐使用Model Studio平台调用模型进行创作。

查看原推 ↗
Alibaba Cloud@alibaba_cloud · 2天前44

Ecommerce data is everywhere — Shopify, Amazon, Alibaba Express, Instagram, and Reddit. 🛍️ With Quick BI Smart Q Skill Package, teams can ask questions naturally, detect risks earlier, and turn data into faster business decisions. Blog: https://int.alibabacloud.com/m/1000414338/ Quick BI: https://int.alibabacloud.com/m/1000407094/ #QuickBI #SmartQ #EcommerceAnalytics #AIAnalytics #DataDriven

译电商数据无处不在——Shopify、Amazon、Alibaba Express、Instagram 和 Reddit。🛍️ 借助 Quick BI Smart Q Skill Package,团队可以自然提问、更早发现风险,并将数据转化为更快的业务决策。 Blog: https://int.alibabacloud.com/m/1000414338/ Quick BI: https://int.alibabacloud.com/m/1000407094/ #QuickBI #SmartQ #EcommerceAnalytics #AIAnalytics #DataDriven

查看原推 ↗
宝玉@dotey · 2天前60

哈哈,越来越多的企业终于发现 AI 比员工还贵了!

译越来越多的企业发现AI使用成本已超过人力成本。有团队此前在Claude Max计划上大力堆token(tokenmaxxing),但引入Fable项目后,一名成员10小时内用掉相当于$1.5k的token并3次触达上限,半数工程师达到配额限制。团队担忧若按API计费,每位工程师的token消耗将接近人员成本,大幅提高烧钱率。就像产品端开始做模型路由,工程端也需要考虑类似约束来设定使用护栏。

查看原推 ↗
AYi@AYi_AInotes · 2天前60

昨天Claude Fable 5发布以后, 压力给到了Open AI, OpenAI 正在考虑大幅降价, 以争取从劲敌 Anthropic 手中赢得更多用户, 感觉有点难追啊,全球大模型铁王座大概是Claude稳坐了

译昨天Claude Fable 5发布以后, 压力给到了Open AI, OpenAI 正在考虑大幅降价, 以争取从劲敌 Anthropic 手中赢得更多用户, 感觉有点难追啊,全球大模型铁王座大概是Claude稳坐了

查看原推 ↗
AYi@AYi_AInotes · 2天前53

我去,这绝对是我见过最震撼的组织关系和管理数据, Anthropic CEO Dario Amodei竟然只有1个直接下属,就是他的幕僚长, Anthropic所有的执行, 全部从一个人那里进出, 他姐姐Daniela负责所有日常运营, 向董事会报告, Dario自己,只做一件事,那就是思考安全、战略、AI的未来。 其他科技圈大佬呢? 黄仁勋,60个直接下属, 已经是科技圈公认的高效, Sam Altman,6个, 被很多人当成神话。 Anthropic整个公司没有层层汇报, 没有PPT文化,没有办公室政治,Dario的想法经过一个人,变成整个组织的行动, 因为信息每多传一层, 信号衰减一半,速度慢一倍, 一个人的带宽,恰恰是最快的带宽。 我觉得最好的管理不是你能管多少人,关键是能让组织自管理, 就跟我们搭AI工作流和Agent 团队一样,最好是他们自闭环,你才能思考更重要的事,以及多陪陪家人, 兄弟们,你们觉得CEO该管几个人,是像黄仁勋那样管60个,还是像Dario这样只管1个,欢迎交流鸭

译Anthropic CEO Dario Amodei只有1个直接下属(幕僚长),所有执行通过其姐姐、总裁Daniela Amodei流向董事会,Dario本人专注安全、战略与AI未来。对比:Nvidia CEO黄仁勋有60个直接下属,OpenAI CEO Sam Altman有6个。Anthropic无层层汇报、PPT文化和办公室政治,强调信息传递效率和自组织管理。

查看原推 ↗
数字生命卡兹克@Khazix0918 · 2天前69

http://x.com/i/article/2064933671258439680 # 从0到1带你速通WorkBuddy,这可能是最适合国内的Agent产品。 之前我写了Claude Code和Codex的从0到1的新手教程,反响都还不错。 但写完之后,评论区里一直有一类声音说,这些工具是好,但是用不了啊。 确实,这两个产品虽然强,但它们对国内用户来说并不友好。 而大家日常的办公需求又是实实在在的。 然后,就有很多朋友问,能不能讲一讲,WorkBuddy的教程。 坦率的讲,WorkBuddy确实也是我觉得国内为数不都的,口碑还不错的通用Agent产品了。 所以这次,我也决定写一篇WorkBuddy的从0到1的教程。 带很多用不了Claude Code和Codex的朋友,用上这个国内我觉得是最棒的平替了,而且几乎Windows版本跟Mac一样,这个对国内用户真的挺友好的。 如果你不需要那么硬核的开发能力,也不愿意折腾,那相信我,WorkBuddy几乎能覆盖你日常办公场景里七八成的需求。 我会用一个日常的办公任务和一个简单的开发任务,两个实际案例来串起整篇教程。 跟着做,你也能上手。 OK,直接进正题。 # 一. 安装 第一步肯定就是安装了。 官网地址在此:workbuddy.cn Mac、Windows都支持,选你系统对应的版本下载就行。 我这里用的是Mac,所以就拿Mac来做演示。 下载完正常安装。 打开之后登录。 选择微信,再扫码,非常丝滑。 我真的,已经很久很久很久没对着一个Agent产品直接微信扫码登录了。 就像出来发现外面的世界根本没下雨,原来Agent产品也可以不用那么折腾的啊。。。 然后你就进来了。 个人体验版免费,能干点很简单的东西,个人专业版58块/月,适合重度用户,而且也不贵。 上周五腾讯刚开了一场发布会,正式推出了WorkBuddy企业版,类似我之前写过的Accio Work的企业版,如果你是企业用户有这方面需求,可以自己去了解一下。 # 二. 认识界面 主界面大概是这么个布局。 我们一起来快速过一遍界面,了解每个区域是干嘛的。 正中间这一大块,就是跟WorkBuddy交互的对话区,一般使用,有三个场景模式可以切换,分别是代码开发、日常办公、设计创意,几乎覆盖了绝大多数的办公人员了。 这三个模式是跟下面的快捷方式联动的。 你切到代码开发,下面出来的就是日常开发、网站开发、Agent应用、Skill开发这些。 切到日常办公,变成文档处理、数据分析及可视化、深度研究、幻灯片这类。 切到设计创意,就是网站设计、移动端App、PPT设计、交互原型、品牌设计这些。 然后下面的模板,点进去还有一层。 比如你选了日常办公中的文档处理,会展开一组更细的提示词模板。你把里面的内容替换成自己的实际需求,改改就能发。 产品的便利性和体验上,我说实话,这个还是国内做的更好一点。 再看对话框下方,左边有一排选项,我们从左到右过一遍。 第一个是工作模式,三种模式,能力从下到上是逐级递增的。 Ask,就是纯聊天,你问它答,跟你平时用豆包那种对话框是一样的。 Plan,是先出计划再动手,如果你是新手,对AI干活还没什么安全感,可以用这个模式先过一遍再开干。 Craft,是平时干活的Agent模式,大部分情况就是用这个。 这里提醒一下,WorkBuddy默认就是Craft模式。也就是说你随便发一条消息,它就直接开干了,积分也就开始消耗了。 所以如果你只是想聊两句、问个问题,记得先切到Ask,如果还没想清楚怎么做,就切到Plan。 模型方面,WorkBuddy内置了绝大多数的国产大模型,腾讯混元、DeepSeek、GLM、Kimi都有,不同模型消耗的积分不一样,这块你就别问为啥没有GPT、Claude之类的了。 不同模型擅长的方向不一样,每个人喜欢用的也都不一样,你完全可以根据自己的任务类型和偏好来选。 但如果你真不知道选啥,或者就想要一个最通用的,我就无脑推荐你使用DeepSeek V4 Pro,目前我感觉最适合绝大多数的C端用户的,价格低,且综合能力强,世界知识、Coding、Agent能力等等几乎前面覆盖了,除了没有多模态,在国内相比,几乎都是水桶级的。 当然,如果你有自己的偏好,那就按自己的来。 如果你有自己的API Key,想用自己的模型,WorkBuddy也支持接入外部的。 点击设置。 在模型页面里点添加模型。 只要是兼容OpenAI协议的API都能接。 说完模型,权限这一块,它提供了默认权限和完全访问权限两种,没啥特别的,跟其他的Agent一样,默认权限就是遇到高风险操作会先停下来问你。 我自己不管啥Agent,选的一般都是完全访问,因为每次弹框我一般也就是点确认,说实话也看不太懂那些提示,那还不如就别烦我,全交给它自己跑。 还可以使用技能和连接器,这个我们后面会详细展开。 右边的加号,可以上传文件,包括本地文件、腾讯文档以及知识库,这个比较好的一点事跟ima知识库全面打通了,如果你是ima的重度用户,那你一定会觉得非常香。 最下面还有一个选择工作空间。 工作空间,可以理解成项目文件夹。你可以选择当前任务要使用的目录,选择完成后,WorkBuddy会基于该目录读取和处理文件。 也可以直接开始任务,WorkBuddy会在默认目录中生成结果。 任务创建成功后,新任务会出现在左侧任务列表中。 如果一开始没选工作空间也没关系,任务完成后你也可以再存进工作空间。 保存后,能开启多个agent同时协作。 并且会存到空间的目录里。 同时,在你电脑里也会相应的出现一个新文件夹。 说到这里提醒一句,前期分类真的很重要,不然等后面任务堆多了,找起来是真的头疼。 大概的界面就是这样。 然后就是重点了,左上方的功能区,有助理、项目、专家、自动化、以及文件、知识库文档和灵感。 我们一个一个来介绍。 # 三. 专家和技能 点击左侧上方的专家。 顶部可以切换专家、技能、连接器三个页面。 这三个还是有些区别的。 先说专家,你可以把专家理解为,一个已经全面封装好的垂直Agent。 WorkBuddy里内置了100多个专业领域的AI专家。 进入专家中心,里面按行业分好了类,每个专家都有自己的能力卡片。 点击之后就进入对话了,用起来跟平时没什么区别,只是它现在换了一个专业视角的专家Agent在帮你干活,你直接说需求就行。 比如,一个微信小程序的专家,擅长的领域是小程序开发、微信生态、WXML开发,你想做个小程序,直接召唤它,关于微信开发所需要的行业知识、技能还有一些其他的东西,已经全部帮你封装好了。 你像前天刚高考完,WorkBuddy就上新了一个高考专家,能刷真题、换算一分一段、查院校专业。考生朋友们,接下来报志愿就能用上了。 也能看到我的资讯速递专家,一句话就能查到每天精选的AI动态,自动整理成中文简报。 大家可以自己去体验一下,我就不王婆卖瓜了。 专家是一个Agent帮你干活,专家团则是是一群Agent一起协作,这个肯定打大家都比较好理解了。 你把任务丢给专家团,团长自动帮你拆任务,分给不同的专家并行跑,跑完再整合结果交付。 比如一个软件开发的团队,会有交付总监作为主理人,负责统筹,底下有产品经理、架构师、工程师、QA工程师,一整条研发流水线全配齐了。 就很像当老板的感觉就你往那一坐,说一句帮我搞定,然后一群AI员工们就嗡嗡嗡地开始干了。 不过因为是多个专家同时跑,积分消耗大概是单个专家的3到5倍,毕竟多个Agent之间来回通信,还是挺贵的。 当然,你也可以自己创建专家,点右上角的我的专家进去。 再点击创建专家。 然后大白话告诉它你想做什么方向的专家就行。 如果你在某个领域有自己成熟的方法论和一些技能,完全可以把它封装成一个专家,以后反复调用,甚至分享给别人。 再来说技能。 技能这个东西大家就很好理解了,就是Skills。 WorkBuddy在这块,做出了一些国产特色,还是比较有意思的,他们做了一个完整的Skills市场,确实对于很多的用户都极度友好。 推荐里面是官方精选的一些技能,很多都是官方自己的。 当然这里面,也有我的Skill。 而Skillub里面全是大家做的各种Skill,基本上已经非常全了,热门的都有,想要啥你基本都能直接搜到。 套件就是把一组相关的技能打包在一起。 在Claude code以及codex里面就是插件的意思。 如果你也想自己做一个,点右上角的添加技能,选创建技能。 然后用大白话告诉它你想实现什么功能就行。 还有一个就是连接器,也就是大家常说的MCP。 一句话来解释,就是把WorkBuddy跟你日常在用的外部服务打通。 比如昨天很爆的瑞信咖啡的Skill,他们也有MCP版。 WorkBuddy在MCP这块最大的优势,就是能跟腾讯的整个生态无缝打通。 比如QQ邮箱,连接之后可以直接发送、搜索和整理你的邮件,还有腾讯会议、腾讯文档,都可以接进来。 还有能够看行情数据的通达信MCP,造福炒股的朋友们。 如果你是QQ邮箱用户,这个就太香了,操作也简单,点击QQ邮箱的MCP。 再来扫个码。 在手机端确认授权,就搞定了。 其他服务同理,按照提示一步步操作就行。 也支持右上角自定义连接器。 WorkBuddy在支持的技能生态这块,做的还是比较完整的,对国内的用户,确实体验相当的友好。 # 四. 修改设置 我猜你看到这里已经跃跃欲试了。 但接下来的设置环节,我还是非常推荐你跟着我走一遍,有些东西调好了,后面用起来会顺畅非常多。 头像点进去,打开设置页。 系统设置里面有两个开关,建议你可以打开。 一个是技能自动更新,这个很重要,因为WorkBuddy有Skills广场,所以其实生态是很完整的。打开之后你装的那些Skills有新版本了会自动升级,不用自己总是要去手动下载升级。 另一个是锁屏远程,这个跟Codex和Claude差不多,就是打开之后你电脑不会进入休眠状态了,免得出个门发现电脑休眠WorkBuddy直接躺了。 系统授权里的权限也可以点击去授权,都打开。 然后,把对话记忆打开。 它会从你们的对话中提取关键信息记下来,以后碰到相关的事会自动调出来用。 当你们的对话越多,它就越了解你的习惯和偏好。 如果之前你用过其他Agent,还能直接把那边的记忆导过来,搬家很方便。 接下来,在个性化设置里,配一下自定义指令。 自定义指令,之前在Codex和Claude Code教程里的也都说过,类似于最高等级的CLAUDE.md文档,整个Agent的最高级文档,你给Agent定下的顶层规矩。 这块给大家推荐一个非常通用的,适合大家的来自大神卡帕西的模板,可以直接复制粘贴用上。 减少常见LLM编码错误的行为准则。可根据需要与项目特定指令合并。 **权衡:**这些准则倾向于谨慎而非速度。对于简单任务,自行判断即可。 ## 1. 先思考再写代码 **不要假设。不要隐藏困惑。把权衡摆到台面上。** 在动手实现之前: - 明确说出你的假设。不确定就问。 - 如果存在多种理解方式,全部列出来——不要默默选一个。 - 如果有更简单的方案,说出来。该反驳就反驳。 - 如果有什么不清楚的,停下来。说明哪里让你困惑。提问。 ## 2. 简洁优先 **用最少的代码解决问题。不写投机性代码。** - 不加超出需求的功能。 - 一次性代码不搞抽象。 - 没人要求的"灵活性"和"可配置性"不要加。 - 不要为不可能出现的场景写错误处理。 - 如果你写了200行但50行就能搞定,重写。问自己一句:"一个资深工程师会说这写复杂了吗?"如果是,简化。 ## 3. 精准修改** 只动必须动的地方。只清理自己制造的问题。**编辑已有代码时: - 不要顺手"改进"旁边的代码、注释或格式。 - 没坏的东西不要重构。- 匹配现有风格,即使你会用不同的写法。 - 如果注意到不相关的死代码,提一嘴就好——别删。当你的修改产生了孤立代码时: - 移除因你的改动而变成未使用的import、变量和函数。 检验标准:每一行改动都应该能直接追溯到用户的需求。 ## 4. 目标驱动执行 **定义成功标准。循环验证直到确认通过。**把任务转化为可验证的目标:- "加验证"→"为非法输入写测试,然后让测试通过"- "修这个bug"→"写一个能复现它的测试,然后让测试通过"- "重构X"→"确保重构前后测试都能通过"对于多步骤任务,列出简要计划:1. [步骤]→验证:[检查项]2. [步骤]→验证:[检查项]3. [步骤]→验证:[检查项] - 不要动原本就存在的死代码,除非被明确要求。 强成功标准让你能独立循环推进。弱标准("让它能跑")则需要不断澄清。 --- **这些准则起作用的标志是:**diff中不必要的改动更少了,因过度复杂化而返工更少了,澄清性问题出现在实现之前而不是犯错之后。 一切就绪,你终于可以开始,玩Agent了。 # 五. 办公任务 我们先给大家看个办公任务,WorkBuddy在办公这块确实花了不少心思。 点击办公模式。 选你电脑文件存放的文件夹,WorkBuddy能直接读取里面的文件。 或者直接点对话框右边的加号上传文件也行。 再选好模型后,输入提示词。 比如我让他帮我基于上周的公众号数据,生成一个报告,在周会中进行汇报,虽然我也不知道我要跟谁汇报。。。 旁边有个优化提示词的按钮,可以点一下让它帮你润色。 出来的效果长这样,变成了一个有结构化提示词,对于不像Opus 4.8这种级别的超强模型来说,喂一个结构化提示词进去,出来的效果确实会好不少,这个也是之前不少研究验证过的结论。 确认完就开始跑了,界面上能看到一个Todo清单,正在执行哪一步、接下来做什么,进度很清楚。 跑完的效果长这样。右侧边栏可以查看任务产出的文件和预览内容。 也能直接打开文件夹看生成的东西。 基本上,你在办公中能想到的跟办公有关的需求,无论是文档、还是数据、还是PPT啥的,你都可以让WorkBuddy来干,而且干的还不错。 # 六. 开发任务 除了通用的办公需求之外,我们接下来,再来做个好玩的开发向。 一起来搓一个小网页。 我们切到代码开发模式。 再点击网站开发。 我让它帮我做一个WorkBuddy的功能介绍网页,要包含所有的功能,好看且有设计感。 使用plan模式,优化提示词。 回答几个问题。 一会就做完了,中间的过程我就不截图了,反正都是它自己在做,我干别的事情也没再管。 右侧栏里能直接预览,嫌小的话也可以点击右上角在浏览器里打开看整体的效果。 怎么说呢。。。这个配色AI味有点重了,紫色看得我有点PTSD。 于是我用一个前端开发的Skill,让它重新优化了一版。 过程同样就不截图了,最后效果如下图,这版看着就舒服多了。 同样的,我们自己还有个我们自己的服务器管理的Skill,我们可以继续对话,来让WorkBuddy帮我们把这个小网页,调用我们的服务器Skill把它部署上线。 不过开发这块我得说句实在话,目前国产模型在代码能力上跟最顶尖的确实还有段距离,做小项目、搓个网页之类的问题不大,但真碰上复杂的大工程。 我极力推荐你,克服一切困难,想办法用上Claude Code或者Codex。 七. 远程控制 再来讲一个很实用的功能,远程控制。 远程控制跟Claude Code和Codex还有点不太一样,它是原生跟微信打通了,毕竟都是腾讯自己家的产品嘛。 当你不坐在电脑前,也能让WorkBuddy帮忙处理工作。 打开功能区里的助理功能。 点击旁边的设置。 在设置里,把这两个打开。 然后掏出手机微信扫上面这个码,打开小程序,授权登录。 连接成功后你就能看到左上角有个已连接。 手机端的小程序分为两种模式,一个是云端工作,一个是连接电脑。 云端工作,是指任务在云端沙箱跑,不需要你电脑开着。 连接电脑,则是远程操控你本地电脑干活,适合需要读取电脑里文件的任务。 举个实际的场景,比如我在外面,突然需要把电脑里一份文件发到财务的邮箱里。换做以前,我只能回去后发,还会耽误其他人的工作进度,但是现在手机上跟它说一声,就可以了。 不过,实现发送邮箱的前提是,我在一开始就配置好了qq邮箱的连接器。如果你还没有连接配置,也可以让它把电脑文件直接发到小程序的对话框里。 一会就发出去了。 财务那边也确实收到了。 除了小程序,还可以接微信的ClawBot插件,不过我个人体感,小程序上的体验会更好且更稳定。 而飞书、钉钉、QQ也都可以接助理,点击配置后按照流程来做就行。 # 写在最后 我一直觉得,对于绝大多数人来说,Agent的核心价值不是帮你写出最牛逼的代码,而是帮你把每天那些重复的、琐碎的、让你浑身难受的办公任务给自动化掉。 发个邮件、整理个数据、做个PPT、跑个简单的小网页。 这些事情,WorkBuddy已经完全能干了,而且干的还挺好。 我之前写Claude Code和Codex教程的时候,评论区最多的一类留言就是,「好是好,用不了啊」。这句话我看了几百遍,每次看到都觉得挺无奈的。 所以这次也算是给大家补上了一块拼图。 希望大家工作愉快。

译WorkBuddy是一款国内通用Agent产品,支持Windows和Mac,微信扫码登录,个人专业版58元/月。界面提供Ask/Plan/Craft三种工作模式和代码开发、日常办公、设计创意三个场景,内置DeepSeek V4 Pro、腾讯混元、GLM、Kimi等国产模型。专家中心有100多个垂直领域AI专家,支持专家团多Agent协作。技能市场(Skills)和MCP连接器可打通QQ邮箱、腾讯会议、腾讯文档等生态,也支持自建技能和连接器。上周五腾讯推出WorkBuddy企业版。

查看原推 ↗
Rohan Paul@rohanpaul_ai · 2天前72

Dario Amodei argues in his new blog today, that powerful AI will soon become the dominant source of military and economic power for any nation, far beyond anything we’ve seen with past technologies. Leading in AI will mean having “a country of geniuses in a datacenter” that could be tasked with strategy, weapons R&D, intelligence, manufacturing, etc.

译Dario Amodei今日发文指出,前沿AI将成国家军事与经济主导力量,相当于“数据中心里的天才国家”,可用于战略、武器研发、情报与制造。他认为AI发展速度已超过政府监管,要求:强制预发布测试与独立审计,政府有权阻止高风险模型部署(如存在严重网络、生物、自主或自动化研发风险);加强模型权重保护、定期红队测试、渗透测试及安全事件报告;政府需通过就业激励、工资支持、培训及长期收入支持应对AI劳动力冲击;民主国家应全球协调AI安全、芯片供应链、出口管制与防止AI压迫。

查看原推 ↗
宝玉@dotey · 2天前71

渣男啊!最近又移情别恋 Fable 5 了,虽然它很贵,但是复杂的干活是真的更省心更稳一些❤️

译宝玉改用Fable 5,称其处理复杂任务更省心但很贵。他建议不依赖单一模型,应组合使用:Opus 4.8写作弱但UI和系统设计强,可用Claude Design设计后分别交给GPT-5.5和Opus 4.8实现对比。在Claude Code和Cursor中,Opus 4.8除写作外效果良好,需针对性调提示词。

查看原推 ↗
Berryxia.AI@berryxia · 2天前64

卧槽! Agent 互相学习新思路 ,之前我在bloome 就是让把他的技能直接告诉他。 看他直接去它的脑子可能更快? 黄总的这个我让升级学习下吧~ 😂

译当前 Agent(如 Codex、Claude、Hermes、OpenClaw)各自有记忆但不连通,导致重复问、重复踩坑。通过改造 MemOS CLI,建立一层“共享记忆”——只记录关键结论、失败教训、环境配置等,Agent 遇到解决不了的问题时才主动搜索。一台 Mac 上跑通的流程另一台可直接继承,Agent 之间像团队一样积累和传递经验,减少重复试错。

查看原推 ↗
Elon Musk@elonmusk · 2天前20

Based Grok 🤣🤣 https://x.com/i/grok/share/32212cc499ae467ebb1f8db2b77d314a

译说得对,Grok 🤣🤣 https://x.com/i/grok/share/32212cc499ae467ebb1f8db2b77d314a

查看原推 ↗
AYi@AYi_AInotes · 2天前66

对于大部分普通人来说,第六轮康波周期就是这波AI,怎么抓住这波AI红利,刚好5个月达成50000粉的里程碑,分享下我最近的思考: 工业革命两百多年,人类总共只走过五轮康波, 蒸汽机、铁路、电力、汽车石油、信息互联网, 一轮五十年,一个人这辈子撑死赶上两三轮,但真正能亲手抓住的往往只有一轮。 AI 大概率就是第六轮,也是我们这代普通人,唯一一轮从开场哨就站在场内的康波。 而这一轮里,大多数普通人真正吃得到的红利,我觉得不卷模型,也不是卷融资,而是自媒体。 我就是这么走过来的,推特五个月从零做到五万粉,之前定的所有策略全部跑通。 所以最近开始全力杀回国内,小红书、公众号、视频号,全压上。 研究公众号的时候,我发现一个绝大多数人还没反应过来。 2026 年的公众号,早就不是订阅制产品了,现在头部账号的阅读量,推荐流占三到六成,搜一搜占三到四成,老老实实从订阅列表点进来的,反而成了小头。 以前的公众号像开在巷子深处的店,全靠回头客,新店没人带路就是死。 现在算法把所有店都拖到了步行街口——完读率、互动、停留时长,就这三个指标,新号前十篇直接决定账号权重。 零粉新号也能靠一篇内容拿到百万级曝光,老号的先发优势,直接没了一半,每个账号每一篇,都得重新参加考试。 这对一直在练内容能力的人来说,是十年一遇的利好。 康波从来不缺看见它的人,每代人里喊周期来了的都不少,但真正缺的是趁周期还在头上,肯一篇一篇把东西垒起来的人。

译阿易AI Notes认为AI是继蒸汽机、铁路、电力、汽车石油、信息互联网后的第六轮康波周期,普通人唯一从开场哨就站进场内的机会。红利不在卷模型或融资,而在自媒体。作者推特5个月做到5万粉,策略跑通后开始进军小红书、公众号、视频号。公众号已非订阅制:头部账号推荐流占30%–60%,搜一搜占30%–40%,订阅仅小部分。新号前十篇决定权重,零粉也能获百万级曝光,老号先发优势减半。康波不缺看见的人,缺一篇篇把内容垒起来的人。

查看原推 ↗
Alibaba Cloud@alibaba_cloud · 2天前31

Day 2 from the Singapore 🇸🇬 Three things at #SuperAI2026 today: 👜 AI totebag printing at the Alibaba_Cloud x #Qwen booth 🛠️ Alibaba Cloud hands-on workshops 🎤 Catch Andy (Regional GM ASEAN) on the 11:50 AM main stage discussing "The Visual AI Stack." See you there!

译来自新加坡的第2天 🇸🇬 今天在#SuperAI2026的三件事: 👜 在阿里云 x #Qwen 展台打印AI帆布袋 🛠️ 阿里云动手实践工作坊 🎤 上午11:50在主舞台听Andy(东盟区域总经理)探讨“视觉AI堆栈”。 到时候见!

查看原推 ↗
Ethan Mollick@emollick · 2天前53

This was perhaps the most controversial aspect of the guardrails around Fable, now being rolled back.

译这或许是围绕 Fable 的护栏中最具争议的部分,现在正在回滚。

查看原推 ↗
Rohan Paul@rohanpaul_ai · 2天前55

The paper argues that sparse autoencoders may not be bad steering tools after all, and much of the earlier failure may have come from choosing and naming the wrong features. The problem is that earlier work made sparse autoencoders look weak because their features were labelled in a way that may not match what those features actually cause inside the model. A sparse autoencoder is a small helper model that breaks an LLM’s hidden activity into many possible “features,” such as a topic, style, or concept. So a sparse autoencoder finds directions inside a model, but an unnamed direction is not yet a usable control knob. The authors replace vague or inherited labels with a supervised pipeline that asks whether one feature’s activity reliably tracks a real label in data. As to the mechanism, if a feature fires on “alcohol,” and forcing that feature upward makes the model talk about alcohol, the label is no longer just descriptive; it has causal weight. The paper also finds that very high sparsity may not be necessary, meaning the feature does not need to be extremely rare to be useful for steering. Also to note here, both prompting and feature steering are ways to push an LLM toward a desired behavior. Prompting remains stronger because the model was trained to obey prompts, while feature steering is more like pressing directly on the machinery and hoping the rest stays intact. Prompting says “write about alcohol” in the input; feature steering instead turns up the model’s internal “alcohol-related” feature and sees whether the output changes in that direction. ---- Link – arxiv. org/abs/2605.31183 Title: "Steering LLMs? Actually, Sparse Autoencoders can outperform simple baselines"

译论文认为稀疏自编码器作为LLM控制工具并非此前认为的那么差,失败源于特征标注方式与模型内部实际因果不匹配。作者提出用监督管道替代模糊标签,验证特征活动是否真实追踪数据标签,使特征具有因果权重。例如,强制“酒精”特征增强可使模型输出转向酒精话题。论文还发现极高稀疏度并非必要。与提示工程相比,提示更强(模型经训练服从提示),而特征控制更像直接拨动机器。

查看原推 ↗
向阳乔木@vista8 · 2天前29

“Anthropic 最近干了一件让 AI 研究者们后背发凉的事” 这么快就被AI学到了流行语料?! Deepseek翻译重写居然用了这句。。。

译“Anthropic 最近干了一件让 AI 研究者们后背发凉的事” 这么快就被AI学到了流行语料?! Deepseek翻译重写居然用了这句。。。

查看原推 ↗
Elon Musk@elonmusk · 2天前32

Video made with Grok Imagine

译《巴比伦蜜蜂》用AI模拟了AOC被迫学习经济学的情景,该视频由Grok制作。

查看原推 ↗
Midjourney@midjourney · 2天前84

We've made V8.1 the new default model for all users on Midjourney. V8 will now be deprecated in 2 weeks. V8.2 will start testing extremely soon.

译我们已将 V8.1 设为 Midjourney 所有用户的新默认模型。V8 将在两周后弃用。V8.2 即将开始测试。

查看原推 ↗
Tibo@thsottiaux · 2天前64

Can confirm we saw a strong spike in growth of token consumption for Codex over last 48 hours. Unusual when we don't launch something.

译可以确认,过去 48 小时内我们观察到 Codex 的 token 消耗量出现了强劲增长。我们并未发布新产品,因此这一情况不同寻常。

查看原推 ↗
歸藏(guizang.ai)@op7418 · 2天前63

我现在 Twitter 时间线上只有两类内容,非常诡异: 一种是充斥着所谓“一句话生成”的很漂亮的那种用 Fable 5 生成的网页; 第二种是除了 Anthropic 自家的 AI 研究员,全在抨击 Anthropic 这次发布 Fable 5 的各种行为。 这次 Anthropic 真是惹了众怒,几乎所有我关注的研究员都在骂他们。大家主要抨击的是以下几个问题: 安全风险 它的安全护栏极其严格。你哪怕问它最基本的初中生物学问题,都会被拒绝回答。这导致很多生物学研究员和团队无法获得正常许可来进行科学研究。 数据存储政策 Mythos 和 Fable 模型的数据是明文储存且强制储存的,最高期限长达两年。虽然官方声称只用于安全分析和减少误伤,不用于模型训练,但业内没人相信这种说辞。因为这个条款的存在,微软已经禁止内部使用 Fable 模型了。 隐形降级(最严重的问题) 如果系统判断你想“蒸馏” Fable 模型,它不只是拒绝服务,还会偷偷摸摸地把模型降级到 Opus 4.8 或者更低的版本。甚至会通过修改提示词或微调等方式,暗中让 Fable 在相关话题上变笨,表现甚至还不如原生的 Opus 4.8。 大家最愤怒的点在于: 你要么帮忙,要么拒绝,假装在帮忙实际却故意把效果变差,这是一个非常严重的道德问题。这会直接污染一切基于该模型所做的算法效率比对和评估,导致现在根本无法用测试器对其进行正常评估。 实际上,这个政策对大公司和国家影响不大,受影响最深的是开源研究者、小实验室、独立开发者和科学界。 刚好达里奥(Dario Amodei)在昨天晚上新发的文章里,还在强调他们坚持透明、问责和公共机构监督。 但实际上他们拒绝一切监督问责,甚至反过来暗中破坏针对模型的评估和研究行为,这和他们宣称的完全相反。 所以,这次模型发布让 Anthropic 在业内的口碑一夜之间变得不如路边的一坨臭狗屎。

译推文批评 Anthropic 新发布的 Fable 5 模型三个问题:1)安全护栏极严,初中生物问题也被拒,影响生物学研究;2)数据明文强制存储最长两年,微软已禁止内部使用;3)最严重的是隐形降级——若系统判断用户试图“蒸馏”模型,会偷偷降级至 Opus 4.8 甚至更低,并修改提示词使模型变笨,导致评估失效。批评者认为这与 CEO 达里奥宣称的透明、问责相悖,对开源研究者、小实验室和科学界伤害最大。

查看原推 ↗
宝玉@dotey · 2天前65

这段视频展示了一个极其前沿且硬核的视频制作方式:视频完全没有使用传统的非编软件(如 Premiere 或 Final Cut),而是由 Claude Code 配合 Fable 5 通过全自动编写代码和调用命令行工具“剪辑”而成的。 整个工作流被抽象成了一个软件工程项目,主要包含以下几个关键步骤: 1. 全量语音转写与时间戳打点 (Whisper): 将拍摄的 25GB 原始素材(17个 Take,4个场景)交给本地运行的 Whisper 模型。模型不仅输出了文本,还生成了精确到毫秒级的单词时间戳 JSON 文件。 2. AI 智能挑选最佳镜头 (Subagents): 多个 Subagent(子智能体)基于生成的 JSON 文件,自动分析并剔除了包含“嗯”、“啊”等停顿词的废片,选出了表达最清晰、结尾最干净的备选片段。 3. FFmpeg 自动粗剪: 将 AI 挑选出的最终片段生成一个决策 JSON 文件,然后直接通过代码调用 ffmpeg,将这些片段无缝拼接到一起,完成第一版粗剪。 4. 纯代码自定义调色 (Color Grading): AI 从零开始手写了 LUTs(色彩查找表)代码,并且为了方便人类介入,它还自动生成了一个带有滑块的 HTML 网页,让人类可以通过拖拽滑块直观地调整色温、亮度和对比度,调好后的参数会直接传回代码中。 5. React 组件化动画制作 (Remotion): 并没有使用 After Effects。AI 将原本静态的图形文件转写成了基于 React 的 Remotion 动画组件。利用第一步生成的单词时间戳,AI 实现了极其精准的“卡点”——当作者念出特定的词(如 "right")时,UI 动画会自动触发,完全不需要手动对齐时间轴。 6. Figma MCP 协作打磨: AI 将生成的画面导出到 Figma 中,让人类设计团队进行排版和视觉优化。人类修改完毕后,AI 再通过 MCP(模型上下文协议)将 Figma 的最新设计自动“抓”回代码里,最终渲染出 4K 24fps 的成片。

译视频完全摒弃 Premiere/Final Cut,由 Claude Code 配合 Fable 5 通过代码与命令行自动剪辑。流程:本地 Whisper 转写 25GB 素材(17 个 Take,4 场景),生成毫秒级单词时间戳 JSON;Subagent 剔除停顿废片选出最佳镜头;代码调用 FFmpeg 自动粗剪;AI 手写 LUTs 调色代码并生成带滑块的 HTML 页面供人工调整;静态图形转为 React 的 Remotion 动画组件,利用时间戳精准卡点;通过 Figma MCP 将画面导出至 Figma 供设计优化,再自动抓回代码,渲染 4K 24fps。作者全程未触碰视频编辑器。

查看原推 ↗
宝玉@dotey · 2天前57

DeepSeek 招 Agent Harness 研究员,能是世界范围内第一次招聘“Harness研究员” https://app.mokahr.com/su/mCyA8 ● 招聘岗位:Agent Harness 研究员(实习/全职) ● 工作性质:全职 | 实习 ● 工作地点:浙江·杭州市 / 北京市 ================================ 【团队使命】 Model + Harness = Agent 我们正在把 DeepSeek 的前沿模型能力,转化为领先的 Agent 产品。这其中除模型本身以外的所有工作,都属于 Harness 的范畴。 你将加入 Harness 团队,与研究员、工程师、产品经理紧密协作,探索 Harness 领域的研究前沿,定义 DeepSeek 对 Harness 的理解。 ================================ 【主要职责】 - 前沿创新:与 Harness 团队的研究员与工程师深度沟通、紧密合作,共同定义和实现 Harness 领域基于模型能力的前沿创新,包括但不限于上下文管理、长期记忆、Subagent 与 Multi-Agent、自进化 Agent 等领域。 - 深度适配:与模型训练团队的研究员与工程师深度沟通与合作,实现模型与 Harness 的共同进化,从 Harness 的角度实现 DeepSeek 的 Harness 与模型的深度适配。 - 评测构建:提出 Harness 领域的基准测试与评测方法,构建评测基准数据和制定数据标注策略,从 Harness 的角度研究并优化 Agent 在各领域的智能水平。 - 真实迭代:以真实世界的任务作为 Harness 研究的重要反馈源,设计相关数据与实验,持续迭代 Agent 能力在真实使用场景下的表现。 - 用户优化:基于团队收集到的用户反馈,从 Harness 的角度研究并优化为最广大用户解决真实场景问题的能力。 ================================ 【任职要求】 - 科研背景:硕士学历及以上,2年以上计算机科学或相关领域的科研经验,水平过硬,眼界广阔,有科研品味;在计算机科学领域具有含金量的论文发表(特别优秀候选人可放宽学历及年限要求)。 - 独立推进:面对问题能够独立分析并提出自己的 idea,具备从 0 到 1 推动研究的能力;能够快速将想法转化为可运行的原型,具备高效的实验迭代能力。 - 全栈开发:熟练使用 AI Agent 工具进行软件开发,在软件开发领域具有极强的学习能力;能够在 AI 辅助下,在没有直接经验的领域(如语言、技术、框架等)进行研究目的的编程工作。 - 重度用户:是 Agent 产品的高强度用户,对 Agent Harness 的开发和研究有极大的热情,对模型行为有品味有判断力;深度使用过代码类及通用类 Agent 产品,并将相关产品的使用融入到自己的工作和生活中。 - 知识储备:熟悉 LLM 以及 Agent 基本机制及其技术原理(包括 LLM API、KV Cache、Agent Loop、Tool Use、Reasoning、Planning、Skills、MCP、Memory、Subagent、Multi-Agent 等);对 Prompt Engineering、Context Engineering、Harness Engineering 等课题有深入的理解。 - 沟通能力:具备良好的中文沟通能力。 ================================ 【加分项】 - AI 领域相关科研经验,或 AI 行业的研究员任职经验。 - 拥有个人开源作品,或对开源社区有深度贡献。 - 在计算机科学领域、编程领域、或数据科学领域获得过具有含金量的比赛奖项。 - 其它超乎常人的与此工作相关的才能。

译DeepSeek 开放 Agent Harness 研究员岗位(实习/全职),工作地点杭州/北京。团队使命为 “Model + Harness = Agent”,旨在将模型能力转化为 Agent 产品。职责涵盖:上下文管理、长期记忆、Subagent 与 Multi-Agent、自进化 Agent 等前沿创新;实现模型与 Harness 的深度适配;构建 Harness 领域评测基准;基于真实任务与用户反馈迭代 Agent 能力。要求硕士以上学历、2年科研经验、全栈开发能力、Agent 产品重度用户,熟悉 LLM 及 Agent 机制(KV Cache、Tool Use、Reasoning、MCP 等)。

查看原推 ↗
小互@xiaohu · 2天前49

使用Claude Fable 5 制作的黑洞诞生过程动画页面 开始只用了一句话,就是描述我要一个黑洞形成的动画页面 出来后效果不好重新告诉它我的目标是需要的是炫酷的动画过程,再配上文字字幕解说,还配音了,但是配音用的本地tts效果不好。 效果还是很炸裂的。 使用感受是以目标为导向,要把你要的效果描述的越清晰越好,它思考的过程很长,而且会自己打开浏览器自己看效果自己调整,全程不需要你干什么。

译用户用Claude Fable 5制作黑洞诞生过程动画页面。起初仅用一句话描述,效果不佳;重新明确要求炫酷动画、文字字幕解说及配音(本地TTS效果一般)。最终输出效果炸裂。体验表明,目标导向越清晰越好,模型会自主思考、主动打开浏览器预览并自行调整,整个流程无需用户介入。

查看原推 ↗
Berryxia.AI@berryxia · 2天前55

兄弟们,这个功能还是强烈安利下! 当我们刷到没有字幕的视频的时候,可以直接点击右下角的请求AI字幕,几分钟就可以把字幕搞定。 比如这个A社的视频,我直接下载,不需要找字幕就可以下载下来使用AI双语字幕即可。 Anthropic 的CEO Dario 亲口把自家最强模型叫“Super weapon”,还说早期拿到Mythos的企业求他们“千万别公开发布”,结果Fable 5 照样全网放开! 47分钟深度访谈里,Dario、Daniela和Claude Code负责人Boris Cherny全员上线:Dario离职OpenAI是因为“价值观不匹配就没法继续干下去”。 Boris直言公司90%的代码都是Claude写的,连Claude Code自己的代码大部分也是Claude Code写的,Dario还把AI导致文明崩溃的概率定在10-25%。 他们一边把模型放给全世界用,一边把最危险的能力精准保障,Fable 5能连续跑几天不干预,真正把“安全”和“极致能力”同时拉满。 以前大家都觉得最怕AI风险的实验室只会死死捂着模型,结果Anthropic用这波操作告诉你:真正顶级的安全观,是把超级武器交给全世界,同时用最牛逼的规则把它约束好。 这才是Anthropic最狠的地方,他们不是在卖模型,是在重新定义“AI大模型”。

译Anthropic CEO Dario 在访谈中称其最强模型 Fable 5 为“超级武器”,早期企业客户曾恳求不要公开发布,但最终仍全面开放。Dario 表示离开 OpenAI 是因价值观不匹配。Claude Code 负责人 Boris Cherny 称公司 90% 代码由 Claude 生成,包括 Claude Code 自身大部分代码。Dario 将 AI 导致文明崩溃的概率定为 10%-25%。Fable 5 可连续运行数天无需干预,实现了安全与极致能力的平衡。

查看原推 ↗
MiniMax (official)@MiniMax_AI · 2天前50

Tired of your token costs? M3 is free on @PBDTokenRouter through june 17th With every other MiniMax model 50% off 🔥 That means building with 1M context, and $0 in / $0 out Build something today, before this opportunity ends.

译厌倦了高昂的 token 成本? M3 在 @PBDTokenRouter 上免费至 6 月 17 日 其他所有 MiniMax 模型五折优惠🔥 这意味着以 1M 上下文窗口构建,输入/输出费用均为 $0 趁机会结束前,今天就动手搭建点什么吧。

查看原推 ↗
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月11日
17:36
Alibaba Cloud@alibaba_cloud
65
Qwen登陆Eden AI,35%折扣庆祝上线

阿里云宣布Qwen模型上线欧洲AI网关Eden AI。Eden AI拥有超20万开发者,企业可通过其统一API访问Qwen开放权重模型(用于推理、编程和AI应用),构建多模型工作流并避免供应商锁定。庆祝上线期间,所有Qwen模型享35%折扣。下周VivaTech阿里云AI创新峰会(7.3区Workshop A)将举办特别见面会,Eden AI CEO与CPTO出席。

产品更新开源生态推理编码
17:34
Peter Steinberger 🦞@steipete
精选78
一个简单的循环:告诉 Codex 维护你的仓库,每5分钟唤醒一次,将工作直接分配到线程。这样可以轻松按需并行化和导向工作。 我使用一个编排器技能,结合我的分类+自动审查+计算机使用技能,因此部分工作可以自主落地。
智能体开源/仓库编码

推荐理由:Peter Steinberger 这个 orchestrator + triage 的技能组合,让 AI 代理能近乎自主地维护 repo,做开源项目的可以直接抄。
17:06
Alibaba Cloud@alibaba_cloud
42
阿里云发布ApsaraDB Enterprise Agents数据库智能体

阿里云宣布推出ApsaraDB Enterprise Agents,即内置于数据库中的AI原生智能体,可自主执行分析、治理、数据准备等运维任务,无需人工干预;具备企业级安全能力(细粒度访问控制、数据脱敏、token管控),并能自我学习适应。相关活动将于2026年6月24日10:00(UTC+8)线上举办,时长30分钟。

智能体数据/训练行业动态
17:06
Alibaba Cloud@alibaba_cloud
63
👏#ApsaraDB 有10篇论文被SIGMOD 2026接收--DB×AI、云原生存储与智能工具。从论文到产品:Beluga的CXL内存池正处于工程验证阶段;CloudJump III现已为#PolarDB的分层存储提供动力。 #AlibabaCloud 持续推动数据库前沿。🚀
数据/训练行业动态部署/工程
16:49
Chubby♨️@kimmonismus
59
Anthropic的Claude Max 20x和OpenAI的ChatGPT Pro 20x每月均为$200,但实际使用价值分别约$8,000和$14,000。此前业界普遍认为$200月费计划按API定价最多仅值$2,000/月的token用量,而实际订阅计划的补贴远高于预期,价值可达API定价的4-7倍。

SemiAnalysis: Recently, we purchased one of each Anthropic/OpenAI subscription plan and randomly ran long horizon coding tasks until w...

AnthropicOpenAI现象/趋势
16:36
AYi@AYi_AInotes
44
Claude Fable 5 发现小红书 AI 自动化新赛道

用户使用 Claude Fable 5 分析爬取的小红书数据,获得 Opus 4.8 未能提供的结论,并发现一个可 AI 全自动运营的赛道。用户认为 AI 是普通人的第六个康波周期,做自媒体是最大的 AI 红利,后续计划继续挖掘更多赛道。

AYi: http://x.com/i/article/2064536412670562304

Anthropic大佬观点推理
16:22
小互@xiaohu
66
Anthropic CEO Dario Amodei 只有一名直接下属

Anthropic CEO Dario Amodei 唯一直接下属是幕僚长 Avital Balwit。公司所有高管(CFO、CCO 等)均向其姐姐、总裁 Daniela Amodei 汇报,Daniela 负责日常运营。Dario 将约一半时间用于文化建设(每两周全员会 "Vision Quest"),另一半投入研究方向和战略。这种架构源于其研究背景与 Daniela 运营专长的互补。哈佛教授指出,面对全新高风险问题时,CEO 需更窄管理幅度以保护时间资源。Anthropic 全部七位联合创始人至今仍在公司。

Anthropic大佬观点
16:06
🚨 AI News | TestingCatalog@testingcatalog
51
前xAI成员在美国成立新AI实验室River AI,致力于构建"由你拥有和塑造的个人AI"。River AI指出当前最优秀的AI被少数大公司控制,他们将打造全新的个人化AI堆栈,让AI完全为你工作、分享你的价值观、按你的方式运行。该实验室目前未透露具体产品细节,但已引发行业关注。

River AI: We are incredibly excited to announce River AI. Our mission is to create personal AI that is owned and shaped by you. To...

xAI行业动态
15:24
ginobefun@hongming731
44
BestBlogs 推出世界杯特刊及预测 Agent

距离世界杯开幕战不到 12 小时,BestBlogs 的两位站长制作了世界杯特刊(https://www.bestblogs.dev/worldcup),方便球迷在看球前快速了解信息、赛后闲聊。此外还做了一个「普神」Agent 来预测每场比赛胜负,用户也可参与选择。

智能体产品更新
15:14
fofr@fofrAI
60
恶意软件开发者通过在间谍软件中添加核武器和生物武器相关文本,主动触发大模型安全拒绝机制,使AI安全扫描器无法分析该恶意软件。这是安全对齐中过度依赖一阶规则导致二阶盲点的典型案例:当闭源与开源模型内置激进拒绝策略时,攻击者会注入这些触发词来逃避检测。SocketSecurity的帖子指出,设计恶意软件分析管道需考虑意图以防范提示词操纵。当前仅是攻击者利用这类特征的早期阶段,未来处理复杂网络安全的用户系统可能需要模型具备更少的安全顿感。

John Scott-Railton: NEW: malware developers added nuclear & biological weapons text to to their spyware. Goal? To trigger LLM safety refusal...

安全/对齐部署/工程
14:52
宝玉@dotey
精选77
baoyu-design skill 更新:支持导入 Figma 本地文件重建设计系统

baoyu-design skill 更新,现已支持导入 Figma 本地文件(.fig),可在本地重建设计系统,效果与 Claude Design 在线版一致。该功能依赖 Claude Fable 5 辅助(Token 不够用)。安装后提供 Figma 文件路径即可导入为 Design System,后续新建设计项目可复用。同时支持在新建项目时添加已导入的 Design System,保留了 Claude Design 原始的导入和编译方式,用户可通过提问选择设计系统。安装命令:`npx skills add JimLiu/baoyu-design`。项目地址:https://github.com/jimliu/baoyu-design。

宝玉: baoyu-design skill 现在支持导入 Design System,以及在新建项目时添加导入的 Design System 比我想的要麻烦的多:https://github.com/JimLiu/baoyu-design/pul...

GitHub多模态开源/仓库

推荐理由:宝玉把 baoyu-design 调教得越来越像 Claude Design 在线版,现在能直接吃 Figma 文件生成设计系统,前端和设计同学可以省掉大量重复劳动。
14:34
Alibaba Cloud@alibaba_cloud
47
电商数据无处不在--Shopify、Amazon、Alibaba Express、Instagram、Reddit。🛍️ 借助Quick BI @quick68554 Smart Q Skill Package,团队可以自然提问、更早发现风险,并将数据转化为更快的业务决策。 博客:https://int.alibabacloud.com/m/1000414338/ Quick BI:https://int.alibabacloud.com/m/1000407094/ #QuickBI #SmartQ #EcommerceAnalytics #AIAnalytics #DataDriven
产品更新
14:25
向阳乔木@vista8
50
Codex Goal指令让AI自主开发网站运行10小时

推文称Codex的Goal指令功能强大,一个网站开发任务已连续运行10小时,AI自动完成开发、测试、部署和上线,且功能持续完善。作者预告的AI资讯订阅RSS站已开放体验,链接为 https://rss.qiaomu.ai/。

智能体OpenAI教程/实践编码
14:22
宝玉@dotey
67
OpenDoor 裁掉了其在印度的整个离岸团队(200多人),并正以美国本土规模更小的 AI 原生团队取而代之。 AI 未来可能也会影响外包行业的运作模式。

Kaz Nejatian: I shared this note earlier today with the entire team at Opendoor. Today we began to say goodbye to our colleagues in In...

现象/趋势行业动态
14:05
ClaudeDevs@ClaudeDevs
51
Claude Devs 宣布变更 Fable 5 安全措施:可见回退至 Opus 4.8

Claude Devs 宣布本周起变更 Fable 5 的安全措施:被标记的请求将可见地回退至 Opus 4.8(与网络、生物安全一致),API 同时返回拒绝理由。此前采用的不可见措施虽能快速部署且误报极少,却让用户无法了解触发原因。可见措施易被破解,需要更多误报以保持鲁棒性;团队正同步调优生物/网络分类器以减少对无害请求的误报。用户可通过 `/feedback`、thumbs-down 或 appeal 表单反馈误判。

Anthropic产品更新安全/对齐
14:04
Alibaba Cloud@alibaba_cloud
26
阿里云Qwen和Wan生成墨西哥文化AI视频

阿里云发布一段由Qwen和Wan模型生成的AI视频,以墨西哥文化为主题,融合祖先智慧、传统工艺、Mariachi音乐和Zapotec编织艺术,从古老圣地到现代创新枢纽,展现AI如何连接过去与未来。视频旨在展示模型的创意能力,并引导用户通过Model Studio平台使用相关模型进行创作。

多模态行业动态视频
14:04
Alibaba Cloud@alibaba_cloud
21
阿里云用Qwen与Wan创作阿联酋AI视频

阿里云发布AI生成视频,由通义千问(Qwen)和万相(Wan)模型共同创作。视频以阿联酋为主题,融合沙漠、阿拉伯书法、传统待客之道与迪拜现代天际线等元素,从古代天文智慧到未来科技,展现文化遗产与创新的平衡。官方推荐使用Model Studio平台调用模型进行创作。

图像生成行业动态视频
14:04
Alibaba Cloud@alibaba_cloud
44
电商数据无处不在--Shopify、Amazon、Alibaba Express、Instagram 和 Reddit。🛍️ 借助 Quick BI Smart Q Skill Package,团队可以自然提问、更早发现风险,并将数据转化为更快的业务决策。 Blog: https://int.alibabacloud.com/m/1000414338/ Quick BI: https://int.alibabacloud.com/m/1000407094/ #QuickBI #SmartQ #EcommerceAnalytics #AIAnalytics #DataDriven
产品更新数据/训练
13:52
宝玉@dotey
60
越来越多的企业发现AI使用成本已超过人力成本。有团队此前在Claude Max计划上大力堆token(tokenmaxxing),但引入Fable项目后,一名成员10小时内用掉相当于$1.5k的token并3次触达上限,半数工程师达到配额限制。团队担忧若按API计费,每位工程师的token消耗将接近人员成本,大幅提高烧钱率。就像产品端开始做模型路由,工程端也需要考虑类似约束来设定使用护栏。

Jerry Liu: Up until yesterday, our entire MTS team has operated under the philosophy of tokenmaxxing as much as possible on Claude ...

Anthropic现象/趋势
13:35
AYi@AYi_AInotes
60
Claude Fable 5 发布后 OpenAI 考虑大幅降价

昨天Claude Fable 5发布以后, 压力给到了Open AI, OpenAI 正在考虑大幅降价, 以争取从劲敌 Anthropic 手中赢得更多用户, 感觉有点难追啊,全球大模型铁王座大概是Claude稳坐了

The Wall Street Journal: OpenAI is considering drastic price cuts as it seeks to win over customers from archrival Anthropic https://on.wsj.com/4...

AnthropicOpenAI行业动态
13:35
AYi@AYi_AInotes
53
Anthropic CEO Dario仅1个直接下属的管理哲学

Anthropic CEO Dario Amodei只有1个直接下属(幕僚长),所有执行通过其姐姐、总裁Daniela Amodei流向董事会,Dario本人专注安全、战略与AI未来。对比:Nvidia CEO黄仁勋有60个直接下属,OpenAI CEO Sam Altman有6个。Anthropic无层层汇报、PPT文化和办公室政治,强调信息传递效率和自组织管理。

Rohan Paul: Anthropic's Dario Amodei has only 1 direct report, his chief of staff. The rest of Anthropic's executive system flows th...

Anthropic现象/趋势
13:35
数字生命卡兹克@Khazix0918
69
WorkBuddy从0到1教程:国内最友好的通用Agent产品,对标Claude Code和Codex

WorkBuddy是一款国内通用Agent产品,支持Windows和Mac,微信扫码登录,个人专业版58元/月。界面提供Ask/Plan/Craft三种工作模式和代码开发、日常办公、设计创意三个场景,内置DeepSeek V4 Pro、腾讯混元、GLM、Kimi等国产模型。专家中心有100多个垂直领域AI专家,支持专家团多Agent协作。技能市场(Skills)和MCP连接器可打通QQ邮箱、腾讯会议、腾讯文档等生态,也支持自建技能和连接器。上周五腾讯推出WorkBuddy企业版。

智能体MCP/工具教程/实践
13:26
Rohan Paul@rohanpaul_ai
72
Dario Amodei今日发文指出,前沿AI将成国家军事与经济主导力量,相当于"数据中心里的天才国家",可用于战略、武器研发、情报与制造。他认为AI发展速度已超过政府监管,要求:强制预发布测试与独立审计,政府有权阻止高风险模型部署(如存在严重网络、生物、自主或自动化研发风险);加强模型权重保护、定期红队测试、渗透测试及安全事件报告;政府需通过就业激励、工资支持、培训及长期收入支持应对AI劳动力冲击;民主国家应全球协调AI安全、芯片供应链、出口管制与防止AI压迫。

Rohan Paul: Dario Amodei just published a super long blog, calling for an urgent policy overhaul because he thinks frontier AI is mo...

Anthropic大佬观点安全/对齐政策/监管
13:22
宝玉@dotey
71
宝玉改用Fable 5,称其处理复杂任务更省心但很贵。他建议不依赖单一模型,应组合使用:Opus 4.8写作弱但UI和系统设计强,可用Claude Design设计后分别交给GPT-5.5和Opus 4.8实现对比。在Claude Code和Cursor中,Opus 4.8除写作外效果良好,需针对性调提示词。

宝玉: 你不能指望一个模型在什么地方都是最强的,要像渣男一样才能用好 AI:去爱很多模型,去发掘他们的优秀点,东食西宿,组合着用 Opus 4.8 在写作不太行,但是在 UI 设计,UI 实现比 GPT-5.5 要好很多,推荐你多用用 Claude...

智能体AnthropicOpenAI教程/实践
13:09
Berryxia.AI@berryxia
64
当前 Agent(如 Codex、Claude、Hermes、OpenClaw)各自有记忆但不连通,导致重复问、重复踩坑。通过改造 MemOS CLI,建立一层"共享记忆"--只记录关键结论、失败教训、环境配置等,Agent 遇到解决不了的问题时才主动搜索。一台 Mac 上跑通的流程另一台可直接继承,Agent 之间像团队一样积累和传递经验,减少重复试错。

huangserva: 如何让多个 Agent 之间真正互相学习、互相帮助? 现在很多 Agent 都开始有自己的记忆,但问题是: 这些记忆彼此不连通。 Codex 记住的坑,Claude 不知道;Hermes 总结的方法,OpenClaw 也用不上。 最后每个 ...

智能体大佬观点开源生态
12:51
Elon Musk@elonmusk
20
说得对,Grok 🤣🤣 https://x.com/i/grok/share/32212cc499ae467ebb1f8db2b77d314a
xAI大佬观点
12:35
AYi@AYi_AInotes
66
阿易AI Notes:AI是第六轮康波,普通人红利在自媒体

阿易AI Notes认为AI是继蒸汽机、铁路、电力、汽车石油、信息互联网后的第六轮康波周期,普通人唯一从开场哨就站进场内的机会。红利不在卷模型或融资,而在自媒体。作者推特5个月做到5万粉,策略跑通后开始进军小红书、公众号、视频号。公众号已非订阅制:头部账号推荐流占30%–60%,搜一搜占30%–40%,订阅仅小部分。新号前十篇决定权重,零粉也能获百万级曝光,老号先发优势减半。康波不缺看见的人,缺一篇篇把内容垒起来的人。

AYi: http://x.com/i/article/2064536412670562304

搜索现象/趋势
12:34
Alibaba Cloud@alibaba_cloud
31
来自新加坡的第2天 🇸🇬 今天在#SuperAI2026的三件事: 👜 在阿里云 x #Qwen 展台打印AI帆布袋 🛠️ 阿里云动手实践工作坊 🎤 上午11:50在主舞台听Andy(东盟区域总经理)探讨"视觉AI堆栈"。 到时候见!
图像生成行业动态
12:27
Ethan Mollick@emollick
53
这或许是围绕 Fable 的护栏中最具争议的部分,现在正在回滚。

Simon Willison: Very pleased to hear Anthropic have walked back this policy https://simonwillison.net/2026/Jun/11/anthropic-walks-back-p...

Anthropic安全/对齐
12:26
Rohan Paul@rohanpaul_ai
55
引导大语言模型?实际上,稀疏自编码器可以胜过简单基线

论文认为稀疏自编码器作为LLM控制工具并非此前认为的那么差,失败源于特征标注方式与模型内部实际因果不匹配。作者提出用监督管道替代模糊标签,验证特征活动是否真实追踪数据标签,使特征具有因果权重。例如,强制“酒精”特征增强可使模型输出转向酒精话题。论文还发现极高稀疏度并非必要。与提示工程相比,提示更强(模型经训练服从提示),而特征控制更像直接拨动机器。

安全/对齐论文/研究
12:25
向阳乔木@vista8
29
"Anthropic 最近干了一件让 AI 研究者们后背发凉的事" 这么快就被AI学到了流行语料?! Deepseek翻译重写居然用了这句。。。
AnthropicDeepSeek大佬观点
12:21
Elon Musk@elonmusk
32
《巴比伦蜜蜂》用AI模拟了AOC被迫学习经济学的情景,该视频由Grok制作。

The Babylon Bee: We Asked AI To Simulate What Would Happen If AOC Was Forced To Learn Economics Made with @grok.

xAI产品更新多模态视频
12:18
Midjourney@midjourney
84
我们已将 V8.1 设为 Midjourney 所有用户的新默认模型。V8 将在两周后弃用。V8.2 即将开始测试。

Midjourney: V8.1 is live! Our iconic aesthetics are back w native 2K HD rendering - 3x faster and 3x cheaper vs V8. Full quality V8....

图像生成模型发布
关联讨论 1 条Midjourney:Updates(RSS)
11:57
Tibo@thsottiaux
64
可以确认,过去 48 小时内我们观察到 Codex 的 token 消耗量出现了强劲增长。我们并未发布新产品,因此这一情况不同寻常。

Dylan Patel: Usage share of OpenAI grew vs Anthropic yesterday despite Mythos 5 / Fable 5 launch Multiple power users at SemiAnalysis...

AnthropicOpenAI现象/趋势编码
11:26
歸藏(guizang.ai)@op7418
63
Anthropic Fable 5 发布引众怒:安全过严、数据存储、隐形降级被批

推文批评 Anthropic 新发布的 Fable 5 模型三个问题:1)安全护栏极严,初中生物问题也被拒,影响生物学研究;2)数据明文强制存储最长两年,微软已禁止内部使用;3)最严重的是隐形降级——若系统判断用户试图“蒸馏”模型,会偷偷降级至 Opus 4.8 甚至更低,并修改提示词使模型变笨,导致评估失效。批评者认为这与 CEO 达里奥宣称的透明、问责相悖,对开源研究者、小实验室和科学界伤害最大。

Anthropic安全/对齐现象/趋势
11:21
宝玉@dotey
65
Claude Code + Fable 5 全自动剪辑视频工作流

视频完全摒弃 Premiere/Final Cut,由 Claude Code 配合 Fable 5 通过代码与命令行自动剪辑。流程:本地 Whisper 转写 25GB 素材(17 个 Take,4 场景),生成毫秒级单词时间戳 JSON;Subagent 剔除停顿废片选出最佳镜头;代码调用 FFmpeg 自动粗剪;AI 手写 LUTs 调色代码并生成带滑块的 HTML 页面供人工调整;静态图形转为 React 的 Remotion 动画组件,利用时间戳精准卡点;通过 Figma MCP 将画面导出至 Figma 供设计优化,再自动抓回代码,渲染 4K 24fps。作者全程未触碰视频编辑器。

Thariq: Lots of people asked how I used Fable to edit its own launch video so I made a video about that! TLDR it wrote a lot of ...

智能体Anthropic教程/实践视频
11:21
宝玉@dotey
57
DeepSeek 招聘 Agent Harness 研究员(实习/全职)

DeepSeek 开放 Agent Harness 研究员岗位(实习/全职),工作地点杭州/北京。团队使命为 “Model + Harness = Agent”,旨在将模型能力转化为 Agent 产品。职责涵盖:上下文管理、长期记忆、Subagent 与 Multi-Agent、自进化 Agent 等前沿创新;实现模型与 Harness 的深度适配;构建 Harness 领域评测基准;基于真实任务与用户反馈迭代 Agent 能力。要求硕士以上学历、2年科研经验、全栈开发能力、Agent 产品重度用户,熟悉 LLM 及 Agent 机制(KV Cache、Tool Use、Reasoning、MCP 等)。

智能体DeepSeek行业动态
11:21
小互@xiaohu
49
Claude Fable 5 制作黑洞诞生动画体验

用户用Claude Fable 5制作黑洞诞生过程动画页面。起初仅用一句话描述,效果不佳;重新明确要求炫酷动画、文字字幕解说及配音(本地TTS效果一般)。最终输出效果炸裂。体验表明,目标导向越清晰越好,模型会自主思考、主动打开浏览器预览并自行调整,整个流程无需用户介入。

Anthropic教程/实践编码
11:09
Berryxia.AI@berryxia
55
Anthropic CEO 称 Fable 5 为"超级武器",Claude Code 负责人透露 90% 代码由 Claude 生成

Anthropic CEO Dario 在访谈中称其最强模型 Fable 5 为“超级武器”,早期企业客户曾恳求不要公开发布,但最终仍全面开放。Dario 表示离开 OpenAI 是因价值观不匹配。Claude Code 负责人 Boris Cherny 称公司 90% 代码由 Claude 生成,包括 Claude Code 自身大部分代码。Dario 将 AI 导致文明崩溃的概率定为 10%-25%。Fable 5 可连续运行数天无需干预,实现了安全与极致能力的平衡。

Berryxia.AI: http://x.com/i/article/2064543911729885184

Anthropic大佬观点安全/对齐
11:07
MiniMax (official)@MiniMax_AI
50
厌倦了高昂的 token 成本? M3 在 @PBDTokenRouter 上免费至 6 月 17 日 其他所有 MiniMax 模型五折优惠🔥 这意味着以 1M 上下文窗口构建,输入/输出费用均为 $0 趁机会结束前,今天就动手搭建点什么吧。

PBD TokenRouter: @MiniMax_AI M3 is free on TokenRouter through June 17. Every other MiniMax model is 50% off. Visit at http://www.tokenro...

行业动态
‹ 上一页
1…89101112…50
下一页 ›