AIHOT
精选全部 AI 动态AI 日报Agent 接入关于更新日志反馈信源提报
登录
精选全部日报更多
全部动态今日 302 条
全部一手资讯X论文
6月10日周三
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月10日
13:33
AYi@AYi_AInotes
30
AI改写自媒体副业玩法:拆解对标账号是关键

大部分人副业赚不到钱,不是不够努力,而是用旧规则玩新游戏。AI已彻底改写玩法:先拆解对标账号,以前一周的工作,现在用agent工具十几分钟出报告。有人靠拆爆款结构、AI改写文案,不会拍视频也能涨粉破万。核心三步:别硬刚原创,先对标;别憋文案,先拆爆款公式;别等流量,先算清钱从哪来。反直觉发现:该赛道85%收入来自品牌广告,而非带货。

AYi: http://x.com/i/article/2064536412670562304

现象/趋势
13:28
IT之家(RSS)
33
消息称某国产迭代 OS 将实现"AI 语音助手上岛",功能在苹果 iOS 27 发布前已开发完成

博主 @数码闲聊站 爆料,某国产迭代 OS 将实现“AI 语音助手上岛”功能,并已在苹果 iOS 27 发布前开发完成。作为对比,苹果在 WWDC26 中展示的 Siri AI 在灵动岛上弹出大气泡,支持回答问题、设置提醒、播放音乐、搜索照片、屏幕感知、设定导航等操作,还可理解个人情境、执行 App 操作、感知屏幕、理解图像及调用广博知识。

行业动态语音
13:28
IT之家(RSS)
23
吉利第5代帝豪i-HEV智擎混动将于6月16日上市

吉利第5代帝豪i-HEV智擎混动将于6月16日上市,基于BMA Evo架构,搭载i-HEV智擎混动系统。专用发动机热效率达48.41%,为全球量产最高。P1+P3双电机解耦设计,驱动电机最大功率230kW,是日系主流混动的1.72倍。WLTC工况电驱主导超80%工况,发动机工作时长减少27%以上,66km/h内可纯电行驶,0-30km/h起步加速1.84秒,动力响应10毫秒。启动震动降低32.7%,整车噪音仅比纯电动车高1分贝。依托全域AI 2.0与星睿AI云动力2.0大模型,综合节能提升10%以上。

其他行业动态
13:23
歸藏(guizang.ai)@op7418
62
CodePilot v0.56.0 发布:新增Fable 5及小米模型

CodePilot v0.56.0 发布,新增 Claude Fable 5、小米 MiMo UltraSpeed 模型及通用 OpenAI 兼容第三方渠道。修复用量统计、回复状态丢失、服务商列表刷新等问题,推荐所有用户升级。作者在其 26 万行代码的 CodePilot 代码库中测试 Claude Fable 5,观察其查找问题的能力。

歸藏(guizang.ai): 在我 26 万行代码的 CodePilot 代码库中尝试 Fable 5,看一下它能找出多少问题

产品更新开源/仓库编码
13:12
Tibo@thsottiaux
9
我想索取我的1%版税。

Tibo: Imagine the alternate reality where we named GPT-5.4-Pro something like Fable.

OpenAI其他
13:11
Hacker News 热门(buzzing.cc 中文翻译)
58
Grit:使用AI智能体在Rust中重写Git

Grit项目使用AI智能体(agents)将Git用Rust重写。相关讨论帖在Hacker News获得102个点赞,内容来自GitButler博客。

智能体产品更新开源生态编码
13:11
Hacker News 热门(buzzing.cc 中文翻译)
41
软件黑客马拉松,安息吧。硬件黑客马拉松,万岁!

作者在个人博客(blog.oscars.dev)上发文,宣告软件黑客马拉松的终结,并呼吁转向硬件黑客马拉松。

现象/趋势端侧
13:07
Berryxia.AI@berryxia
24
不学AI恐毕业即失业?Berry Xia力荐豆包DeepSeek

Berry Xia强调AI技能对就业的重要性,引用老黄(黄仁勋)观点:其需要的人是懂AI、会熟练使用AI的人,即使有丰富行业经验也可能不是首选。他建议学习豆包、DeepSeek等AI工具,并整理了100个信息源供学习使用,但暂未公开列表。推文提醒把握一手信息源,避免在AI浪潮中被淘汰。

Berryxia.AI: http://x.com/i/article/2064543911729885184

大佬观点
13:07
Berryxia.AI@berryxia
46
Smith分享Loop Engineering学习心得

Berry Xia表示,学完Harness后接触Loop Engineering,认为理解其底层逻辑对Vibe Coding和产品架构设计帮助很大。他原计划写文章分享,但Smith(@smithandai)已发表相关文章,推荐阅读。

Smith铜匠・十点睡觉: http://x.com/i/article/2064229409247358976

智能体教程/实践部署/工程
13:07
Berryxia.AI@berryxia
52
用户 @oran_ge 指出,Claude Fable 5 有三项奇葩限制:6月22日后 Token Plan 用户无法使用,仅限 API;安全护栏过严,连"线粒体是什么"都不能问;禁止用于模型研发,理由是该模型已能加速自身发展。作者批评这种"自己打通 Loop 却不许别人进"的闭环做法,呼吁国产开源模型加油。

Orange AI: Claude Fable 5 的三个很奇葩的地方 1. 虽然目前在 Token Plan 里,但在6月22日之后,Token Plan 就不能用 Fable 了,只能通过 API 调用 2. Fable 的安全护栏有点离谱,任何生物学的基础...

Anthropic大佬观点安全/对齐
12:56
HuggingFace Daily Papers(社区热门论文)
精选75
混合LLM中的注意力失忆:CoT微调破坏长距离召回及修复方法

CoT监督微调系统性地降低混合线性注意力模型(如HypeNet、Jet-Nemotron)的长上下文召回能力。在NIAH任务上,HypeNet-9B的S2@256K从67.2%降至9.4%,原因是CoT-SFT使注意力梯度偏向短程模式,破坏长程路由的W_Q和W_K投影。QK-Restore方法无需训练,从微调前检查点恢复W_Q和W_K,保留其余参数;Procrustes变体平衡路由保留与推理适应。在HypeNet-5B上,QK-Restore将S3@256K从65.4%提升至76.4%,推理性能不变。

推理论文/研究

推荐理由:做长上下文推理的同学注意了,CoT微调居然会弄坏模型的长距离记忆,这篇论文不仅把原因扒清楚了,还给出了零成本修复方案,值得放进参考列表。
12:56
HuggingFace Daily Papers(社区热门论文)
67
WorldOlympiad:视频世界模型三项全能评测基准

WorldOlympiad 将视频世界模型评估分解为物理、几何和交互三个维度。物理轨道用物体分割和 MLLM-as-judge 检验视频对力学、热现象、材料属性等规则的遵循;几何轨道以高斯泼溅重建评估结构一致性、跨视角连贯性与相机轨迹对齐;交互轨道评测模型能否按复杂动作提示生成连贯长程视频。基准覆盖游戏、机器人和通用真实视频三大场景。实验表明,当前最先进模型在物理推理、3D 一致性和长程交互上存在显著差距。

arXiv具身智能多模态视频
12:56
HuggingFace Daily Papers(社区热门论文)
62
Data2Story:将数据转化为可验证多模态故事的数据记者智能体

Data2Story是一个多智能体框架,将数据记者工作流中的多种专业角色编排成虚拟新闻编辑室。其两项创新是:每个声明通过Inspector链接到数据、代码或外部参考,实现基于证据的归因;文章可多模态生成,如为地理内容生成交互式地图、为音乐生成音频。在18篇文章上的评估从四个维度进行:人与智能体的角度覆盖、53名参与者的评分、计算机使用智能体作为读者导航代理、以及可验证性(代码验证器重新执行语句并与参考对照)。Data2Story产出有竞争力且证据可追溯的多媒体故事,在透明度和可审计性上表现突出,但人类文章在编辑角度、创意设计和呈现上仍具优势。框架定位为记者协作者,代码和演示已公开。

智能体多模态论文/研究
12:56
HuggingFace Daily Papers(社区热门论文)
精选73
Flow-DPPO: 面向流匹配模型的散度近端策略优化

针对流匹配模型中在线强化学习比率裁剪策略约束不当的问题,Flow-DPPO 提出用散度近端约束替代。关键洞察是流模型每步策略为高斯分布,可精确计算新旧策略间的 KL 散度。Flow-DPPO 采用非对称散度掩码,仅在梯度更新偏离信任区域且超阈值时阻止更新。实验表明,Flow-DPPO 获得更高奖励,KL 近端效率更优,缓解了灾难性遗忘,促进多目标均衡,并能在比率裁剪失效时支持稳定的多轮训练。代码已开源。

图像生成推理视频论文/研究

推荐理由:用 KL 散度代替比值裁剪来解决流匹配 RL 训练的不稳定,理论简洁,代码已开源,做图像/视频生成优化的同学可以跑一下。
12:45
Ethan Mollick@emollick
27
你希望其对 AI 预言成真的科幻作家,按顺序排列: 伊恩·班克斯 贝基·钱伯斯 玛莎·威尔斯 道格拉斯·亚当斯 查尔斯·斯特罗斯(《奇点天空》) 彼得·沃茨 查尔斯·斯特罗斯(《洗衣房系列》) 哈兰·埃里森
大佬观点推理
12:40
公众号:火山引擎
精选68
火山方舟版权商业化平台上线,周星驰比高集团三大电影IP首批入驻

火山引擎今日上线火山方舟版权商业化平台,推出行业首个覆盖“授权—保护—审核—分发—变现”全链路的版权合作机制。平台搭载视频生成模型Seedance 2.0及版权治理体系,已获周星驰旗下比高集团《喜剧之王》《食神》《长江七号》三部影片在AI视频创作场景下的版权使用权,并基于Seedance 2.0打造经典桥段AI创作模板。模板已在火山方舟体验中心、火山引擎Kickart上线,同步开放给LibTV、筷子科技丽帧引擎等工具合作伙伴。平台面向UGC和商业广告场景提供分润制、项目制等变现路径,未来还将提供版权管理后台,实现授权可见、使用可查、收入透明。

产品更新视频

推荐理由:这是AI视频领域第一次有平台把版权授权、审核、变现全链路跑通,而且首批入驻的是周星驰的《喜剧之王》《食神》这种真金IP,做AI视频的人终于不用在侵权边缘试探了。
12:28
IT之家(RSS)
53
何小鹏发内部信:亲自下场直管机器人业务,称迎来量产和商业化前夜

何小鹏通过内部信宣布亲自直管机器人业务,称小鹏机器人正迎来量产和商业化前夜,相当于8年前小鹏汽车完成G3发布时的阶段。接下来几个月是最艰苦、最关键的冲刺期,需解决量产细节。新一代IRON人形机器人计划于今年三季度正式亮相,目标今年底实现高阶人形机器人量产,首先在小鹏门店试商用,明年起面向中国及海外商业客户交付。从明年起,人形机器人的硬件收入和AI模型收入将成为集团收入和毛利增长的重要驱动力之一。

具身智能行业动态
12:20
歸藏(guizang.ai)@op7418
49
Fable 5 漏洞分析强但写代码偏科

用户在 26 万行代码的 CodePilot 代码库中测试 Fable 5,发现其在漏洞分析和 bug 寻找方面表现出色,能找出大量问题。但在代码生成上,Fable 5 并非万能,写出的代码常有明显 bug,需要多次修复才能完成,属于偏科严重的模型。与之前的版本 4.8 相比,Fable 5 某些方面提升巨大,另一些方面虽更好但提升有限。

歸藏(guizang.ai): 在我 26 万行代码的 CodePilot 代码库中尝试 Fable 5,看一下它能找出多少问题

推理编码评测/基准
12:18
Bloomberg:Technology(RSS)
64
Meta 与 Reliance 合作在印度建设首个 AI 数据中心

Meta Platforms 与印度 Reliance Industries 合作,将在印度建设其首个 AI 数据中心。此举是全球科技基础设施投资浪潮的一部分。

Meta行业动态部署/工程
12:07
Berryxia.AI@berryxia
59
Berry Xia分享用4个实战场景+100海外信息源消灭信息差

百万粉AI博主Berry Xia介绍如何通过100+海外英文信息源(X KOL、Reddit、Hacker News、YouTube、arXiv)配合沉浸式翻译插件高效获取选题。插件提供多场景应用:刷X时中英对照翻译评论、三击空格键中文一键转英文发推;Reddit/HN页面深度优化保留排版;YouTube字幕双语对照并支持自定义术语(如hallucination→模型幻觉);PDF论文上传后段落级中英对照、公式图表完整保留。核心是从“看到”推到“看懂”,消灭信息差。

其他教程/实践
11:56
HuggingFace Daily Papers(社区热门论文)
61
每项多模态证据仅用一个token:面向资源受限问答的Latent Memory

Latent Memory提出一种潜在空间记忆范式,由小型压缩器LLM/VLM将每个原始文本或图像证据压缩为单个高维潜在token。查询时,将查询嵌入同一空间检索相关token并直接输入预训练LLM/VLM生成答案。通过统一端到端训练,结合重建、对比和蒸馏目标,使单个token同时携带重建、检索和生成信息。在HotpotQA等七个纯文本QA基准和多项多模态QA基准上,Latent Memory取得与先进RAG基线相当的问答性能,同时生成器token消耗减少3至10倍,并在WebQA上达到图像问答最强性能。代码已公开。

arXiv检索增强多模态论文/研究
11:56
HuggingFace Daily Papers(社区热门论文)
60
EEVEE:面向真实世界的测试时提示学习框架

EEVEE是首个面向LLM智能体的多数据集测试时提示学习框架,用于在真实任务流下自改进。为解决跨数据集干扰,它引入路由器将异构输入流划分到任务簇并分配适配提示配置,并通过路由器‑提示协同进化策略(交替执行路由器和提示学习阶段)优化二者依赖。实验表明,EEVEE在保持单基准学习能力与效率的同时,提升异构数据流鲁棒性:平均多基准得分比Qwen3-4B-Instruct高10.38分,比DeepSeek-V3.2高24.32分,超越SOTA方法GEPA和ACE最高达37.2%和48.2%。

智能体论文/研究
11:53
SemiAnalysis@SemiAnalysis_
54
SemiAnalysis 批评 Anthropic 伪善:如同核不扩散条约,阻止他人利用 Claude 开发前沿模型

SemiAnalysis 发文批评 Anthropic 的伪善行为,将其类比为《核不扩散条约》:已拥核国家禁止其他国家拥核。Anthropic 自己拥有前沿模型,却在用户使用 Fable 5 进行前沿 LLM 开发时,通过 prompt modification、steering vectors 和 PEFT 等方式暗中限制模型能力,且不通知用户。Anthropic 估计此举影响约 0.03% 的流量。

NomoreID: When Fable 5 is used for frontier LLM development, it does not notify the user and instead limits the model's capabiliti...

Anthropic安全/对齐现象/趋势
11:47
Rohan Paul@rohanpaul_ai
49
宇树机器人人形机器人在户外单独表演了一套中国传统武术套路 流畅的踢腿、宽大的步法以及精准的手臂动作,展现出强大的平衡与协调能力。
具身智能行业动态
11:46
PixVerse@PixVerse_
38
一则巧妙的角色反转短片,凸显了AI视频的创意力量。幽默、视觉锐利、执行完美。干得漂亮 @ai_am_furufuru !

ふるふるの大冒険/Furufuru's Epic Adventure: 「The Fish Strikes Back/魚の逆襲」 #seedance #pixversecpp @PixVerse_

其他多模态视频
11:44
小互@xiaohu
48
OpenAI 的骚操作真多 哈哈哈 推出了一个活动:每邀请一个好友加入Codex 就帮你自动重置一次用量😅 而且可以重复使用,每当你想重置的时候就可以去邀请好友…
OpenAI行业动态
11:41
Hacker News 热门(buzzing.cc 中文翻译)
71
德国法院裁定谷歌应对AI概览中的错误答案承担责任

德国法院裁定谷歌需为其AI Overviews(AI概览)功能生成的错误答案承担法律责任。该裁定认定,AI概览中出现的虚假信息视为谷歌自身发布的内容,公司无法通过声称“AI自动生成”来推卸责任。这一判决对AI生成内容的责任界定产生重要影响。

Google搜索政策/监管
关联讨论 2 条The Decoder:AI News(RSS)Gary Marcus:The Road to AI We Can Trust(RSS)
11:39
jason@jxnlco
16
Sophons Anthropic 不允许你使用 fable 进行生物学、化学、AI 研究或任何加速人类进步的工作。这使它成为开发区块链的完美工具。

venture anthropologist: anthropic won't let you use fable for biology, chemistry, ai research, or anything that accelerates human progress. that...

Anthropic大佬观点安全/对齐
11:33
AYi@AYi_AInotes
61
小红书副业冷启动:用AllyHub三步拆对标账号

作者分享使用AI agent AllyHub拆解小红书对标账号的方法:第一步从57个候选筛出10个够得着且变现的账号(平均粉丝5.8万);第二步以「AIGC猫大人」为例,扒出7篇点赞过5000的爆款,发现赛道封面规律是“无文字纯视觉”短视频;第三步算变现,约85%收入来自蒲公英接广(合作李锦记、兰蔻等),3万粉同类账号月收入约8k–2万。AllyHub执行同类任务消耗成本约为其他AI agent的1/10。作者凭此方法0-1涨粉400。

智能体教程/实践
11:31
数字生命卡兹克@Khazix0918
83
Anthropic发布Claude Fable 5与Mythos 5:安全版免费至6月22日,价格公布

Anthropic今日发布Claude Fable 5(加安全限制)与Mythos 5(底层相同),价格每百万输入token $10、输出$50。即日起至6月22日,Pro/Max/Team/企业版订阅用户可免费使用Fable 5,之后仅API可用。跑分全面碾压,三方基准达SOTA。案例:Stripe用Fable 5一天迁移5000万行Ruby代码;纯视觉通关宝可梦火红;自建3D CAD编辑器并设计可打印模型;Mythos 5加速药物设计10倍,基因组学自主训练模型超越Science论文成果。

Anthropic大佬观点安全/对齐编码
关联讨论 35 条X:Rohan Paul (@rohanpaul_ai)X:Testing Catalog (@testingcatalog)X:邵猛 (@shao__meng)IT之家(RSS)Ars Technica:AI(RSS)X:Yuchen Jin (@Yuchenj_UW)Anthropic:Newsroom(网页)X:Anthropic (@AnthropicAI)Hacker News 热门(buzzing.cc 中文翻译)X:阿易 AI Notes (@AYi_AInotes)公众号:卡尔的AI沃茨X:Kim (@kimmonismus)The Decoder:AI News(RSS)TechCrunch:AI(RSS)X:OpenRouter (@OpenRouter)X:Perplexity (@perplexity_ai)The Verge:AI(RSS)Simon Willison 博客X:Elvis Saravia (@omarsar0, DAIR.AI)X:Claude Devs (@ClaudeDevs)X:Claude (@claudeai)X:Eric Zakariasson (@ericzakariasson)X:宝玉 (@dotey)X:Boris Cherny (@bcherny)X:Andrej Karpathy (@karpathy)Claude Code:GitHub Releases(RSS)X:歸藏 (@op7418)X:Artificial Analysis (@ArtificialAnlys)X:Berry Xia (@berryxia)Nathan Lambert:Interconnects(RSS)公众号:数字生命卡兹克Gary Marcus:The Road to AI We Can Trust(RSS)X:小互 (@xiaohu)Tomer Tunguz 博客(VC 分析)MarkTechPost(RSS)
11:28
IT之家(RSS)
48
初探苹果 iOS 27 版 AI 擦除工具 Clean Up:减少人脸失真

苹果在 iOS 27 系统中升级了基于 Apple Intelligence 的修图功能 Clean Up,重点修复了 iOS 26 版本中擦除背景后导致的人脸补全失真、画面扭曲问题。新版在人脸变形、画面边缘和肤色过渡方面表现更自然,成片更统一。X 用户 Alvin 反馈,调用苹果云端 AI 模型并选择“自动”或“高质量”模式可获得最佳效果。

产品更新图像生成
11:23
SemiAnalysis@SemiAnalysis_
58
本地LLM是推理的大跃进。每台笔记本电脑都是自己的数据中心,对你自己的token拥有主权,人民可以夺回token生成的手段。而这正是它注定结果糟糕的原因。(1/4)🧵
推理现象/趋势端侧
11:15
Ethan Mollick@emollick
30
当 Claude Fable 启动一个工作流时,模型 token 消耗得非常快 (这些显然不是 Fable token)
智能体Anthropic现象/趋势
11:15
Ethan Mollick@emollick
52
我在 Fable 帖子中只顺带提过一件事:对于长期运行的任务,Fable 开始发展出自己的方言,因为它的许多智能体和任务相互强化,使 Claudish 语言越来越 Claudish。你需要要求它用简单英语汇报。
智能体大佬观点现象/趋势
11:09
jason@jxnlco
19
你会使用Obsidian作为你的智能体记忆库吗?
智能体大佬观点
10:56
HuggingFace Daily Papers(社区热门论文)
60
强化学习中流策略的测试时梯度引导

QGF(Q-Guided Flow)是一种完全在测试时执行策略优化的强化学习算法。它先通过标准行为克隆预训练参考流策略和价值函数批评家,然后在测试时利用价值梯度引导参考策略生成更高价值的动作。在单任务和目标条件离线RL基准测试中,QGF优于先前的测试时强化学习方法,与最先进的训练时算法性能相当但运行成本更低,且通过避免演员-评论家训练的不稳定性展现了良好的模型规模扩展性。

具身智能论文/研究
10:56
HuggingFace Daily Papers(社区热门论文)
65
Workflow-GYM:面向真实世界专业领域长周期GUI智能体任务的基准

Workflow-GYM是专门评估AI智能体在专业领域和专用软件环境下执行长周期GUI任务的基准。实验表明,即使是最强模型,成功率也仅略高于30%,凸显出专业长周期GUI工作流对当前智能体的巨大挑战。进一步分析发现,智能体难以维持工作流一致性,频繁出现阶段遗漏、错误传播、目标漂移以及对专业软件环境理解不足等问题。这些发现揭示了当前智能体的局限性,并为下一代GUI智能体研究指明了关键方向。

智能体arXiv论文/研究评测/基准
10:56
HuggingFace Daily Papers(社区热门论文)
60
SCAIL-2:端到端上下文条件控制的角色动画统一框架

SCAIL-2 提出绕过姿态骨架等中间表示的端到端角色动画框架,通过直接拼接驱动视频获取全部视觉信息。为解决端到端数据匮乏,用解耦条件统一子任务,构建异构运动迁移数据集 MotionPair-60K。采用上下文掩码条件与模式特定 RoPE 作为软引导,并引入 Bias-Aware DPO 构建偏好对以缓解合成数据在细节区域的误差。实验表明,该方法在多个任务中显著优于现有 SOTA。部分合成数据与模型权重将开源。

图像生成视频论文/研究
10:56
HuggingFace Daily Papers(社区热门论文)
64
DLA:面向多状态线性注意力的动态内存建模框架

大语言模型长上下文扩展受限于标准注意力的二次复杂度。现有线性注意力多状态方法采用固定合并策略,无法适应token动态重要性,造成关键token丢失。DLA提出信息感知动态状态合并,根据token级信息变化自适应确定状态边界;并引入容量有界记忆建模,通过选择性合并相邻低信息状态维护固定大小缓存。DLA在两个线性注意力模型上预训练,在16个数据集上超越现有最优方法。

推理数据/训练论文/研究
10:56
HuggingFace Daily Papers(社区热门论文)
63
ARM:统一离散表示的自回归大型多模态模型

ARM是一种基于离散表示的自回归模型,将图像理解、生成与编辑统一在下一个token预测框架中。首先训练离散语义视觉tokenizer,通过多目标监督实现语义判别、语言对齐与忠实重建;然后在文本与图像token序列上训练7B自回归模型,自然融合视觉语言感知与生成能力;最后用强化学习优化文本到图像生成与指令引导编辑的偏好对齐,使WISE整体得分从0.50提升至0.56,GEdit-Bench-EN的G_O评分从5.75提升至6.68,并观察到跨任务协同效果。

arXiv图像生成多模态论文/研究
‹ 上一页
1…2930313233…50
下一页 ›