国际数学联盟支持一份关于科技行业影响力对数学领域构成威胁的警告。该警告指出,随着行业影响力的扩大,人工智能对数学家的职业前景构成了威胁。
国际数学联盟支持一份关于科技行业影响力对数学领域构成威胁的警告。该警告指出,随着行业影响力的扩大,人工智能对数学家的职业前景构成了威胁。
Open claw windows companion app
In a new Stanford study, law professors by far preferred Gemini 2.5 Pro's responses over those written by their peers wh...
OpenAI披露,Codex每周用户已超500万,其中非开发者用户约占20%,增速是开发者的3倍多。此次更新旨在将其从开发工具推向通用工作系统,主要推出三项能力:1) 面向数据分析、销售等角色的角色插件,覆盖62个应用和110个技能;2) 面向企业客户的Sites功能,可将计划生成为可协作的交互式网站;3) 扩展到文档、表格等的批注功能,支持局部修改。这些更新旨在让Codex更好地理解岗位上下文,进入企业现有工具链。
12.30pm today on the @Microsoft Build stream @NoPriorsPod x @latentspacepod x @satyanadella Join us! :)
Normal 🔨Mere Tool🔨 behavior. My hammer only does its job when I ask nicely.
字节背景创业者梦琪复盘其AI软件公司Invocal一年来的转型历程。她经历了典型剧本:组团队、讲AI智能体故事、连续融资,随后经历三次错误决策:选择垂直智能体场景(达人营销的Sourcing资源挖掘)、选错场景(该环节仅占链条30%)、并误判横向扩张。她得出结论:垂直智能体存在结构性困局,易被迫变成代理公司,且To B模式难以获得模型效率的倍增红利。转向C端后,团队开发了浏览器插件CLICK,其核心价值在于缩短用户意图与解决方案的距离。她总结认为,大部分应用层创业公司不需要算法工程师,创始人刚融资时最易陷入“愚昧之巅”。
郭明錤认为,NVIDIA CEO黄仁勋在GTC提出的“重新发明PC”口号,核心是展示端侧AI agent工作流概念。他指出,该概念并非原创,但将借助高曝光度主导未来叙事。然而,现实挑战在于:配备N1X芯片的RTX Spark装置未来两年出货量约1000万台,仍属利基市场;且当前PC主流AI应用与端侧算力关系不大。关键制约在于操作系统支持,Windows需完善相关工具才能兑现端侧AI agent体验。这也将影响Apple在WWDC上如何回应。
許多人期待、Nvidia 可能將要發布的 N1X / Windows PC 處理器,供應鏈調查與重點分析: ▌供應鏈調查顯示,配備 N1X 的裝置未來兩年出貨量約10M ➡ 仍屬利基市場,瞄準對裝置端 AI 算力有需求的重度使用者。 ➡ 未...
郭明錤分析了NVIDIA在GTC上提出的RTX Spark笔记本及设备端AI智能体概念。他指出,该概念演示(无实际现场展示)包含操作系统、云/本地LLM切换、智能体框架等要素。供应链调查显示,配备相关N1X芯片的设备未来两年出货量约1000万台,仍属利基市场。当前PC端主流AI应用仍依赖云端算力。若设备出厂时,NVIDIA CUDA Toolkit未正式支持Windows Arm64,且Microsoft的设备端AI智能体栈(包括MCP on Windows、ODR等)仍处于预览状态,则RTX Spark将难以兑现其核心卖点。此外,Apple在WWDC上如何应对设备端AI智能体工作流也值得关注。
許多人期待、Nvidia 可能將要發布的 N1X / Windows PC 處理器,供應鏈調查與重點分析: ▌供應鏈調查顯示,配備 N1X 的裝置未來兩年出貨量約10M ➡ 仍屬利基市場,瞄準對裝置端 AI 算力有需求的重度使用者。 ➡ 未...
Lee Robinson 批评当前AI模型基准测试存在局限,如 SWE-bench 已过时且结果难以复现。评测分数易受硬件、GPU差异和prompt微小改动影响,波动明显。这些基准对模型训练者衡量进展有价值,但对普通用户,当分数饱和时便失去参考意义。他指出,模型的交互风格、个性等重要因素无法被现有公共基准充分衡量。因此,建议用户综合参考多个基准,并亲自使用模型以形成判断。
I'm tired of useless AI benchmarks. How about we give three people a different model, strand them on an island, and see ...
RTX spark running 120b parameter model locally. Ngl, pretty cool
独立开发者Bennett利用Codex AI编程工具,在23.5小时内开发出开源App Goose。该应用可直接通过蓝牙读取Whoop 5.0的健康数据,无需订阅。实现基于公开的BLE协议分析,使用Rust和SwiftUI将数据本地化存储。此举暴露了依赖用户数据锁定和惯性构成的订阅制硬件护城河的脆弱性,并展示了AI工具如何降低个人挑战封闭生态的成本。
🤓rig+mocap+retarget整个流程走通了。 下一步是完善游戏的controller,做state machine 然后明天开始演戏当动捕演员了🤓 准备给我的游戏设计几个酷炫的技能 想想就好激动。
Moonshot AI创始人杨植麟最近放出了一个40分钟视频。 这位92年生、清华计算机本科第一、CMU博士、Transformer-XL和XLNet共同作者,前Google Brain和Meta研究员,坐在镜头前平静拆解了Kimi K2的...
Intelligence at Work keynote from OpenAI 🍿
AI正在推动医学领域的革命性突破。Eli Lilly研发的三重激动剂retatrutide能有效溶解脂肪,解决肥胖及其下游后果问题。肥胖自工业革命以来已成为现代文明的严重挑战,如今正被攻克。新型药物使黑色素瘤、胰腺癌等曾无法治疗的癌症变得可治疗,同时GLP-1激动剂还具有抗炎等益处。我们正进入Demis Hassabis所说的“科学黄金时代”,见证科学潜力全面展现。
在Code w/ Claude SF 2026活动上,Claude Code工程团队分享了将智能体编程设为默认工作方式后带来的流程与结构变革。核心变化包括:规划转向即时(JIT)模式,强调快速原型与反馈;上下文收集变为“先问Claude”;代码审查中Claude处理风格与测试,人工专注于法律、安全等专业判断。新范式下,工程瓶颈从编写代码转向验证、审查与安全维护。
关联讨论 2 条X:Ethan Mollick (@emollick)X:邵猛 (@shao__meng)根据OpenRouter平台数据,自2025年以来,开放模型使用量显著增长。最新数据显示,开放权重模型产生了69.1%的token使用量,闭源模型为30.9%。新模型的发布会吸引开发者测试,推动token使用量达到新的平台期。开放模型市场内部竞争激烈,领导地位频繁更迭,如DeepSeek的早期优势在2025年末至2026年初被MiniMax与Kimi模型取代,随后MiMo、Qwen、腾讯Hy3、阿里巴巴及Arcee等模型的发布再次改变了份额格局。尽管开放模型目前仍只占推理总量的一小部分,但激烈的竞争与增长表明,开发者正越来越愿意将生产流量路由至开放模型。
英伟达开源了一款针对AI智能体Skill(技能)的安全扫描工具。推文指出,Skill安全虽是一个实际问题,但目前专门做此方向扫描的工具和人员似乎较少。尽管尚未出现由Skill引发的严重破坏性案例,但仍需保持警惕。推文建议,用户可以考虑编写一个Meta Skill(元技能)来自动生成各种所需的Skill,并强调他人的Skill应主要用作学习和参考,而非直接使用。
知名营销专家 Seth Godin 发表博文《别再搞砸了》,呼吁在做事时保持质量和初心,避免将原本好的事情破坏。文章发布于2026年6月2日,在 Hacker News 上获得了110个积分。
知名人工智能批评者Gary Marcus在其关于可信赖AI的专栏中,探讨了人工智能发展面临的根本性挑战。文章开篇即指向问题的核心,指出相关数学理论的局限性与人类心理的复杂性,是导致AI系统最终可能出现问题的根源。
Alphabet意外宣布筹集800亿美元资本,引发热议。Jefferies分析师Brent Thill认为这是一次主动的战略出击,而非被动救援。此举旨在OpenAI、Anthropic和SpaceX可能的IPO之前抢先巩固优势。他预测AI领域的年支出可能突破1万亿美元,并指出AI热潮或将从根本上重塑企业的招聘与投资决策。
关联讨论 4 条Bloomberg:Technology(RSS)TechCrunch:AI(RSS)Hacker News 热门(buzzing.cc 中文翻译)X:Rohan Paul (@rohanpaul_ai)迈克尔·伯里公开表示,SpaceX与Anthropic的估值均不应达到1万亿美元。他指出,即使Anthropic的年化收入达到当前水平,实现这一估值也面临巨大挑战。此言论引发市场对当前AI及科技公司高估值合理性的关注与讨论。
Anthropic's last round was apparently a bloodbath behind the scenes. A GP at a prominent fund had dinner with Dario thre...
商汤开源了AI办公技能套件SenseNova-Skills。这是一个为任何技能兼容智能体(如OpenClaw与HermesAgent)设计的开源技能集合,提供四大核心功能:图像信息图表生成(可镜像参考风格)、数据分析(支持多表解析、清洗与可视化)、PPT创建(生成大纲内容并智能排版,输出可编辑文件)以及深度研究(跨学术、技术、社交等多源搜索并生成报告)。该技能套件现已完全开源。
中国人形机器人公司宇树科技(Unitree)于2024年实现净利润7750万元人民币,2025年利润增至约6亿元,净利润率约35%,在行业普遍亏损的背景下实现盈利。该公司已通过上海证券交易所上市委员会审核,拟融资约42亿人民币,目标成为首家在A股上市的专业人形机器人公司。其H2 Plus人形机器人预计年底出货,已被Nvidia纳入Isaac GR00T参考设计,将与Jetson Thor整合。宇树以低成本、高可靠性的产品路线实现商业化,基础版G1机器人售价约1200美元。
投资人Mike Vernal认为,AI让软件编写成本趋近于零,传统“找楔子→扩展套件→变平台”的三段式创业剧本已过时。他指出,Cursor等公司能在两年内从0做到一亿ARR,时间窗口被极大压缩。因此,他主张在创业初期就直接瞄准核心市场(即“深水区”),展现不可理喻、不可阻挡的野心。他以Cursor种子轮时就声称要替代VS Code为例,认为这个目标如今看来甚至还不够大胆。
http://x.com/i/article/2061520512174768128
Google推出了名为Gemini Spark的新一代AI智能体。它是一个始终保持在线的agentic产品,野心在于成为解决各类问题的“万能答案”。在实际测试中,Spark在旅行规划这一典型AI用例上,展现了与以往AI截然不同的能力。此前,AI规划行程通常只能提供最通用、最表层的建议;而Spark则表现出更深层次的、主动的代理能力,其体验被作者形容为“迄今最令人震撼与恐惧”。
Google DeepMind的AI模型Gemini Spark提供了一次极为深刻但同时令人感到不安的用户体验。该模型展现的强大能力令人印象深刻,但其带来的影响和潜力也引发了深刻的恐惧感。
In case you missed it, I published a video last week that was 100% edited by @cursor_ai + @Remotion + @FFmpeg turning th...
一篇题为《为什么是珍妮特?》(2023)的技术博文在 Hacker News 获得 114 点热度,引发讨论。博文发布于 ianthehenry.com。
360安全龙虾云端版的龙虾教练可通过问答交互(约10轮),将开源项目整合为垂直Agent。以lenny-skills项目(86个产品管理技能)为例,生成了产品经理Agent“张伟”,可理解项目进度、拆解需求,并调用Claude Code和Codex实现AI新闻雷达v0.6版改进(增加AI占比评分、信任打分、事件去重)。另支持对话缓存(5分钟内复用系统提示语和TOOLS)、细粒度权限分级(文件/网络/系统/技能可单独配置本地访问)。
有用户发现“信息差”副业:在闲鱼、小红书上售卖AI合同审核skills。具体案例显示,一个skills定价69元,已售出超过5500元。主推文者认为,自己此前分享的一篇关于如何制作AI skills的文章提供了关键方法,使得这种“稳赚不赔的副业”成为可能。
http://x.com/i/article/2061406941541240838
该推文核心观点是,2026年国内大厂已无绝对稳定,所有员工都应做好准备,要么创业,要么加入初创团队。其理由在于,大厂岗位随时可能面临“组织架构调整”,而AI发展迅猛,唯有投身实践才能真正学习。对于产品或研发人员,建立个人品牌和稀缺性价值更高。推文作者指出,许多大厂人和海归因AI快速发展而焦虑迷茫,建议他们立即重点学习AI智能体(AI Agent),通过解决实际问题来积累真正有用的能力。