WorkBuddy从0到1教程:国内最友好的通用Agent产品,对标Claude Code和Codex · AI HOT
数字生命卡兹克@Khazix091869
2026-06-11 13:13·4天前
AI 摘要WorkBuddy是一款国内通用Agent产品,支持Windows和Mac,微信扫码登录,个人专业版58元/月。界面提供Ask/Plan/Craft三种工作模式和代码开发、日常办公、设计创意三个场景,内置DeepSeek V4 Pro、腾讯混元、GLM、Kimi等国产模型。专家中心有100多个垂直领域AI专家,支持专家团多Agent协作。技能市场(Skills)和MCP连接器可打通QQ邮箱、腾讯会议、腾讯文档等生态,也支持自建技能和连接器。上周五腾讯推出WorkBuddy企业版。
智能体MCP/工具教程/实践
数字生命卡兹克@Khazix0918 · X69
2026-06-11 13:13·4天前
AI 摘要WorkBuddy是一款国内通用Agent产品,支持Windows和Mac,微信扫码登录,个人专业版58元/月。界面提供Ask/Plan/Craft三种工作模式和代码开发、日常办公、设计创意三个场景,内置DeepSeek V4 Pro、腾讯混元、GLM、Kimi等国产模型。专家中心有100多个垂直领域AI专家,支持专家团多Agent协作。技能市场(Skills)和MCP连接器可打通QQ邮箱、腾讯会议、腾讯文档等生态,也支持自建技能和连接器。上周五腾讯推出WorkBuddy企业版。
比如你选了日常办公中的文档处理,会展开一组更细的提示词模板。你把里面的内容替换成自己的实际需求,改改就能发。
产品的便利性和体验上,我说实话,这个还是国内做的更好一点。
再看对话框下方,左边有一排选项,我们从左到右过一遍。
第一个是工作模式,三种模式,能力从下到上是逐级递增的。
Ask,就是纯聊天,你问它答,跟你平时用豆包那种对话框是一样的。
Plan,是先出计划再动手,如果你是新手,对AI干活还没什么安全感,可以用这个模式先过一遍再开干。
Craft,是平时干活的Agent模式,大部分情况就是用这个。
这里提醒一下,WorkBuddy默认就是Craft模式。也就是说你随便发一条消息,它就直接开干了,积分也就开始消耗了。
所以如果你只是想聊两句、问个问题,记得先切到Ask,如果还没想清楚怎么做,就切到Plan。
模型方面,WorkBuddy内置了绝大多数的国产大模型,腾讯混元、DeepSeek、GLM、Kimi都有,不同模型消耗的积分不一样,这块你就别问为啥没有GPT、Claude之类的了。
不同模型擅长的方向不一样,每个人喜欢用的也都不一样,你完全可以根据自己的任务类型和偏好来选。
但如果你真不知道选啥,或者就想要一个最通用的,我就无脑推荐你使用DeepSeek V4 Pro,目前我感觉最适合绝大多数的C端用户的,价格低,且综合能力强,世界知识、Coding、Agent能力等等几乎前面覆盖了,除了没有多模态,在国内相比,几乎都是水桶级的。
如果你有自己的API Key,想用自己的模型,WorkBuddy也支持接入外部的。
说完模型,权限这一块,它提供了默认权限和完全访问权限两种,没啥特别的,跟其他的Agent一样,默认权限就是遇到高风险操作会先停下来问你。
我自己不管啥Agent,选的一般都是完全访问,因为每次弹框我一般也就是点确认,说实话也看不太懂那些提示,那还不如就别烦我,全交给它自己跑。
右边的加号,可以上传文件,包括本地文件、腾讯文档以及知识库,这个比较好的一点事跟ima知识库全面打通了,如果你是ima的重度用户,那你一定会觉得非常香。
工作空间,可以理解成项目文件夹。你可以选择当前任务要使用的目录,选择完成后,WorkBuddy会基于该目录读取和处理文件。
也可以直接开始任务,WorkBuddy会在默认目录中生成结果。
如果一开始没选工作空间也没关系,任务完成后你也可以再存进工作空间。
说到这里提醒一句,前期分类真的很重要,不然等后面任务堆多了,找起来是真的头疼。
然后就是重点了,左上方的功能区,有助理、项目、专家、自动化、以及文件、知识库文档和灵感。
先说专家,你可以把专家理解为,一个已经全面封装好的垂直Agent。
WorkBuddy里内置了100多个专业领域的AI专家。
进入专家中心,里面按行业分好了类,每个专家都有自己的能力卡片。
点击之后就进入对话了,用起来跟平时没什么区别,只是它现在换了一个专业视角的专家Agent在帮你干活,你直接说需求就行。
比如,一个微信小程序的专家,擅长的领域是小程序开发、微信生态、WXML开发,你想做个小程序,直接召唤它,关于微信开发所需要的行业知识、技能还有一些其他的东西,已经全部帮你封装好了。
你像前天刚高考完,WorkBuddy就上新了一个高考专家,能刷真题、换算一分一段、查院校专业。考生朋友们,接下来报志愿就能用上了。
也能看到我的资讯速递专家,一句话就能查到每天精选的AI动态,自动整理成中文简报。
专家是一个Agent帮你干活,专家团则是是一群Agent一起协作,这个肯定打大家都比较好理解了。
你把任务丢给专家团,团长自动帮你拆任务,分给不同的专家并行跑,跑完再整合结果交付。
比如一个软件开发的团队,会有交付总监作为主理人,负责统筹,底下有产品经理、架构师、工程师、QA工程师,一整条研发流水线全配齐了。
就很像当老板的感觉就你往那一坐,说一句帮我搞定,然后一群AI员工们就嗡嗡嗡地开始干了。
不过因为是多个专家同时跑,积分消耗大概是单个专家的3到5倍,毕竟多个Agent之间来回通信,还是挺贵的。
当然,你也可以自己创建专家,点右上角的我的专家进去。
如果你在某个领域有自己成熟的方法论和一些技能,完全可以把它封装成一个专家,以后反复调用,甚至分享给别人。
WorkBuddy在这块,做出了一些国产特色,还是比较有意思的,他们做了一个完整的Skills市场,确实对于很多的用户都极度友好。
推荐里面是官方精选的一些技能,很多都是官方自己的。
而Skillub里面全是大家做的各种Skill,基本上已经非常全了,热门的都有,想要啥你基本都能直接搜到。
在Claude code以及codex里面就是插件的意思。
如果你也想自己做一个,点右上角的添加技能,选创建技能。
一句话来解释,就是把WorkBuddy跟你日常在用的外部服务打通。
比如昨天很爆的瑞信咖啡的Skill,他们也有MCP版。
WorkBuddy在MCP这块最大的优势,就是能跟腾讯的整个生态无缝打通。
比如QQ邮箱,连接之后可以直接发送、搜索和整理你的邮件,还有腾讯会议、腾讯文档,都可以接进来。
还有能够看行情数据的通达信MCP,造福炒股的朋友们。
如果你是QQ邮箱用户,这个就太香了,操作也简单,点击QQ邮箱的MCP。
WorkBuddy在支持的技能生态这块,做的还是比较完整的,对国内的用户,确实体验相当的友好。
但接下来的设置环节,我还是非常推荐你跟着我走一遍,有些东西调好了,后面用起来会顺畅非常多。
一个是技能自动更新,这个很重要,因为WorkBuddy有Skills广场,所以其实生态是很完整的。打开之后你装的那些Skills有新版本了会自动升级,不用自己总是要去手动下载升级。
另一个是锁屏远程,这个跟Codex和Claude差不多,就是打开之后你电脑不会进入休眠状态了,免得出个门发现电脑休眠WorkBuddy直接躺了。
它会从你们的对话中提取关键信息记下来,以后碰到相关的事会自动调出来用。
如果之前你用过其他Agent,还能直接把那边的记忆导过来,搬家很方便。
自定义指令,之前在Codex和Claude Code教程里的也都说过,类似于最高等级的CLAUDE.md文档,整个Agent的最高级文档,你给Agent定下的顶层规矩。
这块给大家推荐一个非常通用的,适合大家的来自大神卡帕西的模板,可以直接复制粘贴用上。
减少常见LLM编码错误的行为准则。可根据需要与项目特定指令合并。
**权衡:**这些准则倾向于谨慎而非速度。对于简单任务,自行判断即可。
**不要假设。不要隐藏困惑。把权衡摆到台面上。**
- 如果存在多种理解方式,全部列出来--不要默默选一个。
- 如果有什么不清楚的,停下来。说明哪里让你困惑。提问。
- 如果你写了200行但50行就能搞定,重写。问自己一句:"一个资深工程师会说这写复杂了吗?"如果是,简化。
只动必须动的地方。只清理自己制造的问题。**编辑已有代码时:
- 没坏的东西不要重构。- 匹配现有风格,即使你会用不同的写法。
- 如果注意到不相关的死代码,提一嘴就好--别删。当你的修改产生了孤立代码时:
- 移除因你的改动而变成未使用的import、变量和函数。
检验标准:每一行改动都应该能直接追溯到用户的需求。
**定义成功标准。循环验证直到确认通过。**把任务转化为可验证的目标:- "加验证"→"为非法输入写测试,然后让测试通过"- "修这个bug"→"写一个能复现它的测试,然后让测试通过"- "重构X"→"确保重构前后测试都能通过"对于多步骤任务,列出简要计划:1. 【步骤】→验证:【检查项】2. 【步骤】→验证:【检查项】3. 【步骤】→验证:【检查项】
强成功标准让你能独立循环推进。弱标准("让它能跑")则需要不断澄清。
**这些准则起作用的标志是:**diff中不必要的改动更少了,因过度复杂化而返工更少了,澄清性问题出现在实现之前而不是犯错之后。
我们先给大家看个办公任务,WorkBuddy在办公这块确实花了不少心思。
选你电脑文件存放的文件夹,WorkBuddy能直接读取里面的文件。
比如我让他帮我基于上周的公众号数据,生成一个报告,在周会中进行汇报,虽然我也不知道我要跟谁汇报。。。
旁边有个优化提示词的按钮,可以点一下让它帮你润色。
出来的效果长这样,变成了一个有结构化提示词,对于不像Opus 4.8这种级别的超强模型来说,喂一个结构化提示词进去,出来的效果确实会好不少,这个也是之前不少研究验证过的结论。
确认完就开始跑了,界面上能看到一个Todo清单,正在执行哪一步、接下来做什么,进度很清楚。
跑完的效果长这样。右侧边栏可以查看任务产出的文件和预览内容。
基本上,你在办公中能想到的跟办公有关的需求,无论是文档、还是数据、还是PPT啥的,你都可以让WorkBuddy来干,而且干的还不错。
除了通用的办公需求之外,我们接下来,再来做个好玩的开发向。
我让它帮我做一个WorkBuddy的功能介绍网页,要包含所有的功能,好看且有设计感。
一会就做完了,中间的过程我就不截图了,反正都是它自己在做,我干别的事情也没再管。
右侧栏里能直接预览,嫌小的话也可以点击右上角在浏览器里打开看整体的效果。
怎么说呢。。。这个配色AI味有点重了,紫色看得我有点PTSD。
于是我用一个前端开发的Skill,让它重新优化了一版。
过程同样就不截图了,最后效果如下图,这版看着就舒服多了。
同样的,我们自己还有个我们自己的服务器管理的Skill,我们可以继续对话,来让WorkBuddy帮我们把这个小网页,调用我们的服务器Skill把它部署上线。
不过开发这块我得说句实在话,目前国产模型在代码能力上跟最顶尖的确实还有段距离,做小项目、搓个网页之类的问题不大,但真碰上复杂的大工程。
我极力推荐你,克服一切困难,想办法用上Claude Code或者Codex。
远程控制跟Claude Code和Codex还有点不太一样,它是原生跟微信打通了,毕竟都是腾讯自己家的产品嘛。
当你不坐在电脑前,也能让WorkBuddy帮忙处理工作。
然后掏出手机微信扫上面这个码,打开小程序,授权登录。
手机端的小程序分为两种模式,一个是云端工作,一个是连接电脑。
云端工作,是指任务在云端沙箱跑,不需要你电脑开着。
连接电脑,则是远程操控你本地电脑干活,适合需要读取电脑里文件的任务。
举个实际的场景,比如我在外面,突然需要把电脑里一份文件发到财务的邮箱里。换做以前,我只能回去后发,还会耽误其他人的工作进度,但是现在手机上跟它说一声,就可以了。
不过,实现发送邮箱的前提是,我在一开始就配置好了qq邮箱的连接器。如果你还没有连接配置,也可以让它把电脑文件直接发到小程序的对话框里。
除了小程序,还可以接微信的ClawBot插件,不过我个人体感,小程序上的体验会更好且更稳定。
而飞书、钉钉、QQ也都可以接助理,点击配置后按照流程来做就行。
我一直觉得,对于绝大多数人来说,Agent的核心价值不是帮你写出最牛逼的代码,而是帮你把每天那些重复的、琐碎的、让你浑身难受的办公任务给自动化掉。
发个邮件、整理个数据、做个PPT、跑个简单的小网页。
这些事情,WorkBuddy已经完全能干了,而且干的还挺好。
我之前写Claude Code和Codex教程的时候,评论区最多的一类留言就是,「好是好,用不了啊」。这句话我看了几百遍,每次看到都觉得挺无奈的。