开100 刀一月的 Claude Cowork,就不用学Excel了?
差评XPIN,2026-01-20 00:07:41

上周,Anthropic 推出了他们的最新 Agent 产品 Claude Cowork。刚上线就被大伙儿一通狂吹,什么 AGI 真神降临,打工人的末日要来了。。。上次见到此等盛况,还是在 Manus。
![]()
世超赶紧去官网翻了翻,发现这 Claude Cowork 好像是有点东西。
什么归纳桌面文件,总结会议记录,还能深度研究直出报告,整理数据资料做 PPT。。。总之就是啥活儿都能干,难搞的办公杂活儿它都能搞。

各种社交平台上,更是清一色的好评买家秀:
“Claude Cowork 两分钟改变了我的人生。”
“我快哭了,Claude Cowork 爱你哟!”
![]()
更绝的是,Anthropic 还自爆 Cowork 内含 100% AI 代码,没有一点人工,只用 10 天就搓出来了。
你说这谁不想看看,一致好评的纯血 AI Agent 到底有多神?
所以,这回世超斥巨资 100 刀深度了体验一波 Claude Cowork,顺手和付费版 Manus 做了个对比。用完我只想说,贵有贵的道理,但真不至于这么贵。。。
先夸一波 Claude Cowork 的界面设计,还是很简洁舒适的。右侧边栏会显示任务进行到哪一步,任务过程中生成的工作文件也可以随时访问。不像一些 Agent 只能慢悠悠出个结果,AI 在后台摸了半天鱼都不知道。
![]()
吹完界面,世超要上点真东西了。我们准备测一测它官网给出的四大示例,包括数据分析、文档创建、研究分析、文件和文档管理。
先是数据分析和文档创建,这俩功能放年末有啥用处,大伙儿懂得都懂。每年这个时候,估计不少差友都得来点年终总结,这玩意儿简直是对记忆力、语言组织和 Excel 熟练度的三重考核。
但现在,Claude Cowork 就擅长干这类数据收集整理,技术含量极低,纯纯麻烦浪费时间的活儿。

比如世超让它统计总结一下 2025 年差评君 B 站的视频数据,再把 Excel 直接喂我嘴里。
Cowork 先向我申请了浏览器操作权限,然后就像咱平常收集资料一样,通过 MCP 浏览了一会儿差评君首页。
![]()
十五分钟后,它默默返回了一个 Excel,里面的数据不仅包含一整年的所有 83 个作品,而且每条播放量、点赞、弹幕数、评论、投币、收藏、转发,全对。
世超截一部分给大伙儿看看:
![]()
这种长程、多条目的任务,其实正是大多数 Agent 最容易翻车的地方。因为这种任务考验的不是 Agent 聪不聪明,而是它能不能在长时间里记得住目标、对得齐细节、还一次都不出错。
我们又用 Manus 1.6 Max 试了试同样的任务,结果 Manus 只统计出了 75 个视频的相关数据,总数都对不上,别的更别提了。
![]()
接下来,世超体验了一下大伙儿强推的文件文档管理。不少人都说用它一口气删了几千个截图,清理了桌面一堆乱麻,救大命了。
作为一个究极 J 人,世超的桌面本来是相当干净的。只不过今天为了测评 Cowork 多出来不少录屏,系统默认按时间命名,堆一起实在有点难绷。
![]()
这回,我先让 Cowork 把三分钟以下的废片删掉,初筛一下。这里向系统申请删除权限花了两分钟,全程三分钟左右。

再把录屏按任务内容重命名,只要一分半,素材立刻拥有姓名。

说实话,录屏一多,一个个打开辨认重命名,是相当麻烦的事儿,这活儿世超平常十分钟都整理不完。
在这里和 Anthropic 商量一下,如果一个月 10 块,我愿意专门为了 Cowork 这个功能开连续订阅嗷。
最后,世超又测了测 Cowork 的研究分析,掏出经典旅游规划问题,指定时间地点,让它推荐机酒和路线。
八分钟不到,Cowork 把结果整理出了一份 docx 文档。总的来说,行程规划没啥问题,比 Manus 要更细一点。
![]()
但不幸的是,在机酒价格上 Cowork 还是翻车了。
它的信源出现了问题,价格全是按日常价算的。而实际上春节的机票已经涨到了 4000 以上,酒店也普遍标低了 200 到 400。
![]()
相比起来,Manus 的行程预算偏高,但更接近春节出行的真实价格。
![]()
![]()
世超又测了一些其它的例子,比如生成 30 页 PPT,写个三维弹球游戏,或者总结最近 AI 领域的新闻,只能说偶尔有错误,但大部分任务中规中矩地完成了,没有很惊艳。
不过,放在今天这个整体还不太成熟的 Agent 赛道里,它确实已经算是完成度靠前的那一档了。

说到这里,其实一个所有 Agent 都绕不开的尴尬问题已经初现端倪了 —— 不是它能不能干活,而是你敢不敢信它的结果。
哪怕 Claude Cowork 在同行里已经算很优秀的产品,世超用起来依然提心吊胆,因为你很难信任一个神一刀鬼一刀 Agent。
尤其是 Agent 和普通大模型还不太一样。我们期待它交付的,不是原始材料,而是已经被高度整理、压缩,甚至直接给出结论的成品。一旦中间某个环节出了问题,用户往往很难逐条核验,我甚至不知道该从哪一步开始怀疑。
于是就出现了一个很微妙的状态,Agent 的确帮你省了做任务的时间,但你又不得不花更多精力去检查和验证。
![]()
那么问题来了,Agent 炒了这么久,为什么一直做不好?
原因其实也不复杂。今天的大多数通用 Agent,本质上做的事情都差不多:调用工具、执行步骤、读取结果,再把这一切包装成一份看起来很完整的交付物。这件事,对 AI 来说并不算难。
真正困难的,是 AI 能不能在长任务、复杂分支和大量细节中,始终对齐目标、不丢状态、不出幻觉,这也是为什么很多 Agent 看着很忙,结果却总差一口气。
而 Cowork 能比其他 Agent 稍微稳一点,核心原因也不神秘。它底层用的是自家专门为写代码、跑流程、盯细节打磨过的 Claude Code。这种模型本身就更擅长处理长上下文、明确约束和多步骤执行,Agent 只是把这点优势放大了而已。
![]()
所以你会发现,Agent 的门槛并不高,大家都能做;但 Agent 的上限也不高,大家也都做得不太好。
在这样一个背景下,Anthropic 把 Cowork 卖这么贵,多少有点犯罪了。
很快啊,开源社区给出了回应,专治各种漫天要价。GitHub 上先是冒出了一个 Openwork,目标很明确,要做一个开源、可扩展的 Cowork 风格系统,刚开源就冲上了 Hacker News 热榜第一。紧接着又来了 AionUI,免费、开源、支持多模型,功能差不多,还不要钱。
![]()
结果最先扛不住的反而是 Anthropic 自己。Cowork 上线不过一周,就从 100 美元 Max 会员独占,下放到 20 美元 Pro 也能用,狠狠背刺了一波世超。
所以接下来,世超也会继续把这些开源方案跑一遍,给大家做一轮横向对比。看看在 Agent 这条路上,这钱花得到底值不值,又有多少是真的冤。
撰文:莫莫莫甜甜
编辑:江江
美编:萱萱
图片、资料来源:
莫莫实测
X、github、Claude 官网
![]()