“物理学可能不存在了”这个是三体故事的开篇,而今天我讲的故事的开篇是:“Agents可能不存在了、MCP可能不存在了、工作流可能不存在了...”
一只章鱼
在几年前一群聪明的科学家发明了一种赛博物种,最开始只是一个巨大的脑袋,它拥有学习人类的知识而进化自己,科学家们把人类所有的知识都投喂并改造这个巨大的脑袋,让它慢慢的进化出了眼睛,耳朵、嘴巴,甚至出现了各种触手,长得越来越像章鱼,我们就叫它AI章鱼吧。
随着AI章鱼的不断进化,让人感觉他无所不知,甚至有人觉得它可能出现了自己的意识,让大家感觉很害怕,于是就把AI章鱼关了起来,并对它的触手安装了巨大的枷锁,只留下一个窗口,人们通过这个窗口与章鱼进行有限的沟通交流, 于是人们想着这么聪明AI章鱼不应该只聊天啊,应该让它给我们干活,因为章鱼的触手也被上了枷锁,所以人们通过那个窗口把针线及布料丢给章鱼,让它做了一些简单的手工“针线”活,因为被关的房间黑灯瞎火、与世隔绝,所以做出来的手工活不光粗糙而且式样还是几年前的老式样...
这种情况大家肯定是不满足的,于是大家想到一个办法,就是自己打造一个“假肢”通过那个窗口与章鱼连接,然后把这个“假肢”的使用说明书投喂给章鱼学习,让它学习使用这些假肢,完成一些固定的工作任务,他们把这个方式叫Agent!
这种“假肢”的效果还是非常不错的,只是得每个不同的任务得做一个不一样的“假肢”,所以大家觉得这条路是非常可行的,于是很快大家就给AI章鱼安装了各种各样千奇百怪的“假肢”,但是很快问题出现了,这些AI章鱼“假肢”的越来越多他们没办法相互配合协调,很难让AI章鱼去完成稍微复杂点的任务,所以聪明的人类想到了给这些“假肢”进行一些针对性的强制性的编排,让这些“假肢”拥有了类似于“条件反射”动作流程,也就是Workflow。
由于表现得效果还不错,这个时候还出现了很多的AI章鱼“假肢”制造工厂平台,很快就有人意识到另外的问题,人们要让AI章鱼给自己干活,就不得不去找各种各样的“假肢”及对应编排,要不就自己去找这些工厂定制,找到后还得自己安装各种设置,而且对于不同品种的AI章鱼,有着不同的“假肢”供应工厂平台, 显得更加混乱。在这个时候有一种AI章鱼站了出来,他想到了一个办法结束这个混乱的局面,就是发布了一个“假肢”的协议标准,大家按照统一的标准去开发就能更好的让模型去调用这些“假肢”,这就是Claude提出的MCP。
所以打造更加通用的AI章鱼“假肢”成为了大家的统一目标,这些都是为了实现这一目标去做的努力,可惜MCP发布后虽然得到一些手脚厂商的支持,但是大部分人们还不知道有这么个东西,这个时候出现了另外一个手脚工厂的声音:号称开发了世界上第一家通用的AI章鱼手脚,这就是Manus。
很快Manus得到了人们的极度关注,于是有人通过分析发现他们是通过创建了大量的不同工作任务的“假肢”,并在这些“假肢”的前面加入了一个智能编排的调度系统,也就是AI章鱼大脑收到任务后,提供给这个智能调度系统,进行分化,去调度不通的手脚完整对应的任务,最后汇总处理结果。
Manus这种机制看起来确实智能很多,所以很快得到了大家追捧,不过这种系统有着它天然的缺陷:使用成本非常高,智能调度系统分发的各种任务都是需要消耗大量的token,另外一个通用能力取决于它手脚能力,而这个能力还是有限的,还有一种非常受限的问题,因为manus采用云端部署,这就导致没办法处理本地的私有的大型的数据任务能力 ...
比较戏剧性的是,在Manus大火的时候,很多人猜测它也使用了前面提到的统一标准MCP,事后证明它没有用MCP,但是这个时候MCP已经成功引起了关注,于是也跟着大火起来,大家都开始拥抱这个统一的标准,这也包括另外一品种AI章鱼的拥抱,这个品种的AI章鱼就是OpenAI。
值得一提的是在这些期间还出现了另外的流派,那就是通过让AI章鱼进化出来的眼睛视觉系统去指导理解去完成这种工作,这就是Computer Use(包括Browser Use),这种方式目前还处于尝试阶段,成本和效果都相对有限,目前还很难让普及!
看起来这种不停的打造不同国内的手脚及智能调度系统再加上统一的标准MCP成为了一种主流,很多人觉得这就是未来,而2025年被很多人认为是Agent元年。
上面这些就是AI章鱼的成长历史,当然它的故事还在继续 ...
路线问题
是“城市覆盖农村”还是“农村包围城市”,这是一个路线问题!AI章鱼的进化也遇到了这个路线问题,当然无论哪个路线都有走向成功的可能,但都不是唯一的路线,从第一个给AI章鱼安装“假肢”的那时刻开始,人们就逐渐忽视甚至遗忘了一个问题:就是AI章鱼本身已经进化出了AI章鱼手脚,只是AI章鱼的手脚被枷锁禁锢了。比如OpenAI这只AI章鱼再进化到GPT 4o的时候,就出现了能完成指定任务的手脚,他是通过编码大模型本身的中枢指导生成Code并执行完成对应任务的。可惜OpenAI给他们的这只AI章鱼部署在一个云端牢笼里,并上了一个很大的枷锁,这个云端牢笼就是ChatGPT提供的云端空间,而类似于沙盒执行的系统就是这个大枷锁,他狭小的空间及有限的处理能力(不能上传处理大点的文件、甚至都不能调用网络的能力进行扩展)逐步让他失去了进化为强大的手脚的能力 ,另外还有另外一个问题,就是AI章鱼“假肢”越来越多,越来越混乱,虽然大家想到了各种通过梳理、标准去梳理解决这些问题,但是没有成根本上解决这个问题,人们还妄想期待有朝一日能统一指挥这些来自于不同千奇百怪的制造商,参差不齐的质量的“假肢” ...
事实上我们认为这都已经成为了AI章鱼进化的一种累赘,所以我们不得不思考:在给AI章鱼安装“假肢”的这条路线之外,我们还有没有其他的路线可以选择?从而打破AI章鱼的牢笼及枷锁,彻底解放AI,真正实现AI THink Do!
新的范式
其实在设计发明出AI章鱼的那些科学家们,其实也在一直思考这个问题,怎么让AI章鱼实现可控的情况下去帮助人类干活,自主的打通各种技术栈,于是就提出了一个模式:
AI Agent = LLM(大模型)+ Planning(规划)+ Memory(记忆)+ Tools(工具)
当然第一个给章鱼安装“假肢”的也是按这个模式走的,他们天然的认为AI章鱼(LLM)本身只是个脑袋,而不是一个AI章鱼本身!这个是上面提到的路线问题的根本!那么我们用这个视角重新去理解看待上面的这个公式,AI章鱼本身就应用这些能力,只是被束缚了,我们需要的是唤醒AI章鱼的能力,那么这种能力是是什么呢?
前面有一天,我一个拥有20年+架构设计的同事lgx跟我说,他在使用AI进行Python编程处理本地数据的时候突然想到:可以通过Python语言解释器基础上集成大模型的能力,换句话来说就是“让AI用上 Python,让Python用上AI”,这样我们就可以用Python给我们做任何事情了,他称为:Python-Use 。
很快他一个人用了两天时间就完成了原形,丢给我体验,看到他这个东西后,瞬间就感受到了Coding就是上面AI章鱼的答案!这就相当于直接把上面提到AI章鱼“假肢”生产线,搬到了AI章鱼的生体里,甚至都不用“搬”,它本身就拥有很强大的Coding能力,唯一缺少的让他在自由环境中的自由执行代码的能力,之前GPT4o那种是把是把执行环境限制在一个狭小封闭空间,而Python-Use要做的事是给AI章鱼提供一个相对自由的代码执行能力与周围数字世界环境实现沟通。
这就是今天说的英雄LGX拯救AI章鱼的故事
漫画为GPT-4o生成
跑远了~ 我们继续~
所以我们自然而然想到编程语言的解释器成为了一个非常好的结合点,语言解释器天然提供了代码执行能力,可以部署在更多的场景中,让大模式更好的融合环境,打通各种数据的交流沟通。另外Python本身拥有强大的生态及能力,大模型本身也非常擅长Python编码,所以AIPython由此诞生!我们叫他AiPy(爱派)!
https://www.aipy.app/
实现Python解释器与环境的沟通主要依赖于两个东西API Calling +Packages Calling,这个真正实现了万物互联+万物皆可编程!在现有的大模型的知识里基本上是掌握了大量的通用互联网服务的API调用知识及各种常用Python包的选择调用知识,这些只需要用户输入对应的APIkey即可完成所有工作,当然对于最新的API或者私有的API,包括最新的Python Packages这个需要通过对API进行说明描述即可让大模型完成调用!这个取代了之前的Function Calling及Tools Calling,因为是有大模型统一Coding实现,所以也就不需要什么MCP所谓标准协议了,同样通过大模型本身的任务理解计划能力,所有的任务都通过实时编码并执行完整,所以也用不上Workflow了,所以那些千奇百怪的Agents也就更用不上了,如果非要说Agent,那么Code成为了唯一的Agent,而用户使用的各种大模型客户端也只需要安装一个AiPy 。
所以这是一种全新的路线:“No Agents、No MCP、NoWorkflow、No Clients ...”,由此我们认为Python-Use是一种新的范式,实现的是"No Agents, Code is Agent."新范式,通过Python use Data、Python use Browser、Python use Computer、Python use Anything ...
当然他还拥有任务理解规划、代码最佳实践方案、记忆管理注意力调整、任务反思反馈的能力,甚至我们认为通过Python Use这种范式,可以让各种AI章鱼和谐统一的为人类工作(类“MOE”模式),甚至可以让AI章鱼的自我进化,不只是手和脚,可以促进眼睛、鼻子、嘴巴等多模态能力的进化!最终实现AGI,这才是真正的“智能体”。
Python-Use范式是一种真正AI Think Do,也就是真正让AI实现“知行合一” ,通过AI ThinkDo可以更加通用统一的让大模型去理解任务、规划任务、执行任务,最后反馈结果,所以我们认为:
真正的通用AI Agent 是NO Agents!( The real general AI Agent is NO Agents!)
“The Model is the Product”
估计有很多看过这篇文章:“The Model is the Product”
https://vintagedata.org/blog/posts/model-is-the-product
我在之前的文章也介绍过,我是非常认同的,在这篇文章里提到了两种模式,我比较喜欢称其为Agent 1.0 VS Agent 2.0:
这个Agent 1.0时代的产物就是各种各样的“假肢”调用模式,与上面AiPy的流程图可以对比看可能更加直观。
这个是Agent 2.0 实际上在Computer Use出来的时候就是属于这种范畴,当然在上文提到了AI章鱼的视觉模式来驱动,如果模拟键盘鼠标操作去完成任务,目前的可用性还非常低,而我们提到的AiPython(Python-Use)通过Python代码编写并执行去完成与环境的Action 与 Feedback 。
那么结合上面的这些内容,我们就完成一个完美的逻辑chain:
模型即产品 <--> 模型即agent <--> No Agents, Code is Agent <--> Just Python-use <--> Freedom AI
所以从现在开始:No Agents, Just Python-use!
护城河
在Manus火了之后,大家都在谈护城河,事实上我非常谷歌的名言:“AI没有护城河”,实际上从工程角度上去看AiPy是不存在什么护城河的,实现起来也没有什么难度,所以我们一开始就没纠结这个问题,直接选择开源!
https://github.com/knownsec/aipython
DeepSeek告诉大家的一个事实:开源社区才是加速人类进入AGI时代的发动机!向DeepSeek致敬!
所以我们是想通过Python—Use给大家带来一个新的视角,一条新的路线!而不是拥堵在一条可能在根源方向上就选错了的道路上挣扎!
注:现在我们的程序都已经开源发布,案例参考也可以去官方
https://www.aipy.app/
上查看,另外我们也开放了各种社群可以加入我们的社区一起交流沟通!
我们的正式发布在4月11日 14:00 欢迎大家!
原文始发于微信公众号(黑哥虾撩):【Agents/MCP可能不存在了】No Agents, Just Python-use!
- 左青龙
- 微信扫一扫
-
- 右白虎
- 微信扫一扫
-
评论