01
开篇
GAI推动了智能体的开发与应用,这些智能体凭借卓越的推理与语言处理能力,能够主动自主实现用户目标,搭建了AI与人在物理和数字空间互动的桥梁。
从管理和业务层面,借助智能体和AI的能力发展企业和业务是在数智化浪潮中生存和壮大的必然。然而,由于大多数实践者缺乏系统性的知识指导,面对模型固有的幻觉、推理过程缺少可解释性、责任归属复杂等问题,往往束手无侧,难以正确决策如何运用智能体和AI实现预期的目标。
为此,经过对一部分博客、论文、券商研报等公开文献的梳理、查阅、比较、译制,最终形成了这篇体系相对完整,面向管理、业务、开发人员易于阅读的文章。
为了能够让AI智能体以更像人类、更自主的方式执行任务、做出决策并与其他系统通信,在各种不同的场景下会出现的一些有规律和共性的解决问题的方法和套路,这称为“智能体设计模式”。本文介绍了包含18种智能体设计模式,每个模式均附有背景分析、权衡考量,并建立了模式选择决策模型,为智能体的有效运用提供了整体指导,通过优化目标追寻与规划生成能力来支持基础模型智能体的架构设计。
02
18种已知的设计模式
被动目标生成器模式 / 模式1
智能体通过对话界面分析用户明确表述的目标。
1、背景
用户为了解决特定问题,在向智能体查询以时,需要在提示词中提供相关背景信息并解释目标。
2、问题
用户可能缺乏与智能体交互的专业知识,因此提供的信息可能对目标实现存在模糊性。
3、选用原因
• 欠明确性:用户可能无法提供完整的背景信息或向智能体精确描述目标。
• 效率性:用户期望智能体快速响应。
4、解决方案
智能体提供对话界面,用户可直接说明背景和问题,这些信息会被传递至被动目标生成器以确定目标。同时,该生成器还能从记忆中检索相关信息,包括当前处理的工件库、近期任务中使用的工具、对话历史、正反示例等,并将其附加到用户提示词中以辅助目标推导。生成的目标会发送至其他组件进行任务分解与执行。此时,智能体仅接收用户直接提供的背景信息,因此,只在被动接收用户输入后才生成策略以优化和澄清用户目标。需注意的是,在多智能体系统中,一个智能体可通过调用另一智能体的API发送提示词来分配具体任务,而被调用的智能体会分析接收到的信息并确定目标。
5、权衡
6、典型应用
• HuggingGPT:通过聊天机器人响应用户请求,并将包含复杂意图的请求解析为目标。
7、与其他模式的关系
• 主动目标生成器:作为被动目标生成器的替代方案,支持多模态上下文输入。
• 提示词/响应优化器:被动目标生成器可先处理用户输入,再将目标及相关上下文传递给优化器以细化提示词。
主动目标生成器模式 / 模式2
通过理解人类交互并借助相关工具捕捉上下文,从而主动预测用户目标。
1、背景
用户需要在提示词中说明希望智能体达成的目标。
2、问题
仅通过对话界面收集的背景信息可能有限,导致对用户目标的响应不准确。
3、选用原因
• 欠明确性:
1)用户可能无法提供完整的上下文信息或向智能体精确描述目标。
2)智能体仅能从记忆中检索有限的信息。
• 可访问性:某些残障用户可能无法通过被动目标生成器直接与智能体交互。
4、解决方案
除了从对话界面接收提示词和从记忆中检索相关上下文外,主动目标生成器还能向探测器发送请求来预测用户目标。探测器会捕捉并返回用户的多模态环境信息(如通过摄像头识别手势、通过截图识别应用UI布局等),供进一步分析和理解以生成目标。需注意,主动目标生成器应以较低误报率通知用户上下文捕捉等相关问题,避免不必要的干扰。此外,捕捉的环境信息可存储在智能体的记忆(或知识库)中,从而构建“世界模型”,持续提升其对现实世界的理解能力。
值得指出的是,主动目标生成器模式是数智化浪潮中最重要的核心之一,能够建立物理世界和数字世界之间的连接,实现了机器触达用户的最后一公里,在商业层面实现从“注意力经济”(B2C/B2B)到“意愿经济”(C2B/C2B2B)的转变。
常见上下文终端包括:
类别 |
例子 |
智能穿戴 |
手表、VR/AR头显、智能追踪终端、定位器、工牌、头盔、耳机 |
智能组网 |
LAN组网终端(WiFi路由器、IoT组网终端)、电力线组网终端、POE供电组网终端 |
通信连接 |
MiFi数据卡、CPE综合网关、安全网关、分布式网关、SDN云网关 |
泛屏终端 |
视屏盒子、视屏投影、视屏电视、视屏平板 |
新形态机顶盒 |
8K机顶盒、无线网络机顶盒、带屏机顶盒、家庭娱乐主机 |
智能遥控器/音箱 |
智能语音遥控器、音箱 |
教育终端 |
电子书阅读器、小屏学习机、翻译机、学习笔、投屏器、故事机、陪伴机、电子学生证、电子词典、大屏学习机、打印机等 |
智能机器人 |
宠伴、陪护、教育、公共服务类、扫地、智能摄像头 |
智能安防 |
摄像头、可视门铃/猫眼、网盘录像机、安全监测终端、视频网关、智能喇叭终端、随身相机 |
环境感知监测 |
人体红外传感器、人体监测雷达、体征检测雷达、跌倒检测雷达、跌倒告警器、紧急按钮、温湿度传感器、水质传感器、门窗磁传感器、烟雾探测报警器、可燃气体探测报警器、一氧化碳探测报警器、水浸传感器、声光报警器、火灾探测、PM2.5检测仪、环境监测仪、安全用电产品 |
智能家居 |
智能可视门锁、插座/插排、净水器、空气净化器、空调控制器、窗帘电机、门锁控制器、红外转发器、开关、照明/台灯、家庭网关、空调/新风、冰箱、洗衣机、热水器、电饭煲、灭蚊机/灯、智能马桶盖、电子价签、风扇、种植机、晾衣架、热水壶、镜子、超级面板、电暖器、空气炸锅/烤箱、微波炉、电磁炉、多功能机、消毒机、电动牙刷、水/电/燃气表、空气开关、调光控制器、地暖、宠物喂食器、猫砂盆、宠物饮水机、除湿/加湿器、燃气罩、面包机、冲奶机、足浴器、冲牙器、K歌麦克风、电吹风、相框 |
智慧社区 |
门禁、充电桩、车/人闸、电子哨兵、广告机、楼宇对讲终端、多媒体终端、读写卡终端、边缘盒子 |
智慧康养/运动 |
检测/监测/看护/记录仪器(血氧/血压/血糖/体脂/尿酸/胆固醇/睡眠/心电/体温)、智能胸卡、智能健康终端、手表/手环、跳绳、筋膜枪、动感单车、健身镜、哑铃、按摩仪、药盒、肢体辅助训练设备、护理仪、助老一键通设备、跑步机 |
办公终端 |
考勤机、5G PC、工作平板电脑、办公会议一体机、办公智慧屏、多媒体话机、直播一体机、无人机、打印机 |
沿街商铺 |
展屏一体机、称重一体机、便携POS设备、播报设备、数显设备、云打印机设备 |
智能车联网 |
ETC、行车记录仪、后视镜、智慧屏、车载互联盒 |
云终端/算力终端 |
云手机、云电脑(口袋电脑/便携主机/显示一体机/旺铺一体机/平板/笔记本/云网吧终端)、云XR(头显)、云高清终端(电视棒/学生证/泛屏类高清终端)、云游戏终端(电视/盒子/周边硬件)、云盘终端(词典笔/相机)、云路由、算力主机(存储型/媒体型/连接型)、算力协同类终端、裸眼3D平板电脑(含眼球追踪技术) |
5、权衡
6、典型应用
• GestureGP:可解析用户的手势描述,从而理解其意图。
• ProAgent:可观察其他智能体队友的行为,推断其意图并相应调整规划。
7、与其他模式的关系
• 被动目标生成器:主动目标生成器可作为其替代方案,支持多模态上下文注入。
• 提示词/响应优化器:主动目标生成器可先处理用户输入,再将目标及相关上下文传递给优化器以优化提示词。
• 多模态防护栏:可帮助处理主动目标生成器捕捉的多模态数据。
提示词/响应优化器模式 / 模式3
根据预期的输入/输出内容与格式,对提示词和响应进行优化调整。
1、背景
用户可能难以编写有效的提示词,尤其是在需要注入全面上下文的情况下。同样,可能某些场景下,用户也难以理解智能体的输出内容。
2、问题
如何生成符合用户目标或意图的有效提示词和标准化响应?
3、选用原因
• 标准化:提示词和响应的结构、格式及内容可能存在差异,导致智能体行为混乱或不一致。
• 目标对齐:确保提示词和响应与最终目标一致,有助于智能体达成预期结果。
• 互操作性:生成的提示词和响应可能需直接输入至其他组件、外部工具或智能体以执行后续任务。
4、解决方案
用户可能向智能体输入初始提示词,但这些提示词可能因缺乏相关上下文、无意注入攻击、冗余等问题而低效。为此,提示词/响应优化器可基于预定义的约束和规范构建优化后的提示词与响应,确保其内容与格式符合最终目标。优化器通常采用提示词/响应模板作为生成具体实例的工厂,通过结构化方法实现查询与响应的标准化,提升响应准确性并增强与外部工具或智能体的互操作性。例如,一个提示词模板可包含智能体指令、少量示例(小样本学习)以及待解决的问题/目标。
5、权衡
6、典型应用
• LangChain:提供提示词模板,支持开发者构建基于基础模型的定制化智能体。
• Amazon Bedrock:用户可配置提示词模板,定义智能体评估和使用提示词的规则。
• Dialogflow:允许用户创建生成器,在运行时指定智能体行为与响应方式。
7、与其他模式的关系
• 被动/主动目标生成器:可先处理用户输入,再将目标及相关上下文传递至提示词/响应优化器进行细化。
• 自反思/交叉反思/人工反思:通过反思模式评估并优化提示词/响应优化器的输出。
• 智能体适配器:优化器专注于改进用户输入,而适配器更侧重外部工具的利用。
检索增强生成(RAG)模式 / 模式4
通过外部知识检索增强智能体的知识更新能力,同时保障本地化基础模型系统的数据隐私。
1、背景
除非经过领域数据微调或预训练,基于大模型的智能体通常缺乏特定领域的专业知识,特别是涉及高度机密和隐私敏感的本地数据时。
2、问题
当任务所需知识超出基础模型训练范围时,智能体如何进行有效推理?
3、选用原因
• 知识缺失:执行领域特定任务时,因缺乏相关知识储备可能导致推理不可靠
• 资源开销:使用本地数据微调大模型或本地训练大模型需要高昂的计算资源成本
• 数据隐私:本地敏感数据不能直接用于模型训练或微调
4、解决方案
RAG是一种通过从其他来源(内部或在线数据)检索事实来增强智能体准确性和可靠性的技术。智能体记忆中的知识缺口通过向量数据库中生成的参数化知识来填补。例如,在生成计划后,特定任务可能需要原始智能体记忆之外的信息。智能体因此可以从参数化知识中检索信息并用于完成任务,同时优化后的增强响应将返回给用户。具体而言,RAG的实现包含以下步骤:i)确定数据源;ii)定义将原始数据(如文本、图像、视频和音频)索引为嵌入向量或知识图谱的数据结构;iii)给定特定查询时,任务执行器对该查询进行编码并搜索知识库(如向量存储)以检索最相关信息;iv)任务执行器通过重排序和过滤处理获得的数据,生成更全面准确的响应。
该检索过程无需对智能体服务的模型进行预训练或微调,既保护了本地数据隐私,又降低了训练和计算成本,同时还能提供所需的最新且更精确的信息。检索到的本地数据可以通过提示发送回智能体(需考虑上下文窗口大小),而智能体能够通过上下文学习处理信息并生成计划。目前存在一系列专注于不同增强方面、数据源和应用的RAG技术,例如联邦RAG、图RAG等。此外,检索交错生成(Retrieval Interleaved Generation)可视为RAG的相关技术,它允许智能体在响应生成阶段动态访问外部知识。
5、权衡
6、典型应用
• LinkedIn采用RAG构建智能体管道,通过检索案例研究回答用户
• Researcher开发的检索评估器可输出置信度分数,提升RAG鲁棒性
7、与其他模式的关系
RAG可为其他所有模式提供本地数据源的补充上下文信息。
单次模型查询模式 / 模式5
通过单次调用模型实例生成完整计划的所有步骤。
1、背景
当用户为实现特定目标与智能体交互时,智能体需依赖内置模型生成执行计划。
2、问题
如何高效生成多步骤行动计划?
3、选用原因
• 时效性:紧急任务要求智能体快速完成规划并响应
• 成本控制:商业模型的每次调用均产生费用
4、解决方案
单次模型查询场景下用户与智能体之间的交互中,智能体查询内置模型,基于用户指定的目标和约束生成相应计划。针对用户需求(如有限预算),基础模型仅被查询一次以理解所提供的输入。通过这种方式,智能体能够制定实现宏观目标的多步骤计划,并为该计划提供整体性解释,而无需深入详细的推理步骤。
5、权衡
6、典型应用
• 基础模型的默认调用配置
7、与其他模式的关系
• 增量式模型查询:通过迭代调用实现更精细规划(替代方案)
• 单路径计划生成器:直接生成线性执行方案
• 多模态防护栏:作为输入输出管理中间层保障查询可靠性
增量式模型查询模式 / 模式6
在生成每一步计划的过程中,动态调用基础模型,实现渐进式推理优化。
1、背景
当用户与智能体交互以达成特定目标时,需依赖模型进行多阶段计划生成。
2、问题
模型首次响应可能不准确,如何确保推理过程的精确性?
3、选用原因
• 上下文窗口限制:模型上下文容量有限,难以一次性接收完整提示词
• 过度简化风险:单次查询易导致关键细节遗漏,增加不确定性
• 可解释性需求:需保留详细推理过程以建立可信度
4、解决方案
智能体可通过多次查询基础模型,采用逐步推理的方式制定目标达成方案。同时,用户可在任意阶段对推理过程及生成方案提供反馈,模型查询过程中将相应进行调整。查询次数既可通过智能体配置预设,也可由用户提示指定。需注意,增量式模型查询可依赖可复用模板实现,该模板通过上下文注入或显式工作流/方案存储管理系统来引导整个过程。此模式同样适用于其他组件查询集成基础模型的情况。
5、权衡
6、典型应用
• HuggingGPT:通过多次查询分解用户请求,建立细粒度任务依赖关系
• EcoAssistant:代码执行器与模型迭代交互实现代码优化
• ReWOO:分阶段生成关联计划并整合工具观测证据
7、与其他模式的关系
• 单次模型查询:本模式为其迭代式替代方案
• 多路径计划生成器:结合逐步查询捕获用户偏好,生成分支方案
• 自反思机制:依赖多次模型查询实现响应审查
• 人工反思机制:通过增量查询建立人机迭代沟通渠道
• 多模态防护栏:作为查询输入输出的管理中间层
单路径规划生成器模式 / 模式7
通过生成线性执行步骤序列,系统化实现用户目标的中间过程。
1、背景
智能体对用户呈现"黑箱"特性时,用户往往关注目标达成的具体过程。
2、问题
如何高效构建目标导向的确定性策略?
3、选用原因
• 抽象性挑战:用户任务描述的高层抽象易导致处理歧义
• 一致性需求:需为协同工具/智能体提供连贯的执行指引
• 效率平衡:决策不确定性可能降低用户满意度
4、解决方案
单路径规划生成器在接收并解析用户目标后,能够协调创建面向其他智能体或工具的执行方案,并对任务进行优先级排序,从而逐步达成目标。具体而言,规划生成过程需要推理判断各中间步骤是否具备可执行性及最优性。该流程中的每个步骤仅设计单一后续步骤,由此形成线性直接的计划链条(思维链CoT)。系统采用自洽校验机制,通过多次确认模型输出并选择一致性最高的结果作为最终决策。需要说明的是,生成方案的粒度可根据目标复杂度动态调整,复杂计划可能包含多工作流、处理进程、任务单元及精细化操作步骤。
5、权衡
6、典型应用
• LlamaIndex:通过CoT优化ReAct智能体的单路径规划性能
• ThinkGPT:提供标准化实现工具包
7、与其他模式的关系
• 单次模型查询:快速生成线性方案的基础支撑
• 多路径规划生成器:作为个性化策略的替代方案
• 自反思机制:与思维链共同保障决策自洽性
多路径规划生成器模式 / 模式8
通过在目标达成过程的每个中间步骤创建多重选择,支持个性化决策路径的生成。
1、背景
当智能体对用户呈现"黑箱"特性时,用户往往期望理解目标达成的具体过程。
2、问题
面对复杂任务时,如何生成兼顾包容性、多样性且高质量的一致性解决方案?
3、选用原因
• 抽象性障碍:高层抽象的任务描述易产生处理歧义
• 一致性要求:需为协同方提供连贯的执行指引
• 偏好适配:需捕捉用户偏好以提供定制化方案
• 简化风险:复杂任务的过度简化可能导致方案失效
4、解决方案
多路径规划生成模式在单路径规划生成器基础上,能够在目标达成过程的每个步骤创建多个可选分支,这要求底层基础模型能够为前序步骤的每个选项推导出符合条件的可执行操作。具体而言,用户偏好会影响后续中间步骤的生成,从而形成不同的最终方案。相关智能体与工具的调用配置也将相应调整。思维树(Tree-of-Thoughts)是该模式的典型实现。
5、权衡
6、典型应用
• AutoGPT:集成思维树实现多路径决策
• Gemini:逐步生成可选方案供用户决策
• OpenAI:基于GPT-4实现思维树规划器
7、与其他模式的关系
• 增量式模型查询:通过迭代查询捕获用户偏好
• 单路径规划生成器:作为本模式的基线方案
• 人工反馈机制:协助确定各步骤最终选择
自我反思模式 / 模式9
使智能体能够对规划及推理过程进行自我评估,并生成优化建议。
1、背景
智能体根据用户目标生成任务分解方案时,基础模型的幻觉风险可能影响方案质量。
2、问题
如何高效审查规划合理性并整合反馈?
3、选用原因
• 推理不确定性:内在逻辑矛盾可能降低任务成功率
• 可解释性缺失:决策过程不透明会损害可信度
• 时效性约束:特定场景要求限期完成规划
4、解决方案
具体而言,反思是一种形式化的优化过程,旨在迭代式地审查和优化智能体的推理过程及生成内容。用户向智能体输入具体目标后,智能体首先生成实现该需求的执行方案。随后,用户可指令智能体对该方案及对应推理过程进行反思。智能体会回溯推理链条,验证是否存在导致后续步骤偏差的错误中间结果,进而调整校准推理过程以生成优化方案。此类反思过程及结果可存入智能体记忆库以实现持续学习,最终确定的方案将逐步执行。自洽性是该模式的典型实现。
5、权衡
6、典型应用
• Reflexion框架:基于任务状态的多维度反思
7、与其他模式的关系
• 提示词/响应优化器:为其输出提供评估依据
• 增量式模型查询:支撑多轮反思评估
• 单路径规划生成器:共同保障思维链自洽性
交叉反思模式 / 模式10
通过不同智能体或基础模型间的相互评估,优化目标方案及推理流程。
1、背景
当单一智能体反思能力有限时,需评估其输出质量及推理有效性。
2、问题
如何突破单智能体能力边界,实现高质量方案评审?
3、选用原因
• 推理缺陷:内部逻辑错误将降低输出可信度
• 解释瓶颈:单一视角限制决策透明度
• 能力天花板:复杂反思任务超出个体智能体负荷
4、解决方案
当智能体无法通过自我反思生成准确结果或精确规划步骤时,用户可要求其查询专精于反思的其他智能体。该反思型智能体将评审原始智能体的记录输出及相关推理步骤,并提供优化建议。此过程可迭代进行,直至反思型智能体确认方案可行。此外,可同时查询多个智能体进行反思,以生成更全面的响应建议。
5、权衡
6、典型应用
• XAgent系统:工具智能体向规划智能体实时反馈任务状态
• Talebirad跨智能体研究:通过相互批评实现策略调优
7、与其他模式的关系
• 提示词/响应优化器:接受交叉反思的质量反馈
• 协作范式:支持投票制/角色制/辩论制评估架构
• 工具注册中心:通过服务发现机制匹配反思智能体
人工反馈模式 / 模式11
通过收集人类反馈优化决策方案,确保与用户偏好精准对齐。
1、背景
智能体将用户目标分解为可执行任务时,需保障最终方案符合人类预期。
2、问题
如何将人类偏好完整准确地融入推理过程?
3、选用原因
• 偏好对齐:必须精准理解用户个性化需求
• 可争议性:需建立异常输出的快速修正机制
4、解决方案
当用户输入目标及特定约束条件时,智能体首先生成包含一系列中间步骤的执行方案。该构建的方案及其推理过程日志可提交给用户审核,或发送给其他人类专家验证可行性和实用性。用户或专家可提供修改建议,指明需要更新或替换的步骤。该方案将经过迭代评估和改进,直至获得用户/专家最终批准。
5、权衡
6、典型应用
• Inner Monologue系统:机器人通过人类反馈优化物体识别
7、与其他模式的关系
• 提示/响应优化器:人工反馈可提供人类偏好与建议,用于优化生成的提示和响应
• 多路径规划生成器:该生成器创建多方向方案,人工反馈结合用户意见可协助确定各中间步骤的最终选择
• 增量式模型查询:通过该模式实现用户/专家与智能体间的迭代式交互,从而支持人工反馈机制
投票制协作模式 / 模式12
过多智能体投票机制达成共识决策。
1、背景
复合AI系统中多个智能体需协同完成任务但存在观点分歧。
2、问题
如何公平确定最终决策?
3、选用原因
• 多样性:不同智能体存在方法论差异
• 公平性:需保障各智能体决策权平等
• 可追溯性:必须记录完整决策过程
4、解决方案
智能体通过投票机制协同完成决策。具体流程为:(1)主智能体首先生成候选响应;(2)发起投票并将不同反思建议作为选项;(3)邀请其他智能体基于各自能力经验投票选择最优反馈。在此过程中,各智能体采用中心化通信模式,由原始智能体担任协调者。投票结果经标准化处理后返回主智能体,由其优化响应内容后最终答复用户。需注意:投票过程可通过多种方式实现(如协调者智能体直接通信、基于区块链的智能合约等),且所有参与智能体的身份管理对确保投票可追溯性至关重要。
5、权衡
6、典型应用
• Hamilton模拟法庭:九智能体投票裁决案件
• ChatEval系统:多数决与平均分双模式
7、与其他模式的关系
• 交叉反思:智能体可通过查询多个反思型智能体获取反馈,该反馈可通过反思型智能体间的投票制协作确定
• 角色制与辩论制协作:投票制协作可作为其他协作模式的替代方案(通过智能体间投票实现),同时这些模式可组合应用以相互补充
• 工具/智能体注册中心:参与投票流程的智能体可通过工具/智能体注册中心调用
角色制协作模式 / 模式13
通过角色划分与职责分配实现多智能体的专业化协同。
1、背景
复合AI系统中,具备不同专业能力的智能体需共同完成复杂任务。
2、问题
如何基于智能体专长实现高效分工协作?
3、选用原因
• 能力多样性:各智能体存在方法论与知识体系差异
• 分工必要性:需根据训练数据与功能定位分配职责
• 容错需求:单个智能体故障不应影响系统整体运行
4、解决方案
角色制协作模式的高层架构,采用层级化协作机制。具体实现包含:
1)角色分配体系
通过角色定义建立工作流(包含:身份设定、任务定义、工具调用、流程编排)。
示例角色配置:
角色 |
作用 |
规划者(Planner) |
将用户目标分解为任务链 |
分配者(Assigner) |
协调任务委派(可自主执行或基于领域专长分配给执行者Worker) |
创建者(Creator) |
在角色空缺时生成新智能体(需提供资源、目标及引导) |
2)动态扩展机制
• 支持定义更精细化的角色分工
• 确保任务与职责的无缝转移
5、权衡
6、典型应用
• XAgent系统:规划/调度/工具三类角色协同
• MetaGPT框架:模拟软件团队标准流程(架构师/项目经理/工程师)
• MedAgents医疗系统:专科医生角色协作诊疗
7、与其他模式的关系
• 交叉反思:反思型智能体可建立角色化协作
• 投票制/辩论制协作:可作为本模式的替代或补充方案
• 工具注册中心:实现角色化智能体的服务发现
辩论制协作模式 / 模式14
通过多智能体间的辩论式交互,在观点交锋中迭代优化决策方案并达成共识。
1、背景
复合AI系统中,具备多元视角的智能体需协同完成复杂推理任务。
2、问题
如何激发集体智慧生成优化方案,同时促进智能体能力进化?
3、选用原因
• 观点多样性:不同智能体可提供互补性见解
• 适应力瓶颈:面对新任务时创造性不足
• 过程黑箱:需保障协作过程的可审计性
4、解决方案
辩论制协作模式的具体工作流程如下:
1)辩论初始化阶段
• 用户向主智能体提交查询
• 主智能体将问题分发给其他协作智能体
• 各智能体生成初始响应
2)去中心化辩论阶段
• 智能体间相互传播初始响应进行验证
• 提供改进指令和潜在方向
• 支持共享记忆库或互访记忆数据
3)终止条件判定
• 达到预设辩论轮次上限
• 或获得共识性答案
5、权衡
6、典型应用
• crewAI平台:提供多智能体话题讨论框架
7、与其他模式的关系
• 交叉反思:辩论可作为确定反思反馈的手段
• 投票制/角色制协作:可组合使用的替代方案
• 工具注册中心:实现辩论参与者的动态发现
多模态防护栏模式 / 模式15
通过输入输出双向管控,确保基础模型行为符合用户需求、伦理规范与法律要求。
1、背景
智能体调用基础模型实现目标时,需防范恶意输入与有害输出。
2、问题
如何避免基础模型受对抗性输入影响或生成不良输出?
3、选用原因
• 鲁棒性需求:对抗信息可能污染模型记忆与推理链
• 安全性风险:幻觉现象导致冒犯性内容或系统故障
• 标准符合性:需满足行业与组织的特定合规要求
4、解决方案
多模态防护栏技术作为中间层部署于基础模型与复合AI系统的其他组件之间,其核心工作机制包含:
5、权衡
6、典型应用
• NeMo防护栏:保障对话系统安全性(NVIDIA)
• Llama防护模型:基于安全风险分类的审查系统(Meta)
• Guardrails AI平台:提供多场景验证器集
7、与其他模式的关系
• 主动目标生成器:处理其捕获的多模态数据
• 单次/增量式模型查询:作为查询过程的安全中间层
工具/智能体注册中心模式 / 模式16
建立统一的服务目录,实现多样化工具与智能体的高效发现与调用。
1、背景
智能体执行任务时需协同外部工具或其他智能体以扩展能力边界。
2、问题
如何从海量资源中快速匹配最优工具与智能体?
3、选用原因
• 可发现性:资源多样性增加检索难度
• 时效压力:需在规定时间内完成资源遴选
• 适配要求:特定任务对工具有专项能力要求
4、解决方案
智能体通过工具/智能体注册中心检索外部资源的过程:用户向智能体提交目标后,智能体将其分解为细粒度任务。随后可查询工具/智能体注册中心——该中心作为主要入口,依据领域特定能力、价格、上下文窗口等一系列指标对各类工具和智能体进行收集分类。基于返回的信息,智能体可将任务分配给相应的工具和智能体。需注意,注册中心可通过不同方式实现(例如配备特定知识库的协调者智能体、基于区块链的智能合约等),并可扩展为工具/智能体服务交易市场。
5、权衡
6、典型应用
• GPT应用商店:ChatGPT智能体检索平台
• TPTU工具集:扩展AI智能体能力库
• VOYAGER系统:渐进式构建可复用技能库
• OpenAgents项目:专业化插件API管理
7、与其他模式的关系
• 交叉反思:通过注册中心发现反思型智能体
• 协作范式:为投票制/角色制/辩论制提供参与者源
• 智能体适配器:将注册工具转换为可调用接口
智能体适配器模式 / 模式17
通过标准化接口转换,实现智能体与异构工具间的无缝协作。
1、背景
智能体需调用外部工具扩展能力时,面临接口不兼容问题。
2、问题
如何解决智能体与多样化工具间的接口适配挑战?
3、选用原因
• 互操作性:需处理工具间差异化的交互协议
• 动态适配:根据任务复杂度灵活切换工具
• 开发成本:手动开发适配接口效率低下
4、解决方案
在接收用户指令后,智能体生成包含多个任务的目标实现方案。由于不同工具具有异构接口(存在抽象层级差异或特定格式要求等),智能体适配器通过以下机制实现桥接:
典型应用场景包括:
• 本地文件系统交互:任务转译为系统消息
• 视频游戏操作:捕获并操控图形用户界面
注:细粒度接口描述可提升智能体理解能力、优化整体性能。
5、权衡
6、典型应用
• AutoGen框架:支持工具注册与语义描述
• 苹果智能系统:跨应用实体识别与功能调用
• Semantic Kernel:插件语义化描述与技能编排
• SWE智能体:代码命令接口转换
7、与其他模式的关系
• 提示词/响应优化器:专注输入输出优化,本模式侧重工具调用
• 工具注册中心:提供工具资源目录,本模式实现具体调用
智能体评估器模式 / 模式18
通过多维度测试体系,确保智能体行为符合设计预期与场景需求。
1、背景
智能体基于基础模型与多组件协同推理生成响应时,需建立性能验证机制。
2、问题
如何系统化评估智能体运行表现?
3、选用原因
• 功能完备性:需验证服务完整性、正确性与适用性
• 场景适配度:理解实际应用表现以指导优化
4、解决方案
开发者在设计时和运行时可部署智能体评估器对智能体的响应及推理过程进行评估。具体实施时,开发者需构建评估管道,包括定义基于特定场景的需求指标、评估标准以及智能体的预期输出。在给定具体上下文时,评估器会准备上下文相关的测试用例(从外部资源检索或自主生成),并分别对智能体组件执行评估。评估结果将提供边界案例、临界失误等有价值的反馈,开发者可据此进一步调优智能体、采取风险缓解措施,并基于评估结果升级评估器本身。
5、权衡
6、典型应用
• Inspect框架(英国AI安全研究所):内置提示词工程等评估模块
• DeepEval平台:集成14种指标,支持主流开发框架
• Promptfoo工具:提供缓存加速与自动化评分
• Ragas系统:专注RAG流程的测试集生成与LLM辅助评估
7、与其他模式的关系
可配置用于其他模式组件的设计时/运行时的表现评估。
03
模式总览与决策模型
1、总览
如上图所示,18种设计模式覆盖了完整的智能体闭环生态,使整个生态中的各种场景有机整合在一起,这些场景包括:
1)环境感知场景
当需捕获用户环境信息作为补充上下文时:
√ 主动目标生成器:通过传感器数据分析用户目标(特别适用于残障服务场景)
√ 被动目标生成器:提供简易高效的对话接口
√ 提示/响应优化器:标准化用户指令以增强目标对齐
√ 检索增强生成:从外部知识库获取补充信息
2)模型查询策略
√ 增量式查询:基于用户需求/系统配置多次查询(提升推理确定性)
√ 单次查询:因预算限制仅查询一次
3)方案生成选择
√ 单路径生成器:高效线性方案
√ 多路径生成器:多选项复杂方案(确保包容性及人类偏好对齐)
4)方案评估机制
√ 自我反思/交叉反思/人工反思:验证方案正确性与可行性
√ 多智能体协作:投票制/角色制/辩论制交互
5)安全与集成
√ 多模态防护栏:通过规则/AI双模式检测输入输出
√ 工具/智能体注册中心:提升资源发现效率
√ 智能体适配器:保障外部服务调用互操作性
√ 智能体评估器:发布前验证功能适用性
决策模型
为了大家能更方便选用不同的模式,根据这些场景内的决策要素将这些场景划分为可替代模式和互补模式,并用绿色标注模式的优点、橙色标注为权衡点,就形成了下图的决策模型。
04
总结
深入理解智能体设计模式,能够让管理层和业务人员正确认识在当前环境下AI能够做什么、不能做什么,制定正确的规划和决策,从而构建出有效的智能应用程序。
【参考文献】
[1] Yue Liu, Sin Kit Lo, Qinghua Lu, Liming Zhu, Dehai Zhao, Xiwei Xu, Stefan Harrer, Jon Whittle, “Agent design pattern catalogue: A collection of architectural patterns for foundation model based agents,” arXiv:2405.10467v4, Nov. 2024.
[2] 国信证券, 《计算机行业 2025 年04 月投资策略——Agent 时代到来,Know How 智能实现落地》
[3] “Agent Design Patterns (Part 1- 5)
[4] Manas Mallik, “Unlocking AI Autonomy: The 11 Must-Know Design Patterns in Agentic AI”
[5] Kerem Aydın, “AI Agents Design Patterns Explained”
[6] “AI Agentic Design Principles”
[7] “AI Agents Uncovered: Must-Know Summary, Design Patterns, and Real-World Use Cases.”
[8] 4 must know design patterns for ai agent activity
[9] 中国移动,《中国移动泛终端产品白皮书(2025年版)》
[10] 中国移动,《中国移动云终端·算力终端产品白皮书(2025年版)》
[11] 中国电信,中国电信终端产品库
[12] 中国电信,中国电信翼矩AITMark泛智能终端评测体系
[13] 中国联通,《中国联通:互联网2030白皮书》
[14] 中国联通,《中国联通:2024可持续发展报告》
[15] 中国信通院,《新一代智能终端蓝皮书》
EBCloud
文章作者|李淳
原文始发于微信公众号(EBCloud):智能体设计模式
- 左青龙
- 微信扫一扫
-
- 右白虎
- 微信扫一扫
-
评论