深度好文｜LLM在工业控制中的应用空气调节系统

admin

144029
文章

118
评论

2023年8月12日11:17:11评论113 views字数 1131阅读3分46秒阅读模式

cckuailong

读完需要

分钟

速读仅需 1 分钟

前言

最近，微软亚洲研究院提出可以将 LLM 用于工业控制，而且仅需少量示例样本就能达成优于传统强化学习方法的效果。该研究尝试使用 GPT-4 来控制空气调节系统（HVAC），达到了很好的效果。

这篇论文的精华就在于提供了一种 LLM 工程化落地的新颖方案，笔者在读这个论文的时候，受到了很大的启发。

系统模块

先来看整个系统的设计

深度好文｜LLM在工业控制中的应用空气调节系统

其中状态（state）是核心，所有流程都是围绕状态流转，HVAC 中的状态其实就是一个元组，其中的数字表示每个房间的温度，外面的温度，地面温度等信息。

看不懂没关系，先讲下各模块的作用

LLM：不解释了，核心决策大脑

环境：一个交互式环境或模拟器，可以执行 LLM 建议的动作并提供反馈。其中值得注意的是作者设计了一个奖励函数，用来计算 LLM 决策结果的优劣

在线缓冲器：存储当前的状态及其决策和得到的结果

翻译器：上面讲的状态是一组数字，LLM 肯定不理解这些数字是什么意思，所以需要把这些数字“翻译”成 LLM 能理解的自然语言。例如 state: (19,24,26,23,10)可以翻译成：四个房间的温度分别为 19 度，24 度，26 度，23 度，室外温度为 10 度。（举个例子而已，真正的 state 比这个复杂多了）

向量化模型：将翻译器的结果转成机器能理解的 Token 序列

专家示例数据库：专家编写的一些专业示例

KNN 模型：选取专家示例库中最相似的状态

聚类模型（K-means）：聚类专家示例库，作为 prompt 中的参考示例（多说一句，最理想的方式肯定是把所有的专家示例都给 LLM 作为参考，但是不现实，所以用这种方案来进行优化）

prompt 生成器：将各部分得到的内容塞到 prompt 模版中，如下图

深度好文｜LLM在工业控制中的应用空气调节系统

prompt 设计

Agent 的能力与 Prompt 的好坏是强相关的，让我们来看看 prompt 的设计。

总共分 5 大块：

当前状态：告诉 LLM 当前的状态，建筑类型，外部天气信息，所在城市等

系统信息：给 LLM 定义一个角色，告诉他我需要让他完成的任务

指令模块：通过指令翻译器，给 LLM 用自然语言传递指令

示例模块：给出 N 个示例，包括在线缓冲器中存储的前 1/N 个状态及其附加信息，聚类模型聚类后各中心点的示例信息，KNN 模型选择出最适合当前 state 的示例

对当前状态的描述

最后

prompt 输出给 LLM，让 LLM 做出下一步的决策（action），然后将决策结果输入到奖励函数中，判断决策的正确程度。循环往复，这就是空气调节系统的整体设计，还是非常巧妙的。

论文

http://export.arxiv.org/pdf/2308.03028

原文始发于微信公众号（我不是Hacker）：深度好文｜LLM在工业控制中的应用--空气调节系统

免责声明:文章中涉及的程序(方法)可能带有攻击性，仅供安全研究与教学之用，读者将其信息做其他用途，由读者承担全部法律及连带责任，本站不承担任何法律及连带责任；如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截，联系方式见首页)，望知悉。

左青龙
微信扫一扫

右白虎
微信扫一扫

深度好文｜LLM在工业控制中的应用空气调节系统

一天搞懂CANXL学习笔记

AUTOSAR架构下ECU休眠后连续发送NM报文3S后ECU网络才被唤醒问题分析

里程停止器拆解分析

重型车辆网络安全研究注意事项

汽车以太网物理层调试实用技巧

黑客的钥匙：无线门禁攻防实战

面向软件定义车辆的E/E架构技术&市场分析报告2025

空天星地融合网络仿真平台实现笔记

基于容器和VLAN的低轨卫星网络仿真系统的设计与实现

发表评论

在线咨询

微信