大模型相关术语及定义 | 收藏

admin

146004
文章

119
评论

2025年6月12日13:51:45评论15 views字数 2757阅读9分11秒阅读模式

探寻合规之道，共筑数据保障之堡。专注为数据安全管理者、技术专家、隐私法务、律师等专业人士打造的知识共享与交流平台。

点击 "合规社" > 点击右上角“···” > 设为星标⭐

□ 责编 | 合规酱

□ 投稿邮箱 | [email protected]

上篇盘点了大模型相关国家标准（大模型相关国家标准有哪些？），本篇整合标准文件中定义的大模型相关术语。

人工智能

人工智能系统相关机制和应用的研究和开发。

人工智能系统

针对人类定义的给定目标，产生诸如内容、预测、推荐或决策等输出的一类工程系统。

生成式人工智能

利用生成式人工智能技术向公众提供生成文本、图片、音频、视频等内容的服务。

大模型/大规模深度学习模型

基于大量数据训练得到，具有复杂计算架构，能处理复杂任务，且具备一定泛化性的深度学习模型。

人工智能系统影响评估

由开发、提供或使用人工智能产品或服务的组织识别、评估和解决对个人和（或）群体和社会的影响的正式的、文件化的过程。

人工智能生成合成内容

利用人工智能技术生成、合成的文本、图片、音频、视频、虚拟场景等信息。

人工智能生成合成内容标识

表明某个内容是人工智能生成合成内容的信息。

显示标识

在人工智能生成合成内容或交互场景界面中添加的，以文字、声音、图形等方式呈现并可被用户明显感知到的标识。

隐式标识

采取技术措施在人工智能生成合成内容文件数据中添加的，不易被用户明显感知到的标识。

文件元数据

按照特定编码格式嵌入到文件中的描述性数据，用于记录文件来源、属性、用途、版权等信息。

文件元数据隐式标识

在人工智能生成合成内容文件元数据中添加的隐式标识。

人工智能生成合成内容服务提供者

利用人工智能技术（包括通过提供可编程接口等方式）向公众提供生成合成文本、图片、音频、视频、虚拟场景等服务的组织或个人。

服务提供者

以交互界面、可编程接口等形式提供生成式人工智能服务的组织或个人。

服务使用者

使用生成式人工智能服务的组织或个人。

网络信息内容传播服务提供者

提供网络信息内容传播服务的网络信息服务提供者。

数据标注

给数据样本指定目标变量和赋值的过程。

标识任务

按照数据标注说明对数据进行标注的活动。

数据标注方

承担数据标注任务的人员或机构。

数据需求方

提出数据标注需求的人员或机构。

标注管理方

管理数据标注任务评估、分发、交付、验收以及质量把控的人员或机构。

标注工具

数据标注方执行数据标注时使用的工具，标注管理方管理数据标注时使用的工具，数据需求方验收数据标注时使用的工具等所有流程相关的工具。

标注任务说明

数据需求方用于向标注管理方以及数据标注方明确标注任务的书面表达。

数据标签

用于标识出数据特征并建立标注数据与人工智能可用数据之间联系的信息。

数据标注工具

能够进行数据标注及在数据标注过程中进行管理、控制等过程中发挥作用软件的统称。

数据标注技术

对数据进行转写、切割、提取、选择、富集标注、点标注、线标注、框标注、区域标注等操作的技术。

数据标注合规率

标注任务中，符合标注规则要求的已标注数据总量与所有已标注数据总量的比值。

机器学习系统

能运行或用于开发机器学习模型、算法和相关应用的软件系统。

机器学习框架

利用预先构建和优化好的组件集合定义模型，实现对机器学习算法封装、数据调用处理和计算资源使用的软件库。

机器学习服务

利用机器学习模型算法及其系统作为工具为组织或个人提供一种其期望的便利的方式的价值的IT 服务。

深度学习

通过训练具有许多隐藏层的神经网络来创建丰富层次表示的方法。

深度学习算法

使用深度神经网络结构进行学习和推理、以完成特定功能的代码片段。

深度学习模型

基于输入数据或信息产生推理或预测结果的数学架构。

大模型服务

开发、应用大模型及大模型系统的服务，以及以此为手段提供支持需求方业务活动的服务。

微调

为提升机器学习模型预测准确性，使用专门领域数据在大模型上继续训练的过程。

提示词/提示语

使用大模型进行微调或下游任务处理时，插入到输入样本中的指令或信息对象。

大模型平台

为开发或使用大模型提供各类资源的软硬件平台。

工具链

用于支撑大模型开发、定制及应用的软件集合。

指令

由大模型输入和输出信号构成的二元组。

生成式人工智能服务

利用生成式人工智能技术向公众提供生成文本、图片、音频、视频等内容的服务。

预训练

使用大规模数据使生成式人工智能模型获得通用知识的训练过程。

优化训练

在预训练基础上，使用特定领域数据使生成式人工智能模型获得面向领域服务能力的训练过程。

预训练数据

用于生成式人工智能预训练的数据。

优化训练数据

所有用于生成式人工智能优化训练的数据。

元数据

定义和描述其他数据的数据。

统一资源定位符

用于标识互联网上资源位置的字符串。

分类模型

对给定输入数据，输出其所属的一个或多个类别的机器学习模型。

训练数据

所有直接作为模型训练输入的数据。

生成式人工智能数据标注

通过人工操作或使用自动化技术机制，基于对提示信息的响应信息内容，将特定信息如标签、类别或属性添加到文本、图片、音频、视频或者其他数据样本的过程。

功能性数据标注

用于训练生成式人工智能模型具备完成特定任务能力的数据标注。

安全性数据标注

用于训练生成式人工智能模型提升输出响应信息安全性的数据标注。

超参数

在模型训练过程之前设置的一种可调节参数。

算法推理

将训练得到的模型应用到新的未标记实例来进行预测的过程。

算法重构

在不改变算法原有功能的基础上，通过调整代码优化算法非功能特性的过程。

数据质量

满足组织在特定情况下数据要求的数据特征。

术语来源

网络安全技术人工智能生成合成内容标识方法 GB45438—2025

人工智能面向机器学习的数据标注规程 GB/T 42755-2023

人工智能机器学习系统技术要求 GB/T43782—2024

人工智能深度学习算法评估 GB/T45225—2025

人工智能大模型第1部分：通用要求 GB/T45288.1—2025

人工智能大模型第3部分：服务能力成熟度评估 GB/T45288.3—2025

网络安全技术生成式人工智能预训练和优化训练数据安全规范 GB/T45652—2025

人工智能管理体系 GB/T 45081—2024

网络安全技术生成式人工智能服务安全基本要求 GB/T45654—2025

人工智能算法金融应用信息披露指南 JR/T 0287—2023

人工智能数据标注总体框架规范 DB 23/T 3857—2024

-END-

「一键加入数据安全及个人信息保护领域的知识宝库」

840+已加入

⬇️⬇️⬇️

「数据安全合规知识星球」是一个专注于数据安全和个人信息保护的资源和知识集散地。星球提供图解PPT、行业解决方案、数据安全合规管理制度模板、评估工具及评估报告模板、监管政策及标准汇编整理等，帮助组织或个人理解并遵守数据安全合规的法律法规，促进操作和业务流程的安全合规。

原文始发于微信公众号（合规社）：大模型相关术语及定义 | 收藏

免责声明:文章中涉及的程序(方法)可能带有攻击性，仅供安全研究与教学之用，读者将其信息做其他用途，由读者承担全部法律及连带责任，本站不承担任何法律及连带责任；如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截，联系方式见首页)，望知悉。

左青龙
微信扫一扫

右白虎
微信扫一扫

大模型相关术语及定义 | 收藏

专题·人工智能安全 | 大模型联网的风险分析与应对举措

从0到1大模型MCP自动化漏洞挖掘实践

网络安全分析人员的生成式AI辅助指南

优秀论文 | 生成式人工智能在侦查讯问中的应用——基础、尝试、风险及对策建议

悟空Agent实战：LLaMA-Factory高危0day漏洞挖掘与修复

图神经网络系列六：GCN优化之GAT与lightGCN

关于AI系统的访问控制，看看权威观点

中山大学｜FORGE：驱动大语言模型自动化构建大规模智能合约漏洞数据集

当ChatGPT接入MCP，你的数据是如何被泄露的？

【AI风险通告】LLaMA-Factory存在远程代码执行漏洞（CVE-2025-53002）

发表评论

在线咨询

微信