探寻合规之道,共筑数据保障之堡。专注为数据安全管理者、技术专家、隐私法务、律师等专业人士打造的知识共享与交流平台。
点击 "合规社" > 点击右上角“···” > 设为星标⭐
■作者:木言
■编辑:郑烨
▽
2024年末,全球各国,如美国、英国、法国、德国、意大利、日本、韩国等十余个国家以安全、技术等缘由,采取紧急措施,包括禁止下载使用DeepSeek模型,限制员工访问DeepSeek的应用程序工具等,对DeepSeek进行围堵。典型如从美国国会、五角大楼、NASA到海军,都考虑或已开始禁止使用DeepSeek,德克萨斯州则成为美国第一个禁止在政府设备上使用DeepSeek的州。近日,美国国会更是提出新法案规定下载DeepSeek将构成犯罪,最高可判处20年监禁。
01
物理世界的三个主体
02
大模型作为第四类主体:双重角色的潜在威胁
随着大模型的进化,其已超越工具属性,成为数字空间中具备“半自主性”的新主体。这种特殊性体现在两方面:
1. 独立性与依赖性并存:大模型的训练依赖个人、企业、国家的数据,但其生成的决策或内容可能脱离原始数据主体的控制。
2. 双向侵害风险:
-
直接侵害:大模型在训练中可能直接使用敏感数据(如隐私文本、机密文档),导致显性泄露。这个已经被业界熟知且已经有相应的各类管控手段;
-
间接侵害:通过强大的推理能力,从非敏感数据中提炼出敏感信息。原来业界对于大模型的推理能力是存疑的,但是随着o1和DeepSeek的爆发,大模型的推理能力再一次超出人们的认知,那么通过推理能力衍生的风险被无穷放大。模型越大、推理能力越强,对多源数据的关联分析能力越强,越可能通过“数据拼图”揭示原本分散存储的机密信息。
03
数据蒸馏与采样学习:监管缺失下的“暗流”
-
隐式数据泄露:假设A模型通过医疗数据训练出诊断能力,B模型通过采样A的输出,可能间接获取患者隐私特征。 -
责任边界模糊:当多个模型共同参与数据流转时,难以追溯泄露源头。例如,DeepSeek若从第三方模型中获取语料,其生成内容可能包含未被授权的企业数据,但责任划分将陷入僵局。 -
输出管控的脆弱性:当前大模型的安全设计普遍存在“重输入、轻输出”的倾向,即优先通过数据脱敏、访问控制等手段限制训练数据的输入,却对模型生成内容的动态监控不足。这种失衡导致恶意用户可通过提示词工程(Prompt Engineering)绕过防护机制,逐步诱导模型输出敏感信息,比如通过分步试探、语义伪装:跨模型协同等方式来获取各类敏感数据。
此类问题暴露出现有监管框架的滞后性——传统的数据所有权和访问控制机制,难以有效应对大模型间复杂的数据流动。
国际封堵行动的深层逻辑:防御未知风险
多国对DeepSeek的封堵并非单纯的技术竞争,而是基于数据安全的前瞻性防御:
1. 防御推理泄露:DeepSeek的强推理能力可能从公开数据中挖掘出各类信息,如国家基础设施的薄弱点,被恶意组织用于定向攻击。
2. 阻断数据聚合:限制大模型的数据输入渠道,可防止其通过海量数据积累形成“数据霸权”。例如,禁止企业员工使用DeepSeek工具,能减少商业数据流入模型。
这些行动的本质,是对大模型“第四类主体”地位的承认,以及对其潜在失控风险的提前干预。我们往前看,2024年12月27日,美国司法部发布禁止敏感个人数据向部分国家跨境传输的最终规则,这一制度的诞生,打破了美国长期秉持的“数据跨境自由流动”传统,此规则将对中美数据交流乃至全球数据格局产生重大深远影响,打压Deepseek本质上就是该规则另一种体现方式,通过对大模型这类主体的限制使用,对中美数据脱钩进一步的管控而已。
注:本文约有500字为Deepseek本地生成。
本文作者
木言
数字安全业务规划专家
在金融、政府、医疗、等行业有丰富的行业实践经验,对数据安全体系有深入的理解,长期关注和从事零信任、CARTA、CSF等技术框架在数据安全领域的实践落地,擅长数据安全方向的技术体系建设与应用、数据安全体系的创新与实践等。
📖 推荐阅读
木言谈数据安全:我们需要什么样的数据安全整体方案?
木言谈数据安全:从谁管业务,谁管业务数据,谁负责数据安全谈起
「 一键加入数据安全及个人信息保护领域的知识宝库」
670+已加入
⬇️⬇️⬇️
「 数据安全合规知识星球 」数据安全合规专业人士交流社区
-
社区汇聚了近千位来自法律、合规、安全技术等多领域的专家。 -
社区提供丰富的资源,包括图解PPT、优质课程视频、话题研讨及问答、管理制度&评估工具&报告模板、典型案例合集等。 -
社区通过链接、分享、交流的成长理念,助力安全合规专业人士持续提升。
原文始发于微信公众号(合规社):从数据安全视角看DeepSeek被多国封堵
- 左青龙
- 微信扫一扫
-
- 右白虎
- 微信扫一扫
-
评论