AI算法合规的14个常见问题 | Q&A

admin 2025年1月12日21:14:49评论14 views字数 4080阅读13分36秒阅读模式

探寻合规之道,共筑数据保障之堡。专注为数据安全管理者、技术专家、隐私法务、律师等专业人士打造的知识共享与交流平台。

AI算法合规的14个常见问题 | Q&A点击  "合规社"  > 点击右上角“···” > 设为星标⭐
随着技术的不断进步,可以预见2025年是充满更大机遇和挑战的一年。合规社、iLaw联合主办“合规领航,安全致远”跨年系列直播活动,邀请四位业内大咖,从不同维度深入剖析合规与安全的前沿话题,为观众奉上一场知识的饕餮盛宴。

跨年直播分享荟第一场

直播时间:1月10日 19:30-21:00
直播主题:典型案例看人工智能时代的算法治理
直播嘉宾:陈梦园 上海兰迪律师事务所资深律师
AI算法合规的14个常见问题 | Q&A
专业领域:数据合规、知识产权、TMT领域
联系方式:[email protected]、13524499989
人工智能时代,算法如同一双无形的手,操控着信息的流向、商品的推荐、决策的制定等,其重要性不言而喻。但算法也是一把双刃剑,若缺乏有效治理,极易引发诸多问题。
以下为依据陈律师《从典型案例看人工智能时代的算法治理》直播第一章,整理的部分内容。
👇👇👇
问1:算法合规需考量的关键维度有哪些?
算法合规需考量的关键维度包括六个层面:
1.算法备案:算法服务技术支持者、服务提供者应向关监管机构提交算法相关信息,以满足法律法规要求。
2.生成式人工智能服务备案:具有舆论属性或者社会动员能力的生成式人工智能服务的,需通过属地网信部门履行备案程序。
3.算法公开透明:需向公众提供有关算法及其决策过程的信息。
4.算法反歧视:算法的设计、训练数据选择、模型生成和优化以及提供服务等各个环节中,需采取措施防止算法对特定群体或个体产生不公平、不公正的对待。
5.算法训练语料合规:算法训练所使用的语料来源应合法合规。
6.算法内容安全:算法语料及生成的内容应符合法律法规要求。
问2:算法备案和生成式人工智能服务备案是否可以二选一?
算法备案和生成式人工智能服务备案或者认定是取其一即可,还是都要取得?
对于生成式AIGC产品,两个备案都是需要的。
问03:算法备案和生成式人工智能服务备案有什么不同?
算法备案其实是相对来说比较成熟的一个备案方式,它其实在最早的推荐性算法备案的时候就已经开始实施,后来深度合成,再到现在生成是人工智能服务的算法备案其实都是同一套体系。
1.依据不同
算法备案:根据《生成式人工智能服务管理暂行办法》第17条。
生成式人工智能服务备案:前置法律为《生成式人工智能服务管理暂行办法》。正式开展公告为各省网信办发布《关于受理生成式人工智能服务备案的公告》。具体要求参见《生成式人工智能服务安全基本要求》。
2.受理机构不同
算法备案:中央网信办。
生成式人工智能服务备案:属地网信办。
3.适用范围不同
算法备案:服务技术支持者、服务提供者。
生成式人工智能服务备案:具有舆论属性或者社会动员能力的AIGC产品。
问04:接入的大语言模型完成算法备案,本算法是否无需备案?

即便是接入的大模型完成了算法备案,本算法它仍然需要进行算法备案。

且在特定情形下,只有我们接入的大模型完成了算法备案,我们这个算法才能进行算法备案。这取决于接入大模型的方式。

第一种:使用其他大模型的开源代码形式。

本算法完成备案,并不要求接入了大模型已完成算法的备案,也就是本算法并不依赖于前置的大语言模型的备案才能完成。

第二种:以 API 接口形式接入。

要完成本算法备案的前提一定是接入的大模型已经完成算法备案。

问05:算法备案启动方式是什么?
算法备案启动方式为算法备案平台:https://beian.cac.gov.cn/#/index
AI算法合规的14个常见问题 | Q&A
问06:成式人工智能服务备案/认定启动方式是什么?

生成式人工智能服务备案的备案,接近于个案审查的方式。

以上海为例,所有可能涉及该领域AIGC产品提供者,应向上海网信办邮箱([email protected])发送本公司AIGC产品情况,包括:

1.AIGC产品载体:网页、APP、小程序;

2.接入的基础大语言模型:如文心一言,书生大语言模型;

3.大语言模型接入方式:API接口或开源代码产品形态:

4.引入新的训练数据,是否对于原模型有影响:例如给原模型提供训练数据,致使原模型发生改变,或训练数据仅为参照(搜索引擎)的使用方式。最终网信办会根据提供的信息情况告知企业是否需要进行生成式人工智能服务备案/认定。如果网信办回复到无需备案,其实这个关于这个合规义务的闭环也是完成了。如果需要备案的话,网信办会继续提供相应的备案材料。

因此,生成式人工智能服务备案,它的启动方式其实更接近于个案审查。建议还是跟网属地网信办进行良好的沟通来确认自己的产品是否需要进行这样的一个备案。

问07:什么是算法公开透明、算法可解释?

1.算法公开透明:是指向公众提供有关算法及其决策过程的信息。

2.算法可解释性:是指能够清晰、透明地解释算法做出的决策或预测的过程。
算法公开透明和算法可解释性是保障算法决策过程公正、公平和可信的重要手段。
问08:算法公开透明、算法可解释具体要求有哪些?

《生成式人工智能服务管理暂行办法》:

第十条 提供者应当明确并公开其服务的适用人群、场合、用途,指导使用者科学理性认识和依法使用生成式人工智能技术,采取有效措施防范未成年人用户过度依赖或者沉迷生成式人工智能服务。

《互联网信息服务算法推荐管理规定》:

第十二条 鼓励算法推荐服务提供者综合运用内容去重、打散干预等策略,并优化检索、排序、选择、推送、展示等规则的透明度和可解释性,避免对用户产生不良影响,预防和减少争议纠纷。

《关于加强互联网信息服务算法综合治理的指导意见》:

(十三)推动算法公开透明。规范企业算法应用行为,保护网民合理权益,秉持公平、公正原则,促进算法公开透明。督促企业及时、个合理、有效地公开算法基本原理、优化目标、决策标准等信息,做好算法结果解释,畅通投诉通道,消除社会疑虑,推动算法健康发展。

《生成式人工智能服务安全基本要求》:

第七条 1)以交互界面提供服务的,应在网站首页等显著位置向社会公开服务适用的人群、场合、用途等信息,宜同时公开基础模型使用情况;
2)以交互界面提供服务的,应在网站首页、服务协议等便于查看的位置向使用者公开以下信息:
——服务的局限性;
——所使用的模型、算法等方面的概要信息;
——所采集的个人信息及其在服务中的用途。
3)以可编程接口形式提供服务的,应在说明文档中公开1)和2)中的信息。
问09:司法实践中,算法可解释性对服务提供者在诉讼中意味着什么?

在司法实践中,算法可解释性对算法服务提供者至关重要。

企业需要对自身的算法规则及其解释程度承担举证责任。

这一点在诉讼中尤为关键,因为算法的透明度和可解释性是《生成式人工智能服务管理暂行办法》和《互联网信息服务算法推荐管理规定》中明确规定的义务,这意味着企业在诉讼中需承担相应举证责任以及举证不能的不利后果。

问10:什么是算法反歧视?
算法反歧视是指在算法的设计、训练数据选择、模型生成和优化以及提供服务等各个环节中,采取措施防止算法对特定群体或个体产生不公平、不公正的对待,保障算法决策过程和结果的公平性和公正性。
例如,OpenAI的图像生成算法曾因训练数据中白人男性图片占比过高,导致生成的“CEO”图片多为白人男性,被指责存在算法歧视。经过调整,OpenAI扩充了训练数据,使生成的CEO图片中包括了黑人、女性及其他少数族裔,图片的年龄、性别、种族和地域等特征变得更加多样化,有效减少了算法歧视,提高了算法的公平性和公正性。
问11:算法反歧视的具体要求是什么?

《生成式人工智能服务管理暂行办法》

第四条 (二)在算法设计、训练数据选择、模型生成和优化、提供服务等过程中,采取有效措施防止产生民族、信仰、国别、地域、性别、年龄、职业、健康等歧视。
问12:算法训练语料来源合规包括哪些方面?

1.开源语料:

是否遵循开源许可证。

开源许可证的兼容性。

开源许可证的传染性。

2.通过自动化方式采集:

数据爬取行为合规性。

3.通过提供其他相关服务收集:

取得相关用户授权,授权内容应包括用户同意将其数据用于算法训练。

4.自第三方采购:

数据提供方应提供语料来源、质量、安全等方面的承诺以及相关证明材料时。

应对该等训练语料数据进行合规审查。

签署协议,协议之中应包含数据条款。

5.使用者使用而产生的数据:

应取得用户授权,并提供退出机制。

问13:算法训练语料来源合规维度包括哪些方面?

1.个人信息:考虑语料中是否包含未经授权的个人信息。

2.商业秘密:关注语料中是否涉及商业秘密,防止泄露。

3.著作权:检查语料的使用是否可能侵犯著作权。

4.专利权:评估语料中是否包含专利技术,是否已获得授权。

5.商标权:确认语料中是否包含未经授权的商标。

6.肖像权:考虑语料中是否涉及肖像权,是否合法使用。

7.声音权:评估语料中是否涉及声音权,合法使用。

8.名誉权:考虑语料是否可能侵犯个人或企业的名誉权。

9.隐私权:关注语料中是否涉及隐私权,合法使用。

……

问14:算法内容安全包括哪些方面?

1.语料内容安全:

应采取关键词、分类模型、人工抽检等方式,充分过滤全部语料中的违法不良信息。

2.模型生成内容:

训练过程中,将生成内容安全性作为主要衡量指标;

每次对话,应对使用者输入信息进行安全性检测;

建立常态化监控手段,及时发现并优化可能的安全问题。

3.向使用者提供服务:

对使用者输入信息进行检测,使用者多次输入违法不良信息或明显诱导生成违法不良信息的,暂停服务;

对明显偏激以及明显诱导生成违法不良信息的问题,应拒绝回答;对其他问题,应均能正常回答;

设置监看人员,并及时根据监看情况提高生成内容质量及安全。

-END-
更多精彩内容,可阅读合规社与兰迪律所专家领衔撰写的《大模型安全、监管与合规》。
从安全、监管、合规、伦理四个维护展开分析,解决生成式AI实战中的典型安全与合规难题。
👇👇👇
AI算法合规的14个常见问题 | Q&AAI算法合规的14个常见问题 | Q&A

▲《大模型安全、监管与合规》获得机械工业出版社2024年度优秀图书奖

原文始发于微信公众号(合规社):AI算法合规的14个常见问题 | Q&A

免责声明:文章中涉及的程序(方法)可能带有攻击性,仅供安全研究与教学之用,读者将其信息做其他用途,由读者承担全部法律及连带责任,本站不承担任何法律及连带责任;如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截,联系方式见首页),望知悉。
  • 左青龙
  • 微信扫一扫
  • weinxin
  • 右白虎
  • 微信扫一扫
  • weinxin
admin
  • 本文由 发表于 2025年1月12日21:14:49
  • 转载请保留本文链接(CN-SEC中文网:感谢原作者辛苦付出):
                   AI算法合规的14个常见问题 | Q&Ahttps://cn-sec.com/archives/3622944.html
                  免责声明:文章中涉及的程序(方法)可能带有攻击性,仅供安全研究与教学之用,读者将其信息做其他用途,由读者承担全部法律及连带责任,本站不承担任何法律及连带责任;如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截,联系方式见首页),望知悉.

发表评论

匿名网友 填写信息