煮酒言规
///////////////
数据合规是一个比较新的领域,很多问题都难以通过公开渠道检索到答案。此时,实务人士间的思想碰撞、交流就显得尤为珍贵。
• CONTENT •
「便捷关闭用户信息训练模型实践」
● 现金支付退货身份核对
-问:B2C场景 客户如果现金购物,然后来退货退款,这个场景里需要收集顾客的姓名或其他个人信息,以用作身份验证之需吗?
-答1:问题是,付款时也没收集吧。你顶多核实小票。
总结:除非有明确规定,不然不合适,因为付款时也没收。
● 便捷关闭用户信息训练模型实践
-问:有谁知道哪家已给用户提供输入信息用于模型训练的快捷关闭操作方式了呢?
-答1:openai欧洲版。
-答2:国内有豆包,国外有Open AI和Gemini。这篇文章梳理的很好:
豆包告知了用户关闭/拒绝的方式,并且在App客户端上提供了便捷的部分关闭功能。豆包提供给用户两种关闭方式:
(1)用户可以通过发送邮件提出请求;
(2)对于语音信息,用户还可以通过关闭“设置”-“账号设置”-“改进语音服务”中的按钮来撤回授权。
养兔子的好人,公众号:新江湾的周日如何合规地用用户输入信息进行训练
总结:尽管TC260有需求,但境内头部大模型落实的还是少啊。
● 匿名化可落地实践
-问:监管认可的个人信息匿名化解决方案,如:去标识化/假名化后的信息给到接收方+接收方承诺不重识别,且并不掌握重识别的能力和信息,则视为匿名化。——这个有什么文件或者案例吗?
-答1:这是监管认可的吗,我理解还处于业内探讨的层面吧。之前上海还有个地标高富平老师他们搞的。详见:上海市地方标准《数据去标识化共享指南》正式实施。
-答2:没有监管认可的案例,之前蚂蚁的那个《个人信息匿名化制度:技术与法律(2024)》白皮书梳理了境外的匿名化实践。
-答3:那这里是有一些动向在的,比较靠近ICO的频谱说。不过这是刑事领域,缩限解释可以理解,不能往民事领域用呀。希望慢慢改善吧,不然没法玩。
个人信息是动态且高度依赖于具体场景的,仅机械适用“概括+列举”方式静态类型化识别并不符合实际,故须结合个案情况动态认定,即应结合具体案件因素对信息来源、去处、种类、价值以及其与人身权、财产权的紧密程度等综合判定。对于侵犯了单一信息如电话号码、购物信息等的,应当判断该信息是否关联人身利益与财产利益,对案涉信息进行限缩解释,从而避免无限递归下的动辄得咎。对于具有较高识别能力的个人和企业,应当根据其客观能力、义务范围等综合判定其对信息的可识别性。因此,对公民个人信息除以可识别性作为本质认定标准外,还应当综合考虑行为人的行为方式及侵犯公民个人信息的种类、数量、危害后果、识别能力等因素,进行动态识别。
公众号:最高人民法院司法案例研究院人民法院案例库中侵犯公民个人信息罪相关案例裁判要旨汇总
-答4:国标在制定中。引入了一个技术术语-动机攻击测试。
-答5:那看来也是借鉴了国外的一个标准。
-答6:通俗说法 “内鬼”。
-答7:所以还是特别关注“内”?论证中,组织内部要达到匿名化的效果,比和组织外部要难。不在一个组织就考虑正常能力下,合法合理的获取关联信息的可能性高低。
-答8:我理解“内”是一种验证采用匿名化这种技术措施保护的数据效果的场景。组织内部人员也无法将“匿名化”数据 重识别,是检验标准。因为内部人员获得的其他辅助信息更多。
-答9:所以最后匿名化就是一个风险评估后的结果,而不再是一个不可执行的玄学了,对吧。相信产业链上下游都不希望绝对的匿名化,否则就是不论三七二十一的签协议,这也不利于数据要素流通啊。
-答10:去标识+承诺不重识别,这个感觉像Ccpa 里对于去标识化的解释。
-答11:匿名化既是一个技术概念,也是一个法律名词。
总结:期待可落地的方案。
● 社会舆论属性讨论
-问:一个有意思的ai agent case。用的是国外模型,姑且认为是RAG场景。问题输入端控制在企业内部:指定的员工,提指定的问题,llm基于制定的知识库进行理解并生成答案后(没有个人工再次审核这一步)自动触发邮件,发送给外部c端用户。这场景下,如果模型没有被攻击,我理解出来的答案应该都是受控的。那么这还算是具有舆论属性吗?需要备案吗?
-答1:不用呀,风险是两端,输入和输出嘛。这两端都在企业员工受控。azure opeaai不备案也没事啊,就是不知道雷哪天响。
-答2:自用,出了事你自己担。
-答3:还是有点害怕…毕竟会向c端用户自动发邮件。但输入输出就已经被企业端控制了。其实但凡截断agent这一个功能,加入人工review就没问题。可是就没有agent这个噱头了。
-答4:有个实践的小Tips,可以看看生成内容的“违法违规”部分的拒答率?如果基本拒答的话,可以认定为答案非常限定域而非开放域,那舆论属性可能就小到不用备案了。
-答5:监管还要你应答库。
-答6:我理解这个情形下需要备案的可能性会变小很多。另外也看生成的内容,生成内容如果不会出现幻觉或者别的啥违法违规的内容似乎就还好。
● API官方定义
-问:请教下大家有没有看到了 “API接口”的技术定义相关的国标?
-答1:这个。
-答2:可以看看T/TAF 081.3-2022。
● 机顶盒标识符是个人信息吗
-问:除了35273(个人常用设备信息、个人上网记录)之外,还有没有其他依据可以证明机顶盒识别码、机顶盒位置、机顶盒播放记录等属于个人信息。
-答1:《个人健康设备通信规范》GB/T 42123-2022 看下呢,有涉及健康设备机顶盒终端的唯一设备ID。
● 营销收集亲友信息
-问:请教下 如果某场景下 要提供亲朋好友信息 以便一同参与一个活动 是否是要该亲朋好友额外出个授权同意书更合规一些
-答1:业务会骂人的,客户流失太多问题也大。不如写一句:如提供非本人个人信息时,应履行必要的告知同意义务即可。
-答2:把责任给到提供方,而且你们只是接收方,自然人可能还可以套72条个人家庭事务呢。
自然人因个人或者家庭事务处理个人信息的,不适用本法。 《个人信息保护法》第72天第1款
• END •
关注小号防失联
原文始发于微信公众号(数据何规):煮酒言规 | 第130期 | 便捷关闭用户信息训练模型实践
- 左青龙
- 微信扫一扫
-
- 右白虎
- 微信扫一扫
-
评论