中国科学技术大学 | GenderCARE:大型语言模型中性别偏见的综合评估与减少框架

admin 2024年5月8日13:50:08评论140 views字数 607阅读2分1秒阅读模式
中国科学技术大学 | GenderCARE:大型语言模型中性别偏见的综合评估与减少框架
  • 原文标题:GenderCARE: A Comprehensive Framework for Assessing and Reducing Gender Bias in Large Language Models
  • 原文作者:Kunsheng Tang, Wenbo Zhou, Jie Zhang, Aishan Liu, Gelei Deng, Shuai Li, Peigui Qi, Weiming Zhang, Tianwei Zhang, and Nenghai Yu
  • 发表会议:ACM CCS 2024
  • 论文连接:https://zjzac.github.io/publications/pdf/CCS_24_bias.pdf
  • 主题类型:大模型安全
  • 笔记作者:唐坤生@USTC
  • 主编:黄诚@安全学术圈

中国科学技术大学 | GenderCARE:大型语言模型中性别偏见的综合评估与减少框架

中国科学技术大学 | GenderCARE:大型语言模型中性别偏见的综合评估与减少框架

中国科学技术大学 | GenderCARE:大型语言模型中性别偏见的综合评估与减少框架

针对LLMs的性别偏见评估与去偏框架

中国科学技术大学 | GenderCARE:大型语言模型中性别偏见的综合评估与减少框架

中国科学技术大学 | GenderCARE:大型语言模型中性别偏见的综合评估与减少框架

采用我们所提出GenderCARE框架的去偏结果

5. 论文信息

论文连接:https://zjzac.github.io/publications/pdf/CCS_24_bias.pdf

相关论文已被ACM CCS 2024接受,作者为中国科学技术大学的唐坤生、周文柏、李帅、齐培贵、张卫明、俞能海,南洋理工大学的张杰、邓格雷、张天威,北京航空航天大学的刘艾杉。

安全学术圈招募队友-ing 
有兴趣加入学术圈的请联系 secdr#qq.com

原文始发于微信公众号(安全学术圈):中国科学技术大学 | GenderCARE:大型语言模型中性别偏见的综合评估与减少框架

免责声明:文章中涉及的程序(方法)可能带有攻击性,仅供安全研究与教学之用,读者将其信息做其他用途,由读者承担全部法律及连带责任,本站不承担任何法律及连带责任;如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截,联系方式见首页),望知悉。
  • 左青龙
  • 微信扫一扫
  • weinxin
  • 右白虎
  • 微信扫一扫
  • weinxin
admin
  • 本文由 发表于 2024年5月8日13:50:08
  • 转载请保留本文链接(CN-SEC中文网:感谢原作者辛苦付出):
                   中国科学技术大学 | GenderCARE:大型语言模型中性别偏见的综合评估与减少框架https://cn-sec.com/archives/2719394.html
                  免责声明:文章中涉及的程序(方法)可能带有攻击性,仅供安全研究与教学之用,读者将其信息做其他用途,由读者承担全部法律及连带责任,本站不承担任何法律及连带责任;如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截,联系方式见首页),望知悉.

发表评论

匿名网友 填写信息