中国科学技术大学 | GenderCARE：大型语言模型中性别偏见的综合评估与减少框架

2024年5月8日13:50:08评论194 views字数 607阅读2分1秒阅读模式

原文标题：GenderCARE: A Comprehensive Framework for Assessing and Reducing Gender Bias in Large Language Models

原文作者：Kunsheng Tang, Wenbo Zhou, Jie Zhang, Aishan Liu, Gelei Deng, Shuai Li, Peigui Qi, Weiming Zhang, Tianwei Zhang, and Nenghai Yu

发表会议：ACM CCS 2024

论文连接：https://zjzac.github.io/publications/pdf/CCS_24_bias.pdf

主题类型：大模型安全

笔记作者：唐坤生@USTC

主编：黄诚@安全学术圈

针对LLMs的性别偏见评估与去偏框架

中国科学技术大学 | GenderCARE：大型语言模型中性别偏见的综合评估与减少框架

采用我们所提出GenderCARE框架的去偏结果

5. 论文信息

论文连接：https://zjzac.github.io/publications/pdf/CCS_24_bias.pdf

相关论文已被ACM CCS 2024接受，作者为中国科学技术大学的唐坤生、周文柏、李帅、齐培贵、张卫明、俞能海，南洋理工大学的张杰、邓格雷、张天威，北京航空航天大学的刘艾杉。

安全学术圈招募队友-ing
有兴趣加入学术圈的请联系 secdr#qq.com

原文始发于微信公众号（安全学术圈）：中国科学技术大学 | GenderCARE：大型语言模型中性别偏见的综合评估与减少框架

免责声明:文章中涉及的程序(方法)可能带有攻击性，仅供安全研究与教学之用，读者将其信息做其他用途，由读者承担全部法律及连带责任，本站不承担任何法律及连带责任；如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截，联系方式见首页)，望知悉。

左青龙
微信扫一扫

右白虎
微信扫一扫

总结一下最近学习到的MCP风险问题（杂谈）

从性能测试比较简单的角度入手ai全自动化

AI安全，AI系统主要的安全威胁有哪些？

Survey: 大语言模型安全

复旦大学 | HoneypotNet：针对模型提取的后门攻击

AI安全 | 利用Agent-2-Agent协议中的代理卡来获取控制权

三分之一的AI代码未经审核便进入生产环境

人脸安全之图生视频ai模型

南方科技大学 | Set-level Guidance Attack: 提升视觉语言预训练模型的对抗迁移性

适合AI系统的访问控制方法ReBAC:基于关系的访问控制

本文由 admin 发表于 2024年5月8日13:50:08
转载请保留本文链接(CN-SEC中文网:感谢原作者辛苦付出)：
中国科学技术大学 | GenderCARE：大型语言模型中性别偏见的综合评估与减少框架https://cn-sec.com/archives/2719394.html
免责声明:文章中涉及的程序(方法)可能带有攻击性，仅供安全研究与教学之用，读者将其信息做其他用途，由读者承担全部法律及连带责任，本站不承担任何法律及连带责任；如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截，联系方式见首页)，望知悉.

中国科学技术大学 | GenderCARE：大型语言模型中性别偏见的综合评估与减少框架

5. 论文信息

总结一下最近学习到的MCP风险问题（杂谈）

从性能测试比较简单的角度入手ai全自动化

AI安全，AI系统主要的安全威胁有哪些？

Survey: 大语言模型安全

复旦大学 | HoneypotNet：针对模型提取的后门攻击

AI安全 | 利用Agent-2-Agent协议中的代理卡来获取控制权

三分之一的AI代码未经审核便进入生产环境

人脸安全之图生视频ai模型

南方科技大学 | Set-level Guidance Attack: 提升视觉语言预训练模型的对抗迁移性

适合AI系统的访问控制方法ReBAC:基于关系的访问控制

发表评论

在线咨询

微信