2024
在讨论AI模型的公平性评估之前,让我们先讨论一下实际AI应用中存在哪些AI模型歧视问题。目前的AI模型歧视较为隐蔽,很多人如果不是切身利益受到损害或者进行横向对比,很难注意到被AI模型不公平对待,甚至不了解背后存在AI模型。以下是一些常见的AI模型歧视问题及其影响:
1. 数据偏差
AI模型通常依赖于历史数据进行训练。如果这些数据本身存在偏见或不平等,这些偏见就会被模型学习并反映出来。例如,在某些招聘系统中,历史数据可能会因为过去的性别歧视而导致女性候选人的被筛选比例低于男性。这种偏见在模型中可能会得到延续和放大。
2. 算法偏见
算法设计和模型选择可能无意中引入偏见。一些算法可能对数据中的某些特征过度敏感,导致不公平的决策结果。例如在信贷评分系统中,模型可能对某些地理位置或收入水平的特征过于敏感,从而导致特定群体的贷款申请被不公平地拒绝。
3. 不平等的预测结果
即使模型本身没有明显的偏见,不同群体在预测结果上的差异仍然可能存在,特别是在不同特征的影响下。例如在医疗诊断系统中,模型可能对某些种族或性别的疾病风险预测不准确,导致这些群体的医疗资源分配不均。
4. 过度依赖不平等的特征
模型可能过度依赖某些不公平的特征(如种族、性别、年龄等),导致决策结果的偏见。例如,在广告投放系统中,模型可能根据用户的性别或年龄来优化广告展示,导致某些群体看到的广告种类和频率有所不同。虽然有些不同是当前社会意识形态所认可的,但很多“不同”明显已经越界。
5. 缺乏透明度和可解释性
许多AI模型,尤其是深度学习模型,缺乏透明度和可解释性,这使得难以识别和纠正模型中的歧视问题。一个复杂的神经网络可能做出决策但无法解释其原因,这使得难以判断是否存在不公平的决策过程。
近年来AI应用越来越多,AI模型的不公平性的影响是巨大的:
-
社会不平等:AI模型的歧视可能加剧社会不平等,如在招聘、贷款、医疗等领域对某些群体的不公平待遇。
-
法律和道德风险:不公平的AI决策可能引发法律诉讼或监管处罚,并影响公司的社会责任和道德声誉。
-
用户体验:用户对不公平的AI决策可能产生负面情绪,影响用户体验和对技术的信任。
评估AI模型的公平性涉及一系列技术和方法,旨在确保模型对所有群体的决策没有不公平的偏见。以下给出一些评估方法、解释和例子,供读者参考:
1. 定义公平性指标
Demographic Parity(人口统计公平性)
人口统计公平性要求模型在不同群体中提供相同的预测比例。例如,如果一个模型预测贷款批准,那么在性别、种族等不同群体中,批准贷款的比例应相同。假设一个贷款审批模型在男性申请人中有60%的批准率,而在女性申请人中只有40%。为了实现Demographic Parity,模型应调整以使男女申请人的批准率相近。
Equalized Odds(平等的概率)
平等概率要求模型在不同群体中具有相似的假阳性率和假阴性率。这意味着无论群体如何,模型的错误率(如错误地拒绝一个有资格的申请人)应相似。例如,在一个信用评分模型中,模型的假阳性率(错误地将有良好信用的人标记为高风险)和假阴性率(错误地将高风险的人标记为低风险)在不同种族群体中的比例应相似。
Equal Opportunity(平等的机会)
平等的机会要求在不同群体中,真正的正例(真正有资格的人)被正确识别的比例相同,即真阳性率应该相同。例如,在一个招聘筛选模型中,确保所有性别或种族的合格候选人被选中的机会相同。
2. 数据分析
第一,群体分析。通过分析模型在不同群体上的表现,以识别是否存在系统性的偏见。在一个贷款批准模型中,分析不同性别和种族群体的批准率和拒绝率。如果某些群体的批准率显著低于其他群体,则可能存在偏见,然后增加缺失的数据样本。
第二,数据偏差检查,检查训练数据是否存在偏差,以确保数据的多样性和代表性。例如,在医疗数据集中,如果数据主要来自某个地区或某个种族,这可能导致模型对其他地区或种族的预测不准确。可以通过平衡数据集来改进。
3. 模型评估工具
目前有一些模型评估工具可以使用,例如:
Fairness Indicators ,主要利用工具和数据库,如TensorFlow的Fairness Indicators,用于计算模型的公平性指标。使用Fairness Indicators检查模型在不同性别上的准确率、假阳性率和假阴性率。
AI Fairness 360,IBM的开源工具包,提供多种公平性指标和算法修正方法。使用AI Fairness 360计算模型的公平性指标,如Demographic Parity,并应用公平性修正算法(如重加权)来减少偏见。
Fairlearn,是开源库,提供公平性指标和修正工具,支持在模型训练过程中实现公平性约束。在模型训练时使用Fairlearn的公平性约束功能,确保模型在不同群体中的表现一致。
4. 公平性修正
预处理修正,是指在数据预处理阶段进行调整,例如通过过采样或欠采样平衡数据集。例如,使用SMOTE(合成少数类过采样技术)增加少数群体的数据样本,以减少模型的偏见。
处理中修正,在模型训练过程中应用公平性约束或调整损失函数,以减少偏见。
例如,在训练信用评分模型时,使用加权损失函数,使得模型对不同群体的误分类代价相同。
后处理修正,在模型预测后进行调整,例如通过重新加权预测结果来提高公平性。
例如在信贷场景调整预测结果,使得不同性别群体的贷款批准率更加一致。
5. 透明度和可解释性
针对模型可解释性,目前也有可使用的模型解释工具,如LIME或SHAP,了解模型如何做出决策,确保模型的决策过程对所有群体透明。例如,使用LIME解释模型对特定个体的决策,解释一个特定候选人被拒绝的原因,并检查是否存在不公平的影响。
6. 审计和反馈
定期审计
定期对AI模型进行公平性审计,以确保长期的公平性。比如,每季度检查模型在不同群体中的表现,并进行必要的调整,以保持模型的公平性。
收集用户反馈
收集用户反馈,了解模型在实际应用中的公平性表现,并根据反馈进行调整。比如,在广告推荐系统中,收集用户对推荐内容的反馈,检查是否存在公平性问题,并据此调整模型。
确保模型公平性可以帮助减少歧视和偏见,保护弱势群体,遵守法律法规,提升商业利益和技术质量,并促进社会的整体公平。通过全面评估和改进AI模型的公平性,企业和组织能够在技术应用中实现更高的道德标准和社会价值。
— THE END —
--------------------------------------------------------
原文始发于微信公众号(数据合规与治理):【干货】如何评估AI模型的公平性?
- 左青龙
- 微信扫一扫
- 右白虎
- 微信扫一扫
评论