一家公司如何利用机器学习消除招聘过程中的偏见
发布日期:编者按:Stuart Nisbet 是位于罗利的人才招聘公司 Cadient Talent 的首席数据科学家。
罗利 — 在 Cadient Talent,我们每天都在努力解决一个问题:如何消除招聘过程中的偏见?
解决问题或偏见的唯一方法是通过科学研究直面它。通过应用机器学习,我们能够了解过去的错误,从而让我们在未来做出更少偏见的招聘决策。当我们发现无意识偏见,甚至是有意识偏见,并基于无偏见的机器学习教育自己做得更好时,我们就能迈出纠正已发现问题的第一步。
什么是偏见?
偏见是指对某事物、某个人或某个群体与另一事物、某个人或群体相比,持有偏爱或反对的偏见,这种偏见通常被认为是不公平的。偏见可以分为三组事实:第一组是普遍接受的客观事实。第二组是确认个人信念的事实,与个人认为正确的事实一致。偏见出现在客观事实与确认个人信念的事实的交集处。
通过选择性地选择那些证实特定信念的事实并专注于那些证实这些信念的事情,偏见就会出现。如果我们从这个角度看待招聘,并且我们的目标是消除招聘过程中的偏见,那么我们需要消除个人对哪些数据点应纳入招聘流程的选择。所有有助于做出积极选择(雇用申请人)或消极选择(拒绝申请人)的数据点都应纳入招聘流程,并且数据点及其权重的选择是通过统计数据客观完成的,而不是通过人为主观选择。
计算机算法如何帮助我们做到这一点?我们的目标是能够增强人类的智能,特别是通过利用过去招聘决策中的经验和先前判断,重点关注那些导致良好招聘决策的决策。“良好招聘”可以通过多种方式衡量,这些方式不会产生不适当的偏见,例如员工的任职时间。如果新员工在职时间不长,那么招聘工作可能做得不好,事后看来,你不会选择该申请人。但是,如果你雇佣了一个工作效率高、能长期任职的人,那么这个人就会被认为是一个好员工。
为什么我们要消除招聘决策中的偏见?
我们希望消除无意的偏见或与员工是否能够以令人满意的方式完成工作无关的偏见。因此,如果招聘经理的全部职责是运用他们的知识和经验来确定最合适的人选,为什么我们要使用机器学习来消除偏见?因为人工智能只会消除对与工作无关的候选人属性的偏见,并在存在适当偏见的情况下根据相关工作特征增强决策。
我们的目标是让招聘流程尽可能透明,并考虑招聘决策中用到的所有变量。如果只采用以人为本的方法,这将非常复杂,甚至不可能,因为招聘经理的决策比机器学习算法的决策复杂得多,也更难理解。因此,我们希望专注于机器学习算法的简单性;这意味着我们只想查看算法中与招聘流程相关的变量、列和数据片段,不包括与绩效无关的任何数据点。
例如,如果所评估的特质与工作相关,评估结果(无论是基于认知还是基于个性)可能是一个非常有效的数据点。工作经历和在类似职位上取得的成就可能非常重要。相反的情况也很明显。性别、种族和年龄不应该对某人的工作表现产生合法影响。下一点至关重要。招聘经理不能在面试中与申请人见面并令人信服地说他们不认识坐在他们对面的人的性别、种族或一般年龄段。无论我们的意图如何,这都很难做到。相反,这是算法最容易完成的任务。
如果算法没有提供性别、种族或年龄,那么这些变量就没有机会被纳入招聘决策。这包括引入相关的数据,让计算机查看过去做出的招聘决策,这些决策导致了高绩效的长期员工,然后根据过去良好的招聘管理实践的表现加强未来的决策。这最终将消除招聘中的偏见。
值得考虑的事情之一是延续过去可能存在偏见的做法。如果我们现在所做的只是像过去一样招聘,并且存在偏见或有偏见的招聘做法,那么这可能会助长制度偏见。随着时间的推移,我们已经训练计算机去做有偏见的经理过去会做的事情。如果用于招聘的唯一数据(“训练”)是过去偏见选择的数据,那么很难在没有偏见的数据上进行训练。例如,如果我们将性别确定为招聘过程中的偏见,并将性别变量从算法中剔除,那么性别就不会被考虑。当我们标记以前的偏见时,我们能够将未来的偏见降到最低。
我们应该毫不犹豫地审视自己是否能够识别过去可能存在偏见的招聘做法并从中吸取教训。这是在小时工招聘领域应用非常简单的机器学习算法的最大优势之一。
如果明确的目标就是多元化,那我们还能招聘到最优秀的人才吗?
招聘流程中的一个方面是实现多样性,这为人工智能和机器学习领域带来了很多机会。
人工智能在这方面确实可以脱颖而出。机器学习可以根据给定的数据做出最佳招聘决策;如果您有多元化目标,并希望招聘实践能够鼓励多元化的工作人群,那么从对企业目标至关重要的人群中挑选最佳候选人就非常简单了。这可以透明而简单地完成。它不会优先考虑一个人而不是另一个人。它允许从您感兴趣的每个人群中聘请最优秀的候选人来代表公司。
经过仔细审查和科学检验,机器学习可以成为一种非常有价值的工具,它不仅能辅助管理人员每天做出的招聘决策,还能帮助我们了解何时我们的决策中出现了偏见,导致最终的结果远低于我们集体的最佳水平。
原文来源: WRAL 技术线