消除人工智能模型偏見的方法
2021-03-04 18:20:45
自動(dòng)化決策工具在組織的應(yīng)用中正變得越來(lái)越普遍。然而,其背后的一些機(jī)器學(xué)習(xí)(ML)模型(從面部識(shí)別系統(tǒng)到在線廣告)都清楚地表明在種族和性別方面存在偏見。隨著機(jī)器學(xué)習(xí)模型的廣泛采用,需要專業(yè)知識(shí)來(lái)確保人工智能更加公平。
機(jī)器學(xué)習(xí)模型應(yīng)該消除偏見,而不是加劇歧視。為了構(gòu)建公平的人工智能模型,必須首先使用更好的方法來(lái)識(shí)別產(chǎn)生人工智能偏見的原因,因此必須了解人工智能模型如何學(xué)習(xí)其輸入和輸出之間的偏差關(guān)系。
研究人員已經(jīng)確定了人工智能中具有的三種偏見:算法偏見、負(fù)面影響、低估。當(dāng)受保護(hù)的特性和用于決策的信息之間存在統(tǒng)計(jì)的依賴性時(shí),就會(huì)出現(xiàn)算法偏見。負(fù)面影響是指用于訓(xùn)練人工智能模型的數(shù)據(jù)中已經(jīng)存在的偏差。當(dāng)沒(méi)有足夠的數(shù)據(jù)使人工智能模型對(duì)人口的某些部分做出可靠的結(jié)論時(shí),就會(huì)出現(xiàn)低估。以下深入研究每一個(gè)問(wèn)題:
1.算法偏見
算法上的偏見源于受保護(hù)的特性與其他因素之間的相關(guān)性。當(dāng)發(fā)生這種情況時(shí),不能僅通過(guò)從分析中刪除受保護(hù)的特性來(lái)減少偏差,因?yàn)槠湎嚓P(guān)性可能導(dǎo)致基于非保護(hù)因素的有偏見的決策。
例如,美國(guó)早期的預(yù)測(cè)性警務(wù)算法在進(jìn)行預(yù)測(cè)時(shí)并不能直接獲取種族的數(shù)據(jù),這些模型嚴(yán)重依賴于與種族相關(guān)的地理數(shù)據(jù)(如郵政編碼)。這樣,對(duì)性別和種族等人口統(tǒng)計(jì)數(shù)據(jù)“盲目”的模型仍然可以通過(guò)與受保護(hù)屬性統(tǒng)計(jì)相關(guān)的其他特征對(duì)這些信息進(jìn)行判斷。
美國(guó)消費(fèi)者金融保護(hù)局致力于確保貸款機(jī)構(gòu)遵守其公平貸款法規(guī),該局發(fā)現(xiàn)了一些統(tǒng)計(jì)方法將地理和姓氏信息結(jié)合起來(lái),對(duì)于種族和族裔代理的判斷提供了更高的準(zhǔn)確率。這個(gè)發(fā)現(xiàn)駁斥了一種普遍存在的誤解,即如果算法不能訪問(wèn)受保護(hù)的數(shù)據(jù),將自動(dòng)減少偏差。這種被稱為代理歧視的現(xiàn)象,一旦查明了根本原因,就可以緩解這種稱為代理歧視的現(xiàn)象。也就是說(shuō),可以通過(guò)在創(chuàng)建代理功能的模型中定位中間計(jì)算,并將其替換為與受保護(hù)屬性相關(guān)性較小的值來(lái)糾正違規(guī)行為。
與人們的直覺相反,在某些情況下,從模型訓(xùn)練中刪除受保護(hù)特性的解決方案實(shí)際上會(huì)傷害到已經(jīng)處于不利地位的群體。例如,在美國(guó)司法系統(tǒng)中,美國(guó)懲教機(jī)構(gòu)和假釋委員會(huì)使用風(fēng)險(xiǎn)因素清單對(duì)監(jiān)禁和釋放做出公正的決定。當(dāng)人類和人工智能模型處理具有諸如性別、年齡、當(dāng)前指控以及先前成人和青少年犯罪數(shù)量等基本信息時(shí),人類和人工智能模型的表現(xiàn)是相當(dāng)?shù)摹?br />
然而,通過(guò)給人類和人工智能模型10個(gè)額外的與教育和物質(zhì)使用相關(guān)的風(fēng)險(xiǎn)因素,研究人員發(fā)現(xiàn)機(jī)器學(xué)習(xí)模型更準(zhǔn)確,更不容易產(chǎn)生偏見。這強(qiáng)調(diào)了需要了解人工智能模型偏差的根本原因,而不是盲目地采用補(bǔ)救策略。
2.負(fù)面影響
人工智能算法的偏見也有可能直接來(lái)自其訓(xùn)練數(shù)據(jù)中存在的類似偏差。例如,受過(guò)訓(xùn)練以執(zhí)行語(yǔ)言翻譯任務(wù)的機(jī)器學(xué)習(xí)模型傾向于將女性名字與“父母”和“婚禮”等屬性相關(guān)聯(lián),而男性名字與諸如“專業(yè)”和“薪酬”之類的單詞之間的關(guān)聯(lián)性更強(qiáng)。該模型不太可能會(huì)自己建立關(guān)聯(lián)。與其相反,它是在反映這些性別取向的文本素材庫(kù)上進(jìn)行訓(xùn)練的。這是產(chǎn)生負(fù)面影響的一個(gè)例子。
在自然語(yǔ)言處理中,性別偏見是一個(gè)令人困擾但經(jīng)過(guò)充分研究的問(wèn)題:對(duì)原因的清晰了解提供了糾正它的途徑。在英語(yǔ)這樣的名詞和形容詞傾向于性別的語(yǔ)言中,研究人員發(fā)現(xiàn)了強(qiáng)制詞嵌入以保持性別中立的方法。而在其他語(yǔ)言具有固有性別詞語(yǔ)的情況下,可以通過(guò)引入打破性別和中性詞之間因果關(guān)系的示例來(lái)增強(qiáng)語(yǔ)言素材庫(kù),以防止出現(xiàn)偏見。
在其他應(yīng)用領(lǐng)域中,負(fù)面影響可能是最難緩解的偏見之一,因?yàn)槠姽逃械貎?nèi)置于機(jī)器學(xué)習(xí)模型從中學(xué)習(xí)的數(shù)據(jù)集中。因此,該模型可以將多年來(lái)對(duì)某一人群的系統(tǒng)性偏見進(jìn)行編碼。例如,或者根據(jù)人們居住的地方拒絕向他們提供貸款,可能會(huì)使貸款批準(zhǔn)數(shù)據(jù)集更側(cè)重于白人。數(shù)據(jù)中的這種偏差會(huì)導(dǎo)致人工智能模型的偏見。
盡管現(xiàn)有的緩解偏見策略可能會(huì)嘗試提高黑人申請(qǐng)者的信用接受率,但這可能會(huì)掩蓋該模型偏見的真正原因,并使其難以解決根本問(wèn)題。FICO分?jǐn)?shù)通常用作信貸決策的輸入,已經(jīng)顯示出種族歧視。在這種情況下,事后偏差緩解策略的有效性將低于尋找與信用價(jià)值也存在因果關(guān)系的替代數(shù)據(jù)源。因此,通過(guò)尋找替代數(shù)據(jù)可以減輕負(fù)面影響。
3.低估
正如數(shù)據(jù)可能存在偏差一樣,也可能出現(xiàn)數(shù)據(jù)不足的情況。如果沒(méi)有足夠的數(shù)據(jù),機(jī)器學(xué)習(xí)模型可能無(wú)法提供可靠的預(yù)測(cè)。這是被低估的問(wèn)題。亞馬遜公司最近訓(xùn)練了一種機(jī)器學(xué)習(xí)模型,以在招聘過(guò)程中篩選求職者,但與許多其他科技公司一樣,亞馬遜的勞動(dòng)力隊(duì)伍男性比例過(guò)高。這種數(shù)據(jù)失衡使得其人工智能模型在評(píng)估男性時(shí)更加側(cè)重,亞馬遜公司認(rèn)識(shí)到這種模型的推薦人選存在偏差,因此在其招聘渠道中取消了這種模型。
如果尋找更多或更好的數(shù)據(jù),亞馬遜公司或許能夠構(gòu)建出一種無(wú)偏見的招聘工具,但是如果不能正確地理解出現(xiàn)這種偏見的原因,這是不可能實(shí)現(xiàn)的。而在低估的情況下,模型的預(yù)測(cè)確定性可以跨人群的子組進(jìn)行分析,通過(guò)自動(dòng)增加新實(shí)例,可以使基礎(chǔ)數(shù)據(jù)集實(shí)現(xiàn)多樣化。
衡量模型確定性和穩(wěn)定性的方法對(duì)于了解模型是否準(zhǔn)備好對(duì)所有人群做出可靠的預(yù)測(cè)至關(guān)重要。在低估的情況下,提供的數(shù)據(jù)集無(wú)法充分表現(xiàn)出數(shù)據(jù)的細(xì)微差別。但是,用于促進(jìn)公平或事后偏向緩解策略的對(duì)抗性訓(xùn)練技術(shù)可能不會(huì)像將數(shù)據(jù)集擴(kuò)展得更全面。
人工智能算法可以編碼并保持偏見,這已經(jīng)不是什么秘密,這可能會(huì)帶來(lái)不良的后果。盡管這描繪了一種嚴(yán)峻的場(chǎng)景,但重要的是要記住,如果處理得當(dāng),算法偏差(與人類偏見不同)最終是可以量化和固定的。與盲目減少人工智能偏見不同,準(zhǔn)確理解偏見背后的真正原因?qū)Σ渴鸢踩煽康娜斯ぶ悄苤陵P(guān)重要。
盡管這些原因很復(fù)雜,但研究人員仍在繼續(xù)開發(fā)更好的方法來(lái)衡量特定人群的不同結(jié)果,確定導(dǎo)致這些差異的特征,并為特定的偏見來(lái)源選擇合理的緩解策略。隨著越來(lái)越多的決策實(shí)現(xiàn)自動(dòng)化,必須從根本上消除人工智能偏見,以創(chuàng)建公平和公正的模型