IBM希望通过新的不同数据集来改善面部识别的种族偏见

种族识别成功率差异是面部识别中的一个大问题,研究表明,如果对象是白人和男人,商业系统会更加准确。部分原因是培训数据缺乏多样性,有色人种的出现频率低于同龄人。 IBM是试图解决这个问题的公司之一,并且今天宣布了两个新的公共数据集,任何人都可以使用它来训练面部识别系统,其中一个专门用来帮助消除偏见。

第一个数据集包含100万张图像,并将帮助培训能够识别特定属性的系统,如头发颜色,眼睛颜色和面部毛发。每张脸都有这些特征的注释,使程序员更容易磨练他们的系统,以更好地区分山羊胡和其他胡须。这不是用于训练面部识别系统的最大的公共数据集,但是IBM表示包含这种标签的规模最大。

第二个数据集是更有趣的一个。它比第一张还要小,包含36,000张照片,但内部的人脸是相同的种族,性别和年龄组合。就像人脸属性标签帮助训练AI系统识别这些差异一样,拥有多种面部组合可以帮助系统克服各种偏见。这两个数据集均来自张贴到Flickr的带有Creative Commons许可证的照片,这些照片经常可以用于研究目的。

IBM的商业面部识别系统在过去被批评为存在明显的种族偏见。麻省理工学院媒体实验室2月份发表的一项研究发现,IBM识别黑皮肤女性性别的错误率接近35%,而识别白人男性错误率仅为1%。这些错误将变得越来越重要,因为面部识别系统被用于从雇用到识别犯罪嫌疑人的任务。

IBM表示正在努力改善这些错误,并且其面部识别系统的更新版本使用了更广泛的训练集(比如今天公布的那种训练集),以便将错误减少近十倍。然而,如果没有用于评估偏倚的标准化指标,要准确判断这些系统的改善程度仍然很难。

IBM希望通过新的不同数据集来改善面部识别的种族偏见

「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
0 条回复 A 作者 M 管理员
    当上帝赐给你荒野时,就意味着,他要你成为高飞的鹰
欢迎您,新朋友,感谢参与互动!欢迎您 {{author}},您在本站有{{commentsCount}}条评论