在当今信息时代,算法已经无处不在。机器学习算法能够快速精准的对数据进行分析和利用,成为了新时期企业最为重要的技术之一,被广泛用于搜索引擎、推荐系统、金融信贷等方面。
但是,虽然被称为“正义的算法”,在现实世界中,却有很多例子表明算法并不总是正义的。自动招聘算法、银行贷款评估算法等,都存在种族、性别、地区等不公平的问题。
这是因为算法的数据训练集来源有限,建模人员对训练集的选择、样本量大小、采集方法、数据预处理等因素的影响也使得模型偏向某些种族、性别、地区,从而使得模型推荐和评估时的结果偏向某些人或社群。
因此,我们需要更多的数据源,更完善的数据预处理流程,更多的专业技术人员参与算法的设计,以便使得算法真正成为“正义的算法”,呼应互联网的公平,成为为所有人服务而存在的工具。