路灯的数据

图片来源:Mathayward | Dreamstime.com

算法重新点燃了对犯罪预测的争论

2022年7月07

由莎拉·雷

芝加哥大学的研究人员开发了一种算法,他们说这种算法可以提前一周预测整个城市的犯罪地点和犯罪率。

数据和社会科学家承认,犯罪预测工具此前曾“引发过关于偏见和监视的争议”,并表示他们已经采取了一些措施来降低这些风险。然而,其他专家仍然对如何使用这些工具感到担忧。

该模型将城市分成大约1000英尺宽的空间瓦片,并“预测”这些区域内的犯罪。它使用了芝加哥暴力和财产犯罪的历史数据进行了测试和验证。根据研究发表在自然的人类行为在美国,该模型可以提前一周预测未来的犯罪行为,准确率约为90%,而且在其他七个美国城市(亚特兰大、奥斯汀、底特律、洛杉矶、费城、波特兰和旧金山)的数据中也表现得同样出色。

芝加哥大学医学助理教授、该研究的资深作者Ishanu Chattopadhyay说,例如,它可以预测两个街区半径内一周内发生杀人案的高风险今天的城市

真实的科幻小说吗?

Chattopadhyay说这个工具不应该被拿来比较少数派报告这是一部科幻短篇小说和电影,故事发生在未来,人们因尚未犯下的罪行而被捕。

“我们并不专注于预测个人行为,”他说。

以前的犯罪预测计划一直备受争议,比如现在被放弃的一个计划在芝加哥该调查对数以万计的居民进行了评估,判断谁最有可能被卷入暴力事件,要么是受害者,要么是罪犯。

该研究小组强调,他们的方法不同于其他研究,后者将犯罪描述为出现在“热点地区”,并扩散到周边地区。他们认为,这些工具忽略了城市复杂的社会环境,也没有考虑到犯罪和警察执法效果之间的关系。

该工具也可用于审计偏差。研究人员通过分析事件发生后的逮捕人数,并比较不同社会经济地位社区的逮捕率,研究了警方对犯罪的反应。他们发现,富裕地区的犯罪比贫穷地区逮捕的人数更多。

根据Chattopadhyay的说法,该模型的开放性进一步使其与众不同。他说:“数据是公开的,算法是开源的,因此,任何能够使用中等强大的计算设置的人都可以复制结果。

机器学习算法通常需要“特征”作为输入,这些特征是由数据科学或领域专家确定的。新算法不需要人工输入,因为它直接处理原始事件日志。

“这可能被视为人工智能民主化的一步:没有隐藏的输入,没有‘当局’知道的数据注释,没有人坐下来输入参数,然后用来定义和识别坏的或‘有风险的’行为,”Chattopadhyay说。

风险仍然存在

“这并不意味着我们已经消除了潜在的偏见,”他补充说。“这些数据可能有内在的偏见。例如,过度监管弱势社区会错误地提高相对犯罪率,推理算法将无法判断。所以我们必须小心使用这个工具,以及类似的工具。

“我们必须利用这项技术来帮助社区,认识到存在的偏见,并朝着更好的社会迈进,而不是用更多的执法手段淹没弱势社区。”

然而,也有人指出,算法的创造者几乎无法控制它们在实践中如何使用。

纽约大学法学院临床法助理教授、种族、不平等与法律中心联席主任文森特·m·索思兰告诉记者今天的城市他说:“我不认为警察部门会利用这个工具来找到分配资源的方法,从而真正解决导致人们卷入刑事法律体系的潜在问题。

“我当然看到它被用来确定在哪里部署警察资源。在这种情况下,我认为这将导致我们在有色人种社区中看到的那种过度治安,历史上是全面的。”

他说,这些工具可以在一个地区的每个潜在罪犯身上“撒下一张怀疑的网”。

华盛顿大学(University of Washington)语言学教授艾米丽·m·本德(Emily M. Bender)在Twitter上发布了一条帖子,称应该把重点放在针对潜在的不平等,而不是预测,并指出工资盗窃、金融欺诈和环境违法等犯罪通常较少受到关注。

Chattopadhyay说:“考虑到这种技术可能带来的许多意想不到的后果,我们在部署时非常谨慎。但是该工具本身非常完整,可以快速部署。

“我们正在为此寻找最佳途径,但我们可能会在一年内看到该工具的一些部署。”