新闻  |   论坛  |   博客  |   在线研讨会
如何向科技巨头用来监视你的数据“下毒”?
深科技 | 2021-03-14 16:47:48    阅读:1580   发布文章

每一天,你的生活都会留下数字痕迹,而科技巨头们会用这些痕迹来追踪你。比方说,你发了一封邮件,点了一些食物,看了一场演出,他们都会得到一些有价值的数据包,并以此了解你的喜好。


随后,他们再将这些数据输入到机器学习算法中,从而有针对性的向你推送广告或通知。而你不知道的是,谷歌每年将这些数据兑现为超过 1200 亿美元的广告收入。

渐渐地,我们已经无法逃离这种现实。2019 年,时任美国知名科技博客 Gizmodo 记者的卡什米尔・希尔曾做过一个著名的尝试,即在生活中摆脱五大科技巨头。结果,接下来的整整六个星期她都苦不堪言,连基本的数字功能都难以实现。与此同时,那些科技巨头们却不痛不痒。
现在,美国西北大学的研究人员提出了新的方法,将我们的集体数据作为谈判的筹码,来纠正这种权力的不平衡。也许,科技巨头们可以随意操控花哨的算法,但如果没有足够的正确数据进行训练,这些算法就毫无意义。
ACM FAT(关于计算机技术公平性的国际会议)2021 已经举行,在会议上发表的一篇最新论文中,包括博士生尼古拉斯・文森特和李翰林(音译)在内的研究人员提出了三种有益公众的方法。

  • 数据罢工(灵感来自于劳工罢工的想法)—— 扣留或删除你的数据,从而使得科技公司无法利用这些数据。比方说,离开当前平台或安装隐私工具。
  • 数据中毒 —— 提供无意义或有害的数据。举个例子,AdNauseam 是一个浏览器扩展程序,可以点击推送给你的每个广告,从而混淆谷歌的广告定位算法。
  • 有意数据贡献 —— 将有意义的数据提供给你想打击的平台的竞争对手,比如把你的 Facebook 照片上传到 Tumblr。


事实上,人们已经使用了很多这样的策略来保护自己的隐私。如果你曾经使用过广告****器或其他浏览器扩展程序,修改你的搜索结果以****某些网站,你就已经参与了数据罢工运动,并夺回了部分数据使用权。但正如希尔发现的那样,像这样零星的个人行动并不能让科技巨头们改过自新。
不过,如果数百万人联合起来在科技巨头的数据井里下毒呢?那也许就能给用户一些维护权益的筹码。
实际上,上述假设已经有例可援。今年 1 月份,在 Facebook 宣布将开始与公司其他部门共享 WhatsApp 数据后,就有数百万用户删除了他们的 WhatsApp 账户,并转移到 Signal 和 Telegram 等竞争对手那里。结果是,用户流失导致 Facebook 只得推迟政策变化。
就在最近,谷歌也宣布将停止在网络上追踪个人以及投放广告。上述论文作者文森特表示,虽然目前还不清楚这是真正的改变还是仅仅是品牌重塑,但有可能是使用 AdNauseam 等工具的用户增多,降低了谷歌算法的有效性,从而才促成了这一决定。
当然,这很难下定论。“真正知道数据罢工对一个系统影响有多大的只有科技公司。” 文森特说道。
文森特和李翰林认为,这些运动可以在抵制大科技的运动中补充政策宣传和工人组织等策略。
“目睹人们发起这类运动,我很激动,” 旧金山大学应用数据伦理中心研究员阿里・阿尔卡蒂布说道,不过他本人并没有参与这项研究,“看着他们思考集体或整体的观点真的很有趣:我们可以混淆这些数据,并趁机提出向科技巨头要求。因为这是我们的数据,而所有的数据都会混合到一起。”
要想让更多人参与到这些活动中来,我们还有很长的路要走。例如,计算机科学家可以在制造更多像 AdNauseam 这样的工具方面发挥重要作用,这将有助于降低参与此类活动的门槛,此外政策制定者也可以提供帮助。
如果有强有力的数据隐私法律支持,那么数据罢工是最有效的方法,如欧盟的《通用数据保护条例》(GDPR) 赋予了消费者要求删除其数据的权利。如果没有这样的法规,即使你删除了自己的账户,都很难保证科技公司会保留让你删除数据的权利,
而一些问题仍有待解答。一次数据罢工需要多少人破坏一家公司的算法?并且什么样的数据可以最有效地毒害一个特定的系统?例如,在一项涉及电影推荐算法的模拟中,研究人员发现,如果有 30% 的用户进行数据打击,就会使系统的准确率降低 50%。
但每个机器学习系统都是不同的,公司也在不断地更新这些系统。对此,研究人员希望机器学习界能更多对不同公司的系统进行类似的模拟,以此找出系统的漏洞。
阿尔卡蒂布建议,学者们也应该多研究如何激发集体参与数据打击行动。“集体行动真的不容易,” 他说。
他补充说道,这些策略也许还会产生负面影响,需要仔细考量。比如说,给数据下毒最终会不会只是给内容管理员和那些负责清理和标注公司培训数据的人增加工作量?
但总的来说,文森特、李翰林和阿尔卡蒂都布乐观地认为,数据可以变成一种有说服力的工具,以左右科技巨头如何对待我们的数据和隐私。“AI 系统依赖于数据。事实上它们就是这么工作的。总的来说,这是公众获得权力的一种方式。”


*博客内容为网友个人发布,仅代表博主个人观点,如有侵权请联系工作人员删除。

参与讨论
登录后参与讨论
推荐文章
最近访客