谷歌的AI广告革命更多的隐私但问题仍然存在

人工智能 2021-04-03 11:10:19

2021年3月,Google宣布将停止对第三方Cookie的支持,并转向“更加隐私优先的网站”。尽管业内人士和学者都预计这一举动会引起人们的关注,但对于这种新模式仍然存有疑惑,并且对这种模式是否真正构成了Google声称的在线隐私革命也持怀疑态度。

为了对此进行评估,我们需要了解这种新模型以及正在发生的变化。当前的广告技术(adtech)方法是一种平台公司为我们提供“免费”服务以换取我们的数据的方法。数据是通过下载到我们设备上的第三方cookie收集的,这些cookie允许浏览器记录我们的互网活动。这用于创建配置文件并预测我们对特定广告系列的敏感性。

最近的进步已使数字广告客户能够使用深度学习,这是一种人工智能(AI)的形式,其中人类无需设置参数。尽管功能更强大,但仍与旧模型保持一致,依靠收集和存储我们的数据来训练模型并做出预测。Google的计划走得更远。

专利和计划

所有公司都有其秘密的调味料,而Google比大多数公司都更加机密。但是,专利可以揭示其最新动态。经过对Google专利的研究,我们发现了专利US10885549B1,“使用针对用户特定数据的时间分析的定向广告”:该系统的专利,该系统根据用户的“时间数据”预测广告的有效性,用户正在某个特定时间点进行操作,而不是在更长的时间内不加选择地收集海量数据。

我们还可以通过检查其他组织的工作来进行推断。由广告技术公司Bidtellect资助的研究表明,长期的历史用户数据对于生成准确的预测不是必需的。他们使用深度学习从时态数据建模用户的兴趣。

除了上下文广告(基于显示它们的网站的内容来显示广告)之外,这还可以带来更具隐私意识的广告。而且,在不存储个人身份信息的情况下,这种方法将符合诸如《通用数据保护条例》(GDPR)之类的渐进法律。

谷歌还通过谷歌隐私沙箱(GPS Privacy)发布了一些信息,这是一系列重组adtech的公开提议。其核心是合学习群组(FLoC),这是由最新浏览器部署的去中心化AI系统。正如Google AI博客所解释的那样,合学习与传统的机器学习技术不同,传统的机器学习技术可以集中收集和处理数据。取而代之的是,将深度学习模型临时下载到设备上,在此设备上训练我们的数据,然后将其作为更新模型返回服务器以与其他模型结合使用。

使用FLoC,深度学习模型将下载到Google Chrome浏览器,并分析本地浏览器数据。然后,它将用户分类为“同类群组”,几千个用户共享一组由模型识别的特征。它会自己制作一个加密副本,删除原始副本,然后将加密副本发送回Google,仅留下一个同类群组编号。由于每个同类群组都包含数千个用户,因此Google坚称该个人几乎无法识别。

队列和关注点

在这种新模型中,广告商不会选择要定位的个人特征,而是针对给定的同类群体进行广告宣传,如Google的Github页面所述。尽管FLoC听起来可能不如收集我们的个人数据有效,但Google声称它们实现了“与基于Cookie的广告相比,每支出1美元的转化次数有95%”。

广告的出价过程也将在浏览器上进行,使用另一个名为“ Turtledove ”的系统。很快,谷歌广告技术将以这种方式工作(包含在网络浏览器中),并根据我们的最新操作对广告进行持续的预测,而无需收集或存储可识别个人身份的信息。

我们看到三个关键问题。首先,这只是Google在互网上构建的更大的AI图片的一部分。例如,通过Google Analytics(分析),Google继续使用从基于网站的个人第一人称Cookie中获取的数据来训练机器学习模型并可能建立个人档案。

其次,组织如何“了解”我们是否重要?还是它知道的事实?Google向我们提供了法律上可接受的个人数据隐私,但是它正在增强了解我们并使其在线活动商品化的能力。隐私权是控制我们的个人数据的权利,还是让我们自己的本质在未经同意的情况下不为人知的权利?

最后一个问题与AI有关。围绕AI的局限性,偏见和不公正现象现在引起了广泛的争论。我们需要了解FLoC中的深度学习工具如何将我们划分为同类人群,将素质归于同类人群以及这些素质代表了什么。否则,像以前的每个营销系统一样,FLoC可能会进一步加剧社会经济不平等和分化。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时候联系我们修改或删除,多谢

最新文章