Facebook正在使用AI模拟用户的不良行为

人工智能 2020-09-05 16:58:29

Facebook的工程师已经开发出一种新方法,以帮助他们识别和防止有害行为,例如用户散布垃圾邮件,欺诈他人或买卖武器和。现在,他们可以使用AI驱动的机器人,通过在并行版本的Facebook上放松他们,来模拟不良行为者的行为。然后,研究人员可以在仿真中研究机器人的行为,并尝试使用新的方法来阻止它们。

该模拟器被称为WW,发音为“ Dub Dub”,它基于Facebook的真实代码库。该公司于今年早些时候在WW上发表了一篇论文(之所以这么称呼,是因为模拟器是万维网的WWW的简化版本),但在最近的一次圆桌会议上分享了有关这项工作的更多信息。

这项研究由Facebook工程师Mark Harman和该公司位于伦敦的AI部门领导。哈曼在向记者发表讲话时说,WW是一种非常灵活的工具,可用于限制站点上的各种有害行为,并且他举例说明了使用模拟开发新的防御诈骗者防御措施的方法。

在现实生活中,诈骗者通常是通过诱使用户的友谊小组寻找可能的标记来开始工作的。为了模拟WW中的这种行为,Facebook工程师创建了一组“无辜”机器人作为目标,并培训了许多“不良”机器人,他们探索了网络以试图找到它们。然后,工程师尝试了各种方法来阻止不良机器人,并引入了各种限制,例如限制私人消息的数量和僵尸程序每分钟可以发送的帖子,以了解这如何影响其行为。

哈曼将这项工作与试图减少繁忙道路上的超速行驶的城市规划人员进行了比较。在这种情况下,工程师可以在模拟器中模拟交通流,然后尝试在某些街道上引入诸如减速带之类的东西,以查看其产生的影响。WW模拟允许Facebook与Facebook用户进行相同的操作。

“我们将“减速带”应用于我们的机器人可以执行的动作和观察,并迅速探索可以对产品进行的可能更改,以抑制有害行为而不损害正常行为,” Harman说。“我们可以将其扩展到数以万计的机器人,因此,可以并行搜索很多不同的可能约束向量。

在机器学习中,模拟想要学习的行为已经足够普遍,但是WW项目值得注意,因为模拟基于Facebook的真实版本。Facebook称其方法为“基于网络的模拟”。

“不同于在传统的模拟中,所有东西都是模拟的,而在基于Web的模拟中,动作和观察实际上是通过真实的基础结构进行的,因此它们更加现实,” Harman说。

但是他强调说,尽管使用了真实的基础架构,但机器人无法以任何方式与用户进行交互。他说:“实际上,它们不能与其他机器人进行任何交互。”

值得注意的是,该模拟不是Facebook的视觉副本。不要想象科学家像研究人们在Facebook小组中彼此互动那样研究机器人的行为。WW不会通过Facebook的GUI生成结果,而是将所有交互记录为数值数据。可以将其视为观看足球比赛(真实的Facebook)与仅阅读比赛统计信息(WW)之间的区别。

目前,WW也处于研究阶段,该公司使用机器人进行的模拟都没有对Facebook进行现实的改变。哈曼说,他的小组仍在进行测试,以确保仿真与现实行为的匹配度足够高,足以证明现实生活中的变化是正确的。但是他认为这项工作将导致在年底之前对Facebook的代码进行修改。

模拟器当然也有局限性。例如,WW无法建模用户意图,也无法模拟复杂行为。Facebook表示,机器人搜索,发出朋友请求,发表评论,发表帖子以及发送消息,但这些行为的实际内容(例如对话的内容)并未被模拟。

哈曼说,虽然WW的力量在于其大规模运作的能力。它使Facebook可以运行数千个模拟,以检查网站的各种细微变化,而不会影响用户,并由此发现新的行为模式。他说:“我认为,来自大数据的统计能力仍然没有得到充分的重视。”

这项工作最令人兴奋的方面之一是WW可能通过机器人的行动发现Facebook体系结构中的新弱点。可以通过各种方式来训练机器人。有时,他们会被明确指示如何采取行动;有时他们被要求模仿现实生活中的行为;有时他们只是被赋予了某些目标,而后决定自己的行动。在后一种情况下(一种称为无监督机器学习的方法),可能会发生意外行为,因为机器人会找到实现工程师无法预测的目标的方法。

“目前,主要重点是培训机器人以模仿我们知道的平台上发生的事情。但是从理论上和实践上,这些机器人都可以完成我们以前从未见过的事情。” Harman说。“这实际上是我们想要的东西,因为我们最终希望领先于不良行为,而不是不断追赶。”

哈曼说,该小组已经看到了这些机器人的意外行为,但拒绝透露任何细节。他说他不想给骗子任何线索。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时候联系我们修改或删除,多谢