人工智能还能这么干全域敏感数据发现的秘密武器

科技 2022-04-15 22:01:48
导读 随着大数据时代的到来,数据价值的深度应用成为企业发展的重要驱动力。在企业数字化转型过程中,加强数据治理、深化数据开发、保障数据安全

随着大数据时代的到来,数据价值的深度应用成为企业发展的重要驱动力。在企业数字化转型过程中,加强数据治理、深化数据开发、保障数据安全成为释放数据价值的关键环节,加强数据安全对企业数字化转型升级起着至关重要的作用。

基于此,CIO时代、新基础设施创新研究院、Hoyne Technology联合推出“Hoyne安全观”系列在线微课,详细介绍数据安全治理的方法论、先进技术、典型案例和实践成果,展示数据安全治理的全生命周期管理,助力企业数字化转型升级。

大数据时代,所有的数据都有一定的价值。价值背后隐藏着巨大的风险,大量敏感数据被出售、窃取和未经授权滥用。这个问题已经严重危害到个人隐私、企业发展甚至国家安全。

在首期“Hoyne的安全观”系列微课堂中,我们密切关注人工智能在全球敏感数据发现中的应用。

如何迈出数据安全治理的第一步

数据安全管理是企业安全管理的重要组成部分,也是管理难点之一。随着《网络安全法》、《民法典》、《数据安全法》、《个人信息保护法》等国家相关法律法规的颁布,以及地方、行业规范和指导意见的实施,体现了数据安全管理的重要性和必要性。但是,数据安全管理不可能一蹴而就。从《GB∕T 37988-2019 信息安全技术数据安全能力成熟度模型》 (DSMM模式)可以看出,数据安全是涉及数据完整生命周期的全过程安全管理。

照片:《GB∕T 37988-2019 信息安全技术 数据安全能力成熟度模型》

从数据安全流程管理的角度来看,数据采集阶段是实践DSMM数据安全管理的第一步。需要在数据采集阶段完成的数据发现、数据定义、数据分类等是更好的数据流程管理的基础。

全球敏感数据发现面临巨大挑战。

对于企业来说,数据安全的核心是对特定的敏感信息实施安全保护。在数据安全管理中,数据收集阶段的重要目标是完成数据分类和分级。在实施中,企业通常面临以下挑战:

1.不知道哪些系统有数据要处理?

2.需要管理的仅仅是数据库中的数据吗?

3.如何根据自己的业务情况配置分类分级策略?

因此,数据分类和分级的前提是了解客户环境中的全部数据量。从主流数据安全管理产品的现状来看,除了发现敏感数据的手段单一之外,还存在以下两个问题:

1.支持的数据源范围有限:以主流敏感数据扫描产品为例。在发现敏感数据时,数据库系统是主要目标。但是,大量客户的数据使用环境不仅仅是数据库,包括企业网盘、流程平台、大数据开发甚至IM通讯软件,这些地方都有大量的敏感信息数据。

2.数据发现手段单一:传统的数据安全产品都是基于大量定义好的正则表达式规则来匹配并完成对数据库中敏感数据的扫描。数据发现的范围和准确性完全取决于规则的丰富性和准确性。很难保证数据发现没有遗漏和偏差。

此外,大量人工配置、发现效率低等问题都制约着客户实现数据安全治理的目标。

全球敏感数据发现的秘密武器

1)充分利用机器学习的能力

经过Hoyne的长期经验,机器学习是分析、理解和识别数据模式的最佳工具。在数据安全管理过程中,机器学习的能力可以有效解决全局敏感数据发现过程中的准确性和匹配度问题。

其次,机器学习具有广泛的技术适应性,可以通过composi解决企业应用场景中异构数据类型和不同数据源的全局敏感数据的发现

比如在扫描传统敏感数据发现产品所不具备的非结构化数据时,可以使用NLP(自然语言处理)技术扫描发现敏感特征,还可以使用k-means算法技术发现相似数据、聚类识别等等。

2)AI(人工智能)支持全球敏感数据发现

目前,企业产生的数据量呈指数级增长,这是由于对隐藏在数据库中的所有未被发现的敏感信息的评估。自动化的广泛应用可以有效改善数据治理。因此,人工智能支持的全局敏感数据发现可以通过两个方面实现:

1.基于人工智能的发现能力:

通过自动嗅探技术识别客户环境中的存储,通过扫描样本数据初步梳理出客户的数据资产。包括:

1)通过SQL检索,摸清底数,整理结构化数据库的数据信息;

2)通过NLP和相应的数据学习模型分析非结构化文档中的敏感数据;

3)通过大数据连接组件和内置的规则公式,发现半结构化数据中的敏感信息。

2.人工智能分类和分级

产品在了解客户的基础数据环境后,通过内置的智能分类器自动对数据进行全量标注,然后结合法律法规的解读和导入进行自动分类处置。在处理过程中,采用聚类算法来提高处理效率和准确性。

 数据安全管理的前提是对全域全量数据的发现及合理化的分类分级,霍因数据安全治理平台可通过AI技术赋能数据安全治理过程,让客户了解数据现状,从而更好的开展后续数据安全管理工作。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时候联系我们修改或删除,多谢

最新文章