如何实现增强分析用户不需要的数据科学经验

科技 2020-05-17 09:31:25

关于大数据和分析的谈话强调了过去十年利用数据的重要性。 没有经常讨论的是需要利用人们理解数据的能力,并将这种理解应用于业务。

除了传统的仪表板和报告之外,数据使用和理解民主化的需要一直是增强分析的主要驱动因素,Gartner将其定义为“使用机器学习(ML)和自然语言处理(NLP)来增强数据分析、数据共享和商业智能”。

而不是等待数据科学家或IT专家组装复杂的数据模型和算法来查询数据,没有数据科学正式背景的最终用户可以用英语这样的自然语言提交请求,而英语是软件引擎翻译成机器理解的代码。 代码自动创建所需的分析模型,以检测数据中的模式、趋势和异常,以回答请求。 为了模式和趋势识别的目的,采用机器学习。 ML在数据中发现重复的模式或模式中的异常,这反过来又导致业务洞察力。 一旦发现趋势或模式,预测软件引擎将执行根本原因分析,以确定导致趋势的最可能因素。

在这个过程的最后,在这一系列自动化过程中发现的洞察力被转换回一种自然语言,如英语,并传递给用户。 这使用户能够对信息采取行动。

一位农业生产者研究了草莓的历史收获和销售趋势,草莓在墨西哥通常有早期收获,在加利福尼亚则有后期收获。 生产者所忽略的和增强分析系统所得到的是一个异常的增长季节趋势数据。 该系统进一步观察,试图找到异常的根本原因,并发现由于气候变化,温度稳步上升。 现在,墨西哥和加州草莓的生长季节开始重叠。 这造成了市场上草莓的预期供过于求,有可能压低价格并挤压利润。

人力资源经理想了解员工离开公司的原因。 她看到,在某些情况下有退休,在其他情况下,员工找到更好的机会。 在过去,她可能会满意地写一份报告,但她正在使用的增强分析工具,包括机器学习,也看到了一种模式,即员工从公司的亚特兰大和圣地亚哥办事处离职的人数更多。 在根本原因分析中,该系统推断,两个办事处的管理和组织变化过大。 系统得出的结论是,过度的变化可能会迫使一些员工离开,促使人力资源经理考虑过多的变化是否会造成不稳定和不舒服的工作环境。

SEE:10种数据和分析方法将影响企业(Tech Republic)

增强分析的前景是消除更长的准备时间来洞察终端业务。 这是可能的,因为最终用户现在可以像英语这样的自然语言查询数据,然后系统可以与机器学习和自研算法一起工作,以提供新的见解。 它使用能够识别的数据模式来增强用户已经要求的数据。

这个过程并不是完美无缺的,但数据科学家使用的算法开发和数据建模过程也是如此。 公司应该考虑在数据查询策略中添加增强分析,但要注意一些问题。

增强分析只能和使用它们的人一样好。 许多终端用户不懂数据。 数据素养是,“理解数据的含义,包括如何适当地阅读图表,从数据中得出正确的结论,并认识到何时数据被用于误导或不适当的方式。” 这些技能通常在生产主管、客户服务经理或销售主管的工作要求中不被要求。

增强分析应该是对现有数据科学和分析应用的精心安排的补充。 这是因为在大多数组织中,数据素养可能不发达。 当使用增强分析时,数据科学家和IT数据分析师应该大量参与实现它的过程。

您为增强分析选择的供应商是很重要的。 如果供应商没有关于如何进一步开发该产品的路线图,或者没有足够强大的支持和培训系统来向公民数据分析师传授数据知识和工具能力,那么很可能应该避免这种情况。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时候联系我们修改或删除,多谢