无障碍网站
显示或隐藏菜单栏
主家
节回家
|
内容
日历
链接
|
登录
|

数据库分析和大数据

X26_1_data_analysis1.jpg公司有大量信息存储在自己的数据库,涵盖客户行为随着时间的推移,但这往往被锁起来,并难以使用。数据科学(以前的数据分析)的提取这些数据,清理它,对其进行编码,可能与其他数据合并,并更好地了解客户和客户行为进行统计分析,并越来越多地使用自动化的算法系统,或AI至提取物的过程从数据库中洞察到目标的优惠和广告不同的客户。

越来越多的词万博手机版被用来描述数据使用科学的链接和分析的一个组织内保存的信息数据库。虽然,我们看到市场情报不是更广泛,万博手机版数据库分析现在是市场洞察力中心的业务功能。

数据科学和数据库分析的目的是要建立预测统计模型与增加购买客户的利益,他们花费或影响其购买行为的量的目的。

数据通常存在于交易或销售数据库、联系和客户服务数据库、忠诚计划、庞大的基于网络或互联网应用程序的在线行为和购买数据库中,并可以与外部数据相结合。

对于分析师的分析数据库信息的基本程序,无论是简单的联系人数据库或大数据有:

这是不寻常的存在是在组织中许多单独的数据库,各持不同的信息。较新的企业更有可能有统一的数据库系统,但更常见的是有轻轻链接操作数据库(例如,客户ID),其然后需要齐心协力,统一进行分析。

对于正在进行的数据库分析,自动化尽可能多的这些任务可能成为一个大的数据集至关重要,既为了确保数据是相同的质量进行分析每次运行并节省时间和精力重复每一样工作数据快照。虽然较小的数据快照,可以通过手工处理,任何物品的记录需求的几万到适当的自动化和记录。

我们的数据科学分析师首先构建脚本来提取、存储和链接数据源,然后将数据用于统计分析、建模或机器学习/AI。


提取信息

许多内部数据库是通过使用和偶然性来成长和开发的,因此识别和提取数据可能会很复杂。对于长期存在的或遗留系统,特别是在操作数据库随时间发展的情况下,数据库和表可能没有得到良好的文档记录,其中有丢失或移动的数据,或者表模式或数据字段的定义随时间变化。

从现场的系统数据需要被拉到了分析,并匹配字段,并检查内容质量和表关系确认和验证。

对于外部数据,比如社交媒体提要,数据可能从数据代理引入,或者直接通过抓取获得(受隐私规则限制)。这些数据提要还需要清理和匹配,可能会带来额外的复杂问题,比如解译。


清洁

一旦获得了数据,就必须对其进行清理。随着时间的推移,许多数据库往往会产生不准确和重复。例如地址变化,输入邮政编码不正确,或可能会有重复的记录有时造成错误的数据输入,但往往因为客户已经改变,创建了重复记录(在一个典型的企业对企业数据库20 - 25%的数据将过时的一年之后仅仅因为人们换工作)。类似地,文本提要也需要一定程度的处理,以使数据标准化,并筛查潜在的问题。

在内部数据库中,或者在合并数据集时,deduping是一项重要但有时具有挑战性的任务。自动化系统是存在的,但是必须通过某种程度的“目测”来检查产品的质量。

下一个数据可能需要重新编码,并识别丢失或错误的值。在查看诸如购买历史等方面时,经常需要对数据进行分组和重新分类。例如,数据库中的每个产品都有单独的产品代码,但是为了进行分析,可能需要将几个单独的产品分组在一起。

清理的过程最终会产生自动化的脚本,包括重复数据删除和清理丢失或错误的数据,但通常需要手工进行验证——通常通过检查较小的数据样本。


合并

一旦单个数据源被清除,它们就可以与其他数据源合并。再次合并并不是完全简单的,因为可能需要为相同的客户在不同的数据库上有不同的名称留出一些空间。例如,Acme建筑承包商也可能被称为ABC。因此,在合并数据之后,可能还需要进行第二阶段的清理。

消费者设置公共合并是从外部机构如ACORN或马赛克,或者从消费者数据的公司,如百利外部数据的链接添加基于地理位置的分类数据。这些对可以用于建模添加精细细节中的现有数据的顶部提供分类或分割数据的附加层。


分析

可以对来自数据库的数据进行许多不同类型的分析。任何分析的第一部分通常都是探索阶段,只是看看那里有什么。一种非常常见的简单的方法叫做帕累托分析,它将顾客按价值排序,然后将他们分成五分位数或十分位数,以了解谁是最有价值的顾客以及他们的购买特征是什么。在文本分析中,它可能是一个简单的单词频率计数之前,任何尝试情绪或概念分析。

标准的事务数据库度量包括最近性、频率和值。谁在最后一个月买了,3个月,6个月?谁一年买一次,两次,等等?他们花了多少钱?那些花费很多的人和那些花费在下一个类别的人之间有什么区别?(这样我们就可以得到提升)。

越来越多的企业开始追踪客户,然后关注客户的旅程——尤其是基于网络的分析——交易发生了什么,何时以及客户如何从一个交易转移到下一个交易;客户旅程是什么样的?

核心宗旨为众多类型的分析是建立一个“倾向模型”。这是识别谁在某种方式最有可能的客户行为的模型。举例来说,这些人谁是最有可能购买,或那些人会是谁最有可能响应特定通信,或谁都有可能离开或停止购买。

各类统计工具和分析也可用于构建倾向模型。从分类,分组和标签的客户,以各种形式回归。许多大型数据库分析,通过使用机使用深层神经网络自动的统计调查或人工智能学习完成。数据通常分析,然后对保持验证出样品,以减少过度拟合的可能性。

的分类和分组装置数据库中的数据可以被用于分割。数据库分段和万博官网manbet登录市场研究细分是结果可以被标记返回到数据库 - 每个客户都标有自己的部分。这意味着,如果你需要接触或跟踪特定段从数据库中,这是完全可能的,而对于市场的研究,你通常采取第二个层次的猜测。万博官网manbet登录


实施和学习

一旦分析创造的营销分析,下一阶段是实现 - 那就是使用这些数据来影响客户的行为。例如,为了应用分割具有定制通信,具体目标报价和响应测量和管理的系统。

实施手段跟踪分析进行得怎么样相比造型,因此反射回来到数据库。

这种对多方面实施的需求导致了算法和实验营销的发展,以及将分析带回网站的重要性。


混合大数据和研究

关于大数据的一个反复出现的观点是,你需要的所有信息都在数据库中,只需要进行适当的分析,企业就能够准确地预测客户的需求和行为。不幸的是,事实远非如此。

大数据分析可以发现数据中的关系和相关性,从而帮助改进和优化产品和服务,但数据库数据的主要问题是它是向后看的——它告诉你客户做了什么。如果一个新的竞争对手进入市场,或者你发布了一个新产品,没有数据表明接下来会发生什么。还有一种“分析延迟”,即分析、发现有用的见解需要时间。等到分析结束时,市场可能已经转向新事物。

出于这个原因,研究和实验,也仍然需要。大数据可以用小规模的现场试验来测试人们对变化做出反应,优惠和通讯,合并或与科研混合,以了解为何行为,例如跟踪电子商务之旅,然后与研究购买动机跟进和目标。


寻求帮助和建议,有效使用数据库分析和大数据联系info@dobney.com


上一篇文章:竞争情报 下一篇文章:使用已发表的报告
更多的细节

进入Notanant菜单 无障碍网站

访问级别:公开

本网站使用饼干。如果您继续使用本网站,即表示您同意我们使用cookies:好吧