数据挖掘是公司用于将原始数据转化为有用信息的过程,通过使用软件查找大批数据中的模式,企业可以了解有关其客户的更多信息,以开发更有效的营销策略,增加销售并降低成本。数据挖掘取决于有效的数据收集,仓储和计算机处理。
数据挖掘过程用于构建机器学习模型,以支持包括搜索引擎技术和网站推荐程序在内的各种应用程序。
数据挖掘如何工作
数据挖掘涉及探索和分析大量信息,以收集有意义的模式和趋势。它可以以多种方式使用,例如数据库营销,信用风险管理,欺诈检测,垃圾邮件电子邮件过滤,甚至可以识别用户的观点或意见。
数据挖掘过程分为五个步骤:首先,组织收集数据并将其加载到其数据仓库中。接下来,他们可以在内部服务器或云中存储和管理数据。业务分析师,管理团队和信息技术专业人员可以访问数据并确定他们如何组织数据。然后,应用程序软件根据用户的结果对数据进行排序,最后,最终用户以易于共享的格式(例如图形或表格)呈现数据。
数据仓库和挖掘软件
数据挖掘程序根据用户的需求分析数据中的关系和模式,例如,公司可以使用数据挖掘软件来创建信息类别。举例来说,假设一家餐厅想使用数据挖掘来确定何时应提供某些特色菜。它查看收集到的信息,并根据客户访问的时间和订购的内容创建类。
在其他情况下,数据挖掘者基于逻辑关系找到信息集群,或者查看关联和顺序模式以得出有关消费者行为趋势的结论。
仓储是数据挖掘的重要方面,仓储是指公司将其数据集中到一个数据库或程序中。使用数据仓库,组织可以分拆数据段以供特定用户分析和使用。
但是,在其他情况下,分析师可能会从所需的数据开始,然后根据这些规范创建 数据仓库。无论企业和其他实体如何组织数据,他们都使用它来支持管理层的决策过程。
数据挖掘示例
杂货店是数据挖掘技术的知名用户,许多超市向顾客提供免费的会员卡,使他们可以享受非会员无法享受的优惠价格。这些卡使商店可以轻松地跟踪谁在购买商品,何时购买以及以什么价格购买。在分析了数据之后,商店可以使用此数据为客户提供针对他们购买习惯的优惠券,并决定何时出售商品或何时以全价出售商品。
当公司仅使用不代表整个样本组的选定信息来证明某个假设时,数据挖掘可能会引起关注。