gongdaye
数据挖掘就是从大量数据中提取数据的过程;数据仓库是汇集所有相关数据的一个过程。数据挖掘和数据仓库都是商业智能工具集合。区别是数据挖掘是特定的数据收集;数据仓库是一个工具来节省时间和提高效率,将数据从不同的位置不同区域组织在一起。数据仓库分三层,即分段、集成和访问。数据挖掘是数据仓库的一种重要运用。基本上,它是用来将你的资料中隐藏的资讯挖掘出来,所以DataMining其实是所谓的KnowledgeDiscovery的一部份,DataMining使用了许多统计分析与Modeling的方法,到资料中寻找有用的特征(Patterns)以及关连(Relationships)。另一方面,数据仓库是一个术语,描述一个系统在一个组织中所使用的数据的集合这些数据收集在数据仓库提供的是事务性系统,如发票,购买记录,甚至贷款记录。各个点的数据记录被创建然后集合在一起,就是数据仓库。该数据仓库给出的数据报告可以帮助用户业务信息,从而做出有效的决策。数据挖掘与数据仓库的关系与区别,可详细了解CDA数据分析师认证。CDA数据分析师要求学生具备从数据治理根源出发的思维,通过数字化工作方法来探查业务问题,通过近因分析、宏观根因分析等手段,再选择业务流程优化工具还是算法工具,而非“遇到问题调算法包”。真正给企业提出可行性的价值方案和价值业务结果。点击预约免费试听课。 
数据仓库是一种解决方案,是对原始的操作数据进行各种处理并转换成有用信息的处理过程,用户可以通过分析这些信息从而作出策略性的决策。因此,在很多场合,我们也把数据仓库系统称为决策支持系统。而数据挖掘:是建立在数据仓库之上,分析数据仓库的。数据仓库系统的查询大都非常复杂,主要有两种:一种以报表为主,从数据库中产生各种形式的业务报表。这种查询是预先规划好的(Pre-defined Query);另一种则是随机的、动态的查询(Ad-Hoc Query),对查询的结果也是不能预料的。数据仓库中的查询由于其复杂性,会经常使用多表的联接、累计、分类、排序等操作,这些大都要对整个表进行搜索。每次查询返回的数据量一般很大,经常需要根据上次查询的结果进行进一步的搜索,这个过程常称为数据挖掘。