• 回答数

    7

  • 浏览数

    237

熊猫家的小姐
首页 > 考试培训 > 数据挖掘考试题库

7个回答 默认排序
  • 默认排序
  • 按时间排序

yyh心随我动

已采纳

LEVEL 1 学习内容涉及描述性统计、推断性统计、SQL数据库基础、数据采集以及数据建模分析等多方面的知识和技能,其知识系统且理论性强,所以学习时不要死记硬背,而要讲求学习技巧。CDA认证考试 Level Ⅰ 的难点分析SQL和统计学的部分相对是比较简单的,多加练习即可掌握。比较难的是多元统计的,如果不是统计学专业系统学习过的话理解起来还是比较吃力的。主成分分析、因子分析、聚类分析、分类分析、逻辑回归的概念理解起来都非常困难,就更谈不上应用了,实际上这些也是掌握起来比较困难的部分。建议多通过视频进行学习,重复观看,通过老师的讲解逐渐建立起多元统计的思维和逻辑,吃透理解知识点,达到可应用的层面。考试遇到同类型的问题,也不慌。对备考者们的建议首先要有充分的时间备考。临时抱佛脚也许可以侥幸通过考试,但对于自己掌握知识没有太大的帮助,毕竟考试是为了学习,不可本末倒置。其次要有坚持不懈的精神。简单的知识不可大意,学到通透为止,复杂的地方不畏惧,死磕到底,要树立起终身学习的信念。考试通过并不意味着结束,而仅仅意味着开始。第三要有提高效率的方法。对于初学者来说,你能遇到的绝大多数问题都有大神帮你解决,并且写成了博客,可以到CSDN上去搜一搜,相信你会有很大的收获。

数据挖掘考试题库

175 评论(11)

ShangHaiWendy

CDA Level Ⅰ:业务数据分析师专指互联网、零售、金融、电信、政府等行业领域前端业务人员;从事市场、咨询、BI、财务、风控、数据分析等职位人员;非统计、计算机专业背景零基础入行和转行就业人员。CDA Level Ⅰ业务数据分析师需要掌握概率论和统计理论基础,能够熟练运用Excel、SQL、SPSS、Python等一门专业分析软件,有良好的商业理解能力,能够根据业务问题指标利用常用数据分析方法进行数据的处理与分析,并得出逻辑清晰的业务报告。CDA Level Ⅱ:建模分析师一年以上数据分析岗位工作经验,或通过CDA Level Ⅰ认证。专指互联网、零售、金融、电信、医学、旅游等行业专门从事数据分析与数据挖掘的人员。在LevelⅠ的基础上更要求掌握多元统计、机器学习等理论知识,掌握高级数据分析方法与数据挖掘算法,能够熟练运用PYTHON、SPSS Modeler、R 、SAS等至少一门专业分析软件,结合业务,能从海量数据提取相关信息,从不同维度进行建模分析,形成逻辑严密能够体现整体数据挖掘流程化的数据分析报告。CDA Level Ⅱ:大数据分析师一年以上数据分析岗位工作经验,或通过CDA Level Ⅰ认证。专指互联网、零售、金融、电信、医学、旅游等行业专门从事数据分析与云端大数据的人员。在LevelⅠ的基础上要求掌握Python语言和Linux操作系统知识,能够掌握运用Hadoop、Hive、Spark等专业大数据架构及软件,从海量数据中提取相关信息,结合相关机器学习算法,进行大数据分析并形成严密的大数据分析报告。CDA Level Ⅲ:数据科学家三年以上数据分析岗位工作经验,或通过CDA LevelⅡ认证。专指互联网、零售、金融、电信、医学、旅游等行业首席数据官、数据分析总监等高端人员。在同时具备LevelⅠ和LevelⅡ三门科目要求的基础上,掌握更高级的前沿技术,包括计算机科学技术,高性能数据处理,大数据架构,机器学习,深度学习,数据治理、项目管理等。并能够负责制定企业数据发展战略,发现企业数据价值,提升企业运行效率,增加企业价值。能够带领数据团队将企业的数据资产进行有效的整合和管理,建立内外部数据的连接;具有数据规划的能力。报考条件:Level Ⅰ:无要求,皆可报考。Level Ⅱ:(满足以下之一皆可报名)1. 获得CDA Level Ⅰ认证证书。2. 本科及以上学历需从事数据分析相关工作1年以上3. 本科以下学历需从事数据分析相关工作2年以上Level III:(满足以下之一皆可报名)1. 获得CDA Level Ⅱ认证证书。2. 本科及以上学历需从事数据分析相关工作3年以上3. 本科以下学历需从事数据分析相关工作4年以上(注:上述数据分析相关工作不限制行业,工作可涉及统计,数据分析,数据挖掘,数据库,数据管理,大数据架构等内容。)五、考试方式CDA Level Ⅰ和Level Ⅱ为线下统考,上机答题。考生报名后根据准考证信息到考试地点参加考试。CDA Level III为分为线下上机考试+线上答辩面试两个部分。六、考试内容:Level Ⅰ业务数据分析师:120分钟,客观题(单选+多选),上机答题。考点请参考CDA Level Ⅰ考试大纲。Level Ⅱ建模分析师:90分钟,客观题(单选+多选),上机答题;120分钟,案例操作,自行携带电脑操作(安装好带有数据挖掘功能的软件如:SQL ,PYTHON,SPSS MODELER,R SAS,WEKA,等,进行案例操作分析。案例数据将统一提供CSV文件)。考点请参考CDA Level Ⅱ建模分析师考试大纲。Level Ⅱ大数据分析师:90分钟,客观题(单选+多选),上机答题;120分钟,案例操作,自行携带电脑操作(具体准备工作请见考试大纲中的详细说明)。考点请参考CDA Level Ⅱ大数据分析师考试大纲。Level Ⅲ数据科学家:第一阶段:150分钟,客观题+主观题,闭卷,上机答题。第二阶段:1个月内,项目案例,开卷。提交项目结果,60分钟,线上答辩面试。(第一阶段考试通过者,才有资格参与第二阶段面试)。考点请参考CDA Level Ⅲ大数据分析师考试大纲。七、考试安排:1. 报名时间:第11届报名截止时间:2019年12月5日第12届报名截止时间:2020年6月5日2. 第11届考试时间:Level Ⅰ:2019年12月28日上午,具体时间见准考证信息。Level Ⅱ:2019年12月28~29日,具体时间见准考证信息。Level Ⅲ:第一阶段:2019年12月28~29日,具体时间见准考证信息。第二阶段:2020年1月25~26日,具体时间待第一阶段评分后,通过者见官方公告。八、考试地点:北京/上海/天津/重庆/成都/深圳/广州/济南/南京/杭州/苏州/福州/太原/武汉/长沙/西安/贵阳/郑州/南宁/昆明/乌鲁木齐/沈阳/哈尔滨/香港(24所城市),其中香港地区考试为全英文考试。九、考试费用:Level Ⅰ:1000 RMBLevel Ⅱ:1500 RMBLevel Ⅲ:1800 RMB十、报考流程:进入考试系统()——在线注册——提交资料——报考科目和地点——完成缴费——等待审核通过——报名成功——下载准考证(考前一周)——参加考试——查询成绩(考试后7日登录系统查询)——通过者,获取证书(考试后30日内寄送)十一、评分成绩:考试最终成绩分为A,B,C,D四个层次,A,B,C皆为通过考试并获得认证证书,D为不通过。十二、考试学习资料报考LevelⅠ和Level Ⅱ成功后会发送《考试大纲》、《CDA数据分析师备考手册》(包含:《考试大纲》、《考试大纲解析》、《模拟考试题》三份资料)到考生邮箱,报考Level Ⅲ成功后会发送《考试大纲》、《模拟考试题》两份资料到考生邮箱。其他教材根据考试大纲中推荐的学习书目自行网上购买学习,推荐书目不用全部学习完,建议根据考试大纲中规定的知识点逐一进行。欲参加专业课程者可以参考CDA官方培训课,购课网址十三、CDA持证人福利:1.可吸纳为CDA Institute、中国数据分析师(CDA)俱乐部会员,活动中具有优先报名参与权。2.可优先获得CDA就业及职业发展推荐,持证人简历可发送至。3.免费参与CDA举办的中国数据分析师行业峰会、大数据峰会、研讨会等各项活动,Level Ⅱ与Level III持证人享受特权位置。4.可申请加入CDA数据分析教研组,参与兼职教研、讲师、个人IP打造等事项。5.享有CDA资源共享平台。平台推送由CDA引进和翻译的国外前沿数据科学学习资源(如MIT、Coursera、BDU等视频课程);推送优秀文献资料(如书籍、课件、报告等);开放经管之家论坛学习资源免费下载权限(如电子书、案例、数据等)。平台内实行开放式项目咨询合作,企业对接,跨界合作。6.其他特权皆以各类活动公告为主。

123 评论(8)

念念1218

1、CDALevelⅠ:CDALevelⅠ业务数据分析师需要掌握概率论和统计理论基础,能够熟练运用Excel、SPSS、SAS等一门专业分析软件,有良好的商业理解能力,能够根据业务问题指标利用常用数据分析方法进行数据的处理与分析,并得出逻辑清晰的业务报告。

2、CDALevelⅡ:在LevelⅠ的基础上更要求掌握多元统计、时间序列、数据挖掘等理论知识,掌握高级数据分析方法与数据挖掘算法,能够熟练运用SPSS、SAS、Matlab、R等至少一门专业分析软件。

熟悉适用SQL访问企业数据库,结合业务,能从海量数据提取相关信息,从不同维度进行建模分析,形成逻辑严密能够体现整体数据挖掘流程化的数据分析报告。

3、CDALevelⅡ:在LevelⅠ的基础上要求掌握JAVA语言和linux操作系统知识,能够掌握运用Hadoop、Spark、Storm等至少一门专业大数据分析软件,从海量数据中提取相关信息,并能够结合R、python等软件,形成严密的数据分析报告。

4、CDALevelⅢ:数据分析专家需要掌握CDALevelⅡ的所有理论及技术要求,还应了解计算机技术,软件开发技术,大数据分析架构及企业战略分析方法,能带领团队完成不同主题数据的有效整合与管理。对行业、业务、技术有敏锐的洞察力和判断力,为企业发展提供全方面数据支持。

扩展资料

报名条件

申报参加CDA数据分析员专业技术培训人员,具备统计学、计算机、金融、经济和会计学等专业大专以上学历。申报人员所出具的学历证明,必须是经国家教育部承认的正规国民教育学历证明。申报人员所出具的国家教育部承认的正规国民教育学历证明,必须真实有效,不得假冒伪造或修改。

报名方式

登陆CDA数据分析员网站,点击“在线报名”填写报名申请表并在线提交;或在下载资料中下载《数据分析员报名申请表》,填写学员信息后传真至报名处。

对报名申请表的信息进行初审后,工作人员通知学员递交电子版学历证明和身份证至报名处。学员缴纳学费之后领取教材以及相关资料。

参考资料来源:百度百科-CDA数据分析员

参考资料来源:百度百科-cda

273 评论(10)

尛小尛111

LevelⅠ和Level Ⅱ成功后会发送《考试大纲》、《CDA数据分析师备考手册》(包含:《考试大纲》、《考试大纲解析》、《模拟考试题》三份资料)到考生邮箱,报考Level Ⅲ成功后会发送《考试大纲》、《模拟考试题》两份资料到考生邮箱。其他教材根据考试大纲中推荐的学习书目自行网上购买学习,推荐书目不用全部学习完,建议根据考试大纲中规定的知识点逐一进行。

251 评论(8)

小路要减肥

1. 什么是关联分析关联分析是数据挖掘领域常用的一类算法,主要用于发现隐藏在大型数据集中有意义的联系。举一个大家最耳熟能详的例子,就是尿布和啤酒,表示成关联规则的形式就是{尿壶} ——> {啤酒}。这就是使用关联分析方法所得到的结果,而关联分析所得到的结果,我们可以用关联规则 或者 频繁项集的形式表示。在进行关联分析时,我们常常会遇到这样两个问题:A. 从大型数据集中发现模式一般来说需要在计算上付出巨大的代价,甚至往往是impossble的,我们往往采用置信度和支持度的剪枝来解决这个问题。B. 所发现的某些模式可能是虚假的,这个我们需要采用一些关联规则的评估来解决这个问题。2. 基本概念A. 项集:在关联分析中,包含0个或者多个的项的集合称为 项集。 如果一个项集包含k个项,那么就称为k-项集。比如{牛奶,咖啡}则称为2项集。B. 支持度: 支持度用来确定给定数据集的频繁程度,即给定数据集在所有的数据集中出现的频率,例如s(X -> Y) = P(X,Y) / N C. 置信度: 置信度则是用来确定Y在包含X的事务中出现的频繁程度,即 c(X -> Y) = P(X,Y) / P(X)3. 关联分析算法的基本原理支持度和置信度的意义在于,支持度是一个重要的度量,如果支持度很低,代表这个规则其实只是偶然出现,基本没有意义。因此,支持度通常用来删除那些无意义的规则。而置信度则是通过规则进行推理具有可靠性。用c(X->Y)来说,只有置信度越高,Y出现在包含X的事务中的概率才越大,否则这个规则也没有意义。通常我们在做关联规则发现的时候都会设定支持度和置信度阈值 minsup 和minconf , 而关联规则发现则是发现那些支持度大于等于minsup 并且置信度大于 minconf的所有规则。所以,提高关联分析算法效率最简单的办法则是提高支持度和置信度的阈值。所以,通过上面的概念,我们可以很自然地想到,关联分析的基本算法:A. 找到满足最小支持度阈值的所有项集,我们称之为频繁项集。(例如频繁二项集,频繁三项集)B. 从频繁项集中找到满足最小置信度的所有规则。4. 关联分析算法的评估A. 兴趣度的客观度量首先,我们来考虑一下支持度-置信度框架的局限性。首先是支持度,举例来说,在图书市场中,文学类书籍的数量远大于物理类书籍,那么物理类书籍的规则支持度就会很低,这样就导致很多物理类书籍的关联规则都被过滤掉了。接下来是置信度,举例来说,我们对1000人做度量,发现有200人喜欢喝茶,其中有150人喜欢喝咖啡,50人不喜欢,那么我们通过置信度计算发现c(喝茶 -> 喝咖啡)这个的置信度非常高,我们于是可以推算出喜欢喝茶的人都喜欢喝咖啡。但是其实我们看接下来的调查,另外不喜欢喝茶的800人中,有650人喜欢喝咖啡。 综上所述,我们可以发现,其实喝茶和喝咖啡其实是两个独立事件。所以我们可以概括一下,置信度的缺点,就是置信度度量忽略了规则后件中项集的支持度。(A) 为了解决这个问题,我们引入一个度量,称为提升度(lift),来计算置信度和规则后件项集支持度的比率:lift(A->B) = c(A->B) / s(B) 那么对于二元项集来说,我们可以做这样一个变换:lift(X->Y) = c(X->Y) / s(Y) = ( p(X,Y) / p(X) ) / p(Y) = p(X,Y) / p(X)p(Y)那么这里,我们则可以把lift(X->Y)称为兴趣因子,表示为I(A,B)通过概率学知识我们可以知道,如果X事件和Y事件相互独立(或者我们称之为满足事件独立性假设),那么p(X,Y) = p(X) * p(Y),那么我们则可以这样来表示兴趣因子的度量:当I(A,B) = 1时,我们称A和B是相互独立的,当I(A,B) < 1时,我们称A和B是负相关的,否则我们称A和B是正相关的。但是从这个简陋的计算模型,我们就可以很轻易地感觉出单纯用兴趣因子来做关联度度量的不靠谱。例子特别容易找了。(B) 对应兴趣因子,还有另外一种相关分析,IS度量等各种兴趣度客观度量方式。

94 评论(11)

Tequila1114

同是追梦小伙伴,给你一点自己的小建议:1)大纲中的内容要全部掌握,参考书尽量看。(CDA数据分析师官网都有相关的教材推荐,一定要去官网看最新的,每年教材可能会有调整,以官网为准。)2)复习到位的话,理论题分数差距不大,重点在实操题,多动手,多尝试。(有难度就报个CDA课程培训,真的很受益,尤其是实操题,当你听过CDA的老师是如何结合实例为你讲解剖析的话,你真的会拍手称赞,行业大牛都在那里,绝对不花冤枉钱)3)做好日常的学习工作,空闲时间补充自己。(利用自己的下空闲,把理论的东西吃透,把以前看过的《数据挖掘技术》再翻过来看看,应该会有些新的理解。)最后,助你考试成功。

304 评论(8)

pangdaxiang

【报考条件】Level I:无要求,皆可报考Level II:(满足以下之一皆可报名)1. 获得CDA Level Ⅰ认证证书2. 本科及以上学历需从事数据分析相关工作1年以上3. 本科以下学历需从事数据分析相关工作2年以上Level III:(满足以下之一皆可报名)1. 获得CDA Level Ⅱ认证证书2. 本科及以上学历需从事数据分析相关工作3年以上3. 本科以下学历需从事数据分析相关工作4年以上 (注:上述数据分析相关工作不限制行业,工作可涉及统计,数据分析,数据挖掘,数据库,数据管理,大数据架构等内容。)【考试方式】CDA Level Ⅰ和Level Ⅱ为线下统考,上机答题。考生报名后根据准考证信息到考试地点参加考试。CDA Level III为分为线下上机考试+线上答辩面试两个部分。【考试内容】Level Ⅰ业务数据分析师:120分钟,客观题(单选+多选),闭卷,上机答题。考点请参考CDA Level Ⅰ考试大纲。Level Ⅱ建模分析师:90分钟,客观题(单选+多选),上机答题;120分钟,案例操作,闭卷,自行携带电脑操作(安装好带有数据挖掘功能的软件如:SQL,SPSS MODELER,R,PYTHON,SAS,WEKA,等,进行案例操作分析。案例数据将统一提供CSV文件)。考点请参考CDA Level Ⅱ建模分析师考试大纲。Level Ⅱ大数据分析师:150分钟,客观题(单选+多选),闭卷,上机答题。考点请参考CDA Level Ⅱ大数据分析师考试大纲。Level Ⅲ数据科学家:第一阶段:150分钟,客观题+主观题,闭卷,上机答题。第二阶段:1个月内,项目案例,开卷。提交项目结果,60分钟,线上答辩面试。(第一阶段考试通过者,才有资格参与第二阶段面试)。考点请参考CDA Level Ⅲ大数据分析师考试大纲。

132 评论(14)

相关问答