天生萌妹
大数据开发工程师课程体系——Java部分。第一阶段:静态网页基础1、学习Web标准化网页制作,必备的HTML标记和属性2、学习HTML表格、表单的设计与制作3、学习CSS、丰富HTML网页的样式4、通过CSS布局和定位的学习、让HTML页面布局更加美观5、复习所有知识、完成项目布置第二阶段:JavaSE+JavaWeb1、掌握JAVASE基础语法2、掌握JAVASE面向对象使用3、掌握JAVASEAPI常见操作类使用并灵活应用4、熟练掌握MYSQL数据库的基本操作,SQL语句5、熟练使用JDBC完成数据库的数据操作6、掌握线程,网络编程,反射基本原理以及使用7、项目实战 + 扩充知识:人事管理系统第三阶段:前端UI框架1、JAVASCRIPT2、掌握Jquery基本操作和使用3、掌握注解基本概念和使用4、掌握版本控制工具使用5、掌握easyui基本使用6、项目实战+扩充知识:项目案例实战POI基本使用和通过注解封装Excel、druid连接池数据库监听,日志Log4j/Slf4j第四阶段:企业级开发框架1、熟练掌握spring、spring mvc、mybatis/2、熟悉struts23、熟悉Shiro、redis等4、项目实战:内容管理系统系统、项目管理平台流程引擎activity,爬虫技术nutch,lucene,webService CXF、Tomcat集群 热备 MySQL读写分离以上Java课程共计384课时,合计48天!大数据开发工程师课程体系——大数据部分第五阶段:大数据前传大数据前篇、大数据课程体系、计划介绍、大数据环境准备&搭建第六阶段:CentOS课程体系CentOS介绍与安装部署、CentOS常用管理命令解析、CentOS常用Shell编程命令、CentOS阶段作业与实战训练第七阶段:Maven课程体系Maven初识:安装部署基础概念、Maven精讲:依赖聚合与继承、Maven私服:搭建管理与应用、Maven应用:案列分析、Maven阶段作业与实战训练第八阶段:HDFS课程体系Hdfs入门:为什么要HDFS与概念、Hdfs深入剖析:内部结构与读写原理、Hdfs深入剖析:故障读写容错与备份机制、HdfsHA高可用与Federation联邦、Hdfs访问API接口详解、HDFS实战训练、HDFS阶段作业与实战训练第九阶段:MapReduce课程体系MapReduce深入剖析:执行过程详解、MapReduce深入剖析:MR原理解析、MapReduce深入剖析:分片混洗详解、MapReduce编程基础、MapReduce编程进阶、MapReduc阶段作业与实战训练第十阶段:Yarn课程体系Yarn原理介绍:框架组件流程调度第十一阶段:Hbase课程体系Yarn原理介绍:框架组件流程调度、HBase入门:模型坐标结构访问场景、HBase深入剖析:合并分裂数据定位、Hbase访问Shell接口、Hbase访问API接口、HbaseRowkey设计、Hbase实战训练第十二阶段:MongoDB课程体系MongoDB精讲:原理概念模型场景、MongoDB精讲:安全与用户管理、MongoDB实战训练、MongoDB阶段作业与实战训练第十三阶段:Redis课程体系Redis快速入门、Redis配置解析、Redis持久化RDB与AOF、Redis操作解析、Redis分页与排序、Redis阶段作业与实战训练第十四阶段:Scala课程体系Scala入门:介绍环境搭建第1个Scala程序、Scala流程控制、异常处理、Scala数据类型、运算符、Scala函数基础、Scala常规函数、Scala集合类、Scala类、Scala对象、Scala特征、Scala模式匹配、Scala阶段作业与实战训练第十五阶段:Kafka课程体系Kafka初窥门径:主题分区读写原理分布式、Kafka生产&消费API、Kafka阶段作业与实战训练第十六阶段:Spark课程体系Spark快速入门、Spark编程模型、Spark深入剖析、Spark深入剖析、SparkSQL简介、SparkSQL程序开发光速入门、SparkSQL程序开发数据源、SparkSQL程序开DataFrame、SparkSQL程序开发DataSet、SparkSQL程序开发数据类型、SparkStreaming入门、SparkStreaming程序开发如何开始、SparkStreaming程序开发DStream的输入源、SparkStreaming程序开发Dstream的操作、SparkStreaming程序开发程序开发--性能优化、SparkStreaming程序开发容错容灾、SparkMllib 解析与实战、SparkGraphX 解析与实战第十七阶段:Hive课程提体系体系结构机制场景、HiveDDL操作、HiveDML操作、HiveDQL操作、Hive阶段作业与实战训练第十八阶段:企业级项目实战1、基于美团网的大型离线电商数据分析平台2、移动基站信号监测大数据3、大规模设备运维大数据分析挖掘平台4、基 于互联网海量数据的舆情大数据平台项目以上大数据部分共计学习656课时,合计82天!0基础大数据培训课程共计学习130天。以上是大数据开发培训内容,加米谷是线下面授小班教学!
雁归来无痕
(1)统计学:参数检验、非参检验、回归分析等。
(2)数学:线性代数、微积分等。
(3)社会学:主要是一些社会学量化统计的知识,如问卷调查与统计分析;还有就是一些社会学的知识,这些对于从事营销类的数据分析人员比较有帮助。
(4)经济金融:如果是从事这个行业的数据分析人员,经济金融知识是必须的。
(5)计算机:从事数据分析工作的人必须了解你使用的数据是怎么处理出来的,要了解数据库的结构和基本原理,同时如果条件充足的话,你还能有足够的能力从数据库里提取你需要的数据(比如使用SQL进行查询),这种提取数据分析原材料的能力是每个数据从业者必备的。
此外,如果要想走的更远,还要能掌握一些编程能力,从而借住一些专业的数据分析工具,帮助你完成工作。
大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
大数据包括结构化、半结构化和非结构化数据,非结构化数据越来越成为数据的主要部分。据IDC的调查报告显示:企业中80%的数据都是非结构化数据,这些数据每年都按指数增长60%。
大数据就是互联网发展到现今阶段的一种表象或特征而已,没有必要神话它或对它保持敬畏之心,在以云计算为代表的技术创新大幕的衬托下,这些原本看起来很难收集和使用的数据开始容易被利用起来了,通过各行各业的不断创新,大数据会逐步为人类创造更多的价值。
参考资料:百度百科-大数据
hailanlan75
①JavaSE核心技术
②Hadoop生态圈(Hadoop平台核心技术、Hive开发、HBase开发)
③Spark相关技术(Spark相关技术、Scala基本编程)
④掌握Python基本使用、核心库的使用、Python爬虫、简单数据分析,理解Python机器学习
⑤大数据项目开发实战
⑥大数据系统管理优化
⑦掌握企业使用阿里云大数据平台开发所需要的技能
刀刀吹雪
一、基础部分:JAVA语言 和 LINUX系统
二、数据开发:
1、数据分析与挖掘
一般工作包括数据清洗,执行分析和数据可视化。学习Python、数据库、网络爬虫、数据分析与处理等。
大数据培训一般是指大数据开发培训。
大数据技术庞大复杂,基础的技术包含数据的采集、数据预处理、分布式存储、数据库、数据仓库、机器学习、并行计算、可视化等各种技术范畴和不同的技术层面。
2、大数据开发
数据工du程师建设和优化系统。学习hadoop、spark、storm、超zhi大集群调优、机器学习、Docker容器引擎、ElasticSearch、并发编程等;
课程学习一共分为六个阶段:
MidnightAngel
第一阶段Java语言基础01Java开发介绍02熟悉Eclipse开发工具03Java语言基础04Java流程控制05Java字符串06Java数组与类和对象07数字处理类与核心技术08I/O与反射、多线程09Swing程序与集合类第二阶段HTML、CSS与JavaScript01PC端网站布局02HTML5+CSS3基础03WebApp页面布局04原生JavaScript交互功能开发05Ajax异步交互06JQuery应用第三阶段JavaWeb和数据库01数据库02JavaWeb开发核心03JavaWeb开发内幕第四阶段Linux基础01Linux安装与配置02系统管理与目录管理03用户与用户组管理04Shell编程05服务器配置06Vi编辑器与Emacs编辑器第五阶段Hadoop生态体系01Hadoop起源与安装02MapReduce快速入门03Hadoop分布式文件系统04Hadoop文件I/O详解05MapReduce工作原理06MapReduce编程开发07Hive数据仓库工具08开源数据库HBase09Sqoop与Oozie第六阶段Spark生态体系01Spark简介02Spark部署和运行03Spark程序开发04Spark编程模型05作业执行解析06Spark SQL与DataFrame07深入Spark Streaming08Spark MLlib与机器学习09GraphX与SparkR10spark项目实战11scala编程12Python编程第七阶段Storm实时开发01storm简介与基本知识02拓扑详解与组件详解03Hadoop分布式系统04spout详解与bolt详解05zookeeper详解06storm安装与集群搭建07storm-starter详解08开源数据库HBase09trident详解第八阶段项目案例01模拟双11购物平台02前端工程化与模块化应用主要都讲这些内容!
dp73255815
肯定是关于大数据或数据库整理、编程、挖掘,然后出报告。还有就是学习的工具有Hadoop、MapReduce、Sqoop、Spark、Python等。除了现场学习,现在互联网那么发达,肯定也有线上的课程,不然距离成本也好高,顾不过来的感觉……
水乡的风光
- apache superset -大数据可视化实时展示grafana/kobana了解详情- 文件存储格式 -apache文件存储格式多样化列式存储格式内存组成(parquet)了解详情- apache Doris -基于MPP的交互式SQL数据仓库解决报表多维分析在线报表和分析的数据仓库系统了解详情- 数仓建设 -对大数据BI系统提供数据支撑OLAP方案之apache kylin解决OLAP场景 压秒级查询巨大Hive表
sweetmiriam
如果是科班出身(数学/统计学/计算机/金融),最好是先系统培训,打一个基础,有一个知识框架后再通过实践进行学习。 培训的话找口碑好,大校区,实实在在的,都没什么问题的。现在市面上现在学开发的机构太多。鱼龙混杂。可以实地考察一下,在多重选择,多看一下大品牌,口碑好的。在学习的时候选择班型上,看你的学历和基础,如果你学历很低没有计算机基础,不要指望4个月的班型能让你脱胎换骨。
优质工程师考试问答知识库