• 回答数

    7

  • 浏览数

    287

伊斯坦布尔之夜
首页 > 考试培训 > 大数据职业培训

7个回答 默认排序
  • 默认排序
  • 按时间排序

Mary瑶瑶

已采纳

大数据是现今发展的一大趋势,就业前景广阔,工资报酬较好,是很多人选择这个岗位的原因之一。大数据体系庞大,包括的知识很多,学习有一定难度。对于零基础小白来说,大数据线下培训学习时间5-6个月,如果按照加米谷的安排来学习大约要150天左右。如果你有扎实的Java基础,可能就可以省去前期的时间,直接学习后面的大数据内容,这样差不多需要3个月左右。

学习费用1w-3w不等,从拉勾网上查询的大数据人才的招聘信息,目前对于没有工作经验的大数据人才的薪资也在1万左右,携程、滴滴、百度等大型互联网企业也在招聘大数据人才。

大数据职业培训

266 评论(8)

吃尸体的秃鹰

1阶段:Java2阶段:JavaEE核心3阶段:Hadoop生态体系4阶段:大数据spark生态体系

112 评论(8)

木秀于森林

第一阶段Java语言基础01Java开发介绍02熟悉Eclipse开发工具03Java语言基础04Java流程控制05Java字符串06Java数组与类和对象07数字处理类与核心技术08I/O与反射、多线程09Swing程序与集合类第二阶段HTML、CSS与JavaScript01PC端网站布局02HTML5+CSS3基础03WebApp页面布局04原生JavaScript交互功能开发05Ajax异步交互06JQuery应用第三阶段JavaWeb和数据库01数据库02JavaWeb开发核心03JavaWeb开发内幕第四阶段Linux基础01Linux安装与配置02系统管理与目录管理03用户与用户组管理04Shell编程05服务器配置06Vi编辑器与Emacs编辑器第五阶段Hadoop生态体系01Hadoop起源与安装02MapReduce快速入门03Hadoop分布式文件系统04Hadoop文件I/O详解05MapReduce工作原理06MapReduce编程开发07Hive数据仓库工具08开源数据库HBase09Sqoop与Oozie第六阶段Spark生态体系01Spark简介02Spark部署和运行03Spark程序开发04Spark编程模型05作业执行解析06Spark SQL与DataFrame07深入Spark Streaming08Spark MLlib与机器学习09GraphX与SparkR10spark项目实战11scala编程12Python编程第七阶段Storm实时开发01storm简介与基本知识02拓扑详解与组件详解03Hadoop分布式系统04spout详解与bolt详解05zookeeper详解06storm安装与集群搭建07storm-starter详解08开源数据库HBase09trident详解第八阶段项目案例01模拟双11购物平台02前端工程化与模块化应用主要都讲这些内容!

358 评论(14)

猪猪钕神

大数据培训机构有:企赢大数据培训学院、传智播客大数据培训学院、产品手记大数据培训机构、传一大数据培训机构、黑马大数据培训机构。具体介绍如下:

1、企赢培训学院:

企赢培训学院的优势,企业自己的案例和业内标杆企业案例结合,讲师针对性讲解;多年研发企业的研发实践和产品管理经验总结,课程系统全面。从市场需求到产品规划整个过程中具体工具和方法介绍;小组方式实际演练,体会上述工具在市场需求分析、产品规划中的运用。

2、传智播客培训学院:

传智播客培训学院于每年暑期举办“全国高校IT骨干教师师资培训”独家承办由工业和信息化部软件与集成电路促进中心举办的“国家信息技术紧缺人才培训工程(软件开发与应用)全国骨干教师暑期研修班”,共有195所院校的617名教师参加培训。

3、产品手记培训机构:

产品手记培训机构具有完全真实互联网公司化教学体制,BAT产品专家(职位高于总监)全天面授,全方位产品干货及实战经验指导,根据个人实际工作经验定向培养特定方向的产品经理。

产品专家亲临面授,互动性强,可以更快速吸引产品知识;一周五天脱产学习,学习持久,全方向提升产品综合能力;每期限定15人上课,精品小班,更有针对性地培养每位学员。

4、传一大数据培训机构:

传一大数据培训机构拥有自主研发的全套系列理论教材、项目实战手册,以及完善项目管控体系及MOOC线上教学平台。在如此完善的学术沉淀的引领下,造就了数千人的成功就业,同时获得了众多省内知名企业的认可;

先后与星网锐捷、网龙、睿能、万利达、鑫诺、厦华、雅迅、巨龙等知名企业签订人才战略合作,并为网龙、中国邮政、亿力科技、日立集团等多家大型企业实施员工内训。 高质量的师资团队保证了传一科技高水平、高质量的教学。

5、黑马高端大数据培训机构:

黑马高端大数据培训机构已经建立自己的大学,打造涵盖中小学基础教育、职业教育、继续教育在内的全套教育生态链,从开端启蒙教育到成年后的职业应用教育,从根本上解决以“人”为单位的系统化教育培训问题。

283 评论(13)

sunyang625

相对于普通的前后端开发这种大众化的专业来说,能够培训大数据的机构属于少数的比较小众的大数据培训机构的,学员也比较少,通常一个班的人数都在30个人以内像大数据这样比较新的又高端的技术方向的话,能够教得了的一定得是有实力的机构,所以这个培训机构背后公司的实力非常重要,因为大数据程序员的薪水很高,大数据,技术讲师的薪水肯定也比普通的讲师的薪水要高,所以没有实力,的机构是不可能有好的师资的所以只有那些位于核心城市核心地段的,能够做到全程面授小班授课的大型机构才会比较好一些

147 评论(12)

冒火得很000

Sqoop:(发音:skup)作为一款开源的离线数据传输工具,主要用于Hadoop(Hive) 与传统数据库(MySql,PostgreSQL)间的数据传递。它可以将一个关系数据库中数据导入Hadoop的HDFS中,也可以将HDFS中的数据导入关系型数据库中。

Flume:实时数据采集的一个开源框架,它是Cloudera提供的一个高可用用的、高可靠、分布式的海量日志采集、聚合和传输的系统。目前已经是Apache的顶级子项目。使用Flume可以收集诸如日志、时间等数据并将这些数据集中存储起来供下游使用(尤其是数据流框架,例如Storm)。和Flume类似的另一个框架是Scribe(FaceBook开源的日志收集系统,它为日志的分布式收集、统一处理提供一个可扩展的、高容错的简单方案)大数据分析培训课程内容有哪些

Kafka:通常来说Flume采集数据的速度和下游处理的速度通常不同步,因此实时平台架构都会用一个消息中间件来缓冲,而这方面最为流行和应用最为广泛的无疑是Kafka。它是由LinkedIn开发的一个分布式消息系统,以其可以水平扩展和高吞吐率而被广泛使用。目前主流的开源分布式处理系统(如Storm和Spark等)都支持与Kafka 集成。

Kafka是一个基于分布式的消息发布-订阅系统,特点是速度快、可扩展且持久。与其他消息发布-订阅系统类似,Kafka可在主题中保存消息的信息。生产者向主题写入数据,消费者从主题中读取数据。浅析大数据分析技术

作为一个分布式的、分区的、低延迟的、冗余的日志提交服务。和Kafka类似消息中间件开源产品还包括RabbiMQ、ActiveMQ、ZeroMQ等。

MapReduce:MapReduce是Google公司的核心计算模型,它将运行于大规模集群上的复杂并行计算过程高度抽象为两个函数:map和reduce。MapReduce最伟大之处在于其将处理大数据的能力赋予了普通开发人员,以至于普通开发人员即使不会任何的分布式编程知识,也能将自己的程序运行在分布式系统上处理海量数据。

Hive:MapReduce将处理大数据的能力赋予了普通开发人员,而Hive进一步将处理和分析大数据的能力赋予了实际的数据使用人员(数据开发工程师、数据分析师、算法工程师、和业务分析人员)。大数据分析培训课程大纲

Hive是由Facebook开发并贡献给Hadoop开源社区的,是一个建立在Hadoop体系结构上的一层SQL抽象。Hive提供了一些对Hadoop文件中数据集进行处理、查询、分析的工具。它支持类似于传统RDBMS的SQL语言的查询语言,一帮助那些熟悉SQL的用户处理和查询Hodoop在的数据,该查询语言称为Hive SQL。Hive SQL实际上先被SQL解析器解析,然后被Hive框架解析成一个MapReduce可执行计划,并按照该计划生产MapReduce任务后交给Hadoop集群处理。

Spark:尽管MapReduce和Hive能完成海量数据的大多数批处理工作,并且在打数据时代称为企业大数据处理的首选技术,但是其数据查询的延迟一直被诟病,而且也非常不适合迭代计算和DAG(有限无环图)计算。由于Spark具有可伸缩、基于内存计算能特点,且可以直接读写Hadoop上任何格式的数据,较好地满足了数据即时查询和迭代分析的需求,因此变得越来越流行。

Spark是UC Berkeley AMP Lab(加州大学伯克利分校的 AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,它拥有Hadoop MapReduce所具有的优点,但不同MapReduce的是,Job中间输出结果可以保存在内存中,从而不需要再读写HDFS ,因此能更好适用于数据挖掘和机器学习等需要迭代的MapReduce算法。

Spark也提供类Live的SQL接口,即Spark SQL,来方便数据人员处理和分析数据。

Spark还有用于处理实时数据的流计算框架Spark Streaming,其基本原理是将实时流数据分成小的时间片段(秒或几百毫秒),以类似Spark离线批处理的方式来处理这小部分数据。

Storm:MapReduce、Hive和Spark是离线和准实时数据处理的主要工具,而Storm是实时处理数据的。

Storm是Twitter开源的一个类似于Hadoop的实时数据处理框架。Storm对于实时计算的意义相当于Hadoop对于批处理的意义。Hadoop提供了Map和Reduce原语,使对数据进行批处理变得非常简单和优美。同样,Storm也对数据的实时计算提供了简单的Spout和Bolt原语。Storm集群表面上和Hadoop集群非常像,但是在Hadoop上面运行的是MapReduce的Job,而在Storm上面运行的是Topology(拓扑)。

Storm拓扑任务和Hadoop MapReduce任务一个非常关键的区别在于:1个MapReduce Job最终会结束,而一个Topology永远运行(除非显示的杀掉它),所以实际上Storm等实时任务的资源使用相比离线MapReduce任务等要大很多,因为离线任务运行完就释放掉所使用的计算、内存等资源,而Storm等实时任务必须一直占有直到被显式的杀掉。Storm具有低延迟、分布式、可扩展、高容错等特性,可以保证消息不丢失,目前Storm, 类Storm或基于Storm抽象的框架技术是实时处理、流处理领域主要采用的技术。

Flink:在数据处理领域,批处理任务和实时流计算任务一般被认为是两种不同的任务,一个数据项目一般会被设计为只能处理其中一种任务,例如Storm只支持流处理任务,而MapReduce, Hive只支持批处理任务。

Apache Flink是一个同时面向分布式实时流处理和批量数据处理的开源数据平台,它能基于同一个Flink运行时(Flink Runtime),提供支持流处理和批处理两种类型应用的功能。Flink在实现流处理和批处理时,与传统的一些方案完全不同,它从另一个视角看待流处理和批处理,将二者统一起来。Flink完全支持流处理,批处理被作为一种特殊的流处理,只是它的数据流被定义为有界的而已。基于同一个Flink运行时,Flink分别提供了流处理和批处理API,而这两种API也是实现上层面向流处理、批处理类型应用框架的基础。大数据分析要学什么

Beam:Google开源的Beam在Flink基础上更进了一步,不但希望统一批处理和流处理,而且希望统一大数据处理范式和标准。Apache Beam项目重点在于数据处理的的编程范式和接口定义,并不涉及具体执行引擎的实现。Apache Beam希望基于Beam开发的数据处理程序可以执行在任意的分布式计算引擎上。

Apache Beam主要由Beam SDK和Beam Runner组成,Beam SDK定义了开发分布式数据处理任务业务逻辑的API接口,生成的分布式数据处理任务Pipeline交给具体的Beam Runner执行引擎。Apache Flink目前支持的API是由Java语言实现的,它支持的底层执行引擎包括Apache Flink、Apache Spark和Google Cloud Flatform。

相关推荐:

《大数据分析方法》、《转行大数据分析师后悔了》、《大数据分析师工作内容》、《学大数据分析培训多少钱》、《大数据分析培训课程大纲》、《大数据分析培训课程内容有哪些》、《大数据分析方法》、《大数据分析十八般工具》

315 评论(11)

蚊蚊mandy

你好,分两个方面来回答你的问题。

一、大数据培训费用

1、大数据培训的学费一般在2-3万左右,相对于一些学生来说比较贵了。

2、大数据开发岗位薪资目前在15K以上,按照投入产出比来说不贵。

二、大数据学习需要多长时间?

1、脱产全日制学习6个月。

119 评论(13)

相关问答