fantienan002
比较好的大数据入门的书有《大数据日知录:架构与算法》。
《大数据日知录:架构与算法》是2014年电子工业出版社出版的图书,作者是张俊林。《大数据日知录:架构与算法》从架构与算法的角度全面梳理了大数据存储与处理的相关技术。大数据技术具有涉及的知识点异常众多且正处于快速演进发展过程中等特点。
其技术点包括底层的硬件体系结构、相关的基础理论、大规模数据存储系统、分布式架构设计、各种不同应用场景下的差异化系统设计思路、机器学习与数据挖掘并行算法以及层出不穷的新架构、新系统等。
主要介绍
本书对众多纷繁芜杂的相关技术文献和系统进行了择优汰劣并系统性地对相关知识分门别类地进行整理和介绍,将大数据相关技术分为大数据基础理论、大数据系统体系结构、大数据存储。
以及包含批处理、流式计算、交互式数据分析、图数据库、并行机器学习的架构与算法以及增量计算等技术分支在内的大数据处理等几个大的方向。通过这种体系化的知识梳理与讲解,相信对于读者整体和系统地了解、吸收和掌握相关的技术有很大的帮助与促进作用。
轻舞飞扬庆庆
学习大数据的小伙伴在小编看来总共分为两大类:一是本身就是计算机专业出身,有一定的编程基础,看到大数据的就业前景,想转战大数据行业的;二是本身不是计算机专业出身,没有一定的编程基础,依旧想要学习大数据的。1、没有编程基础对于没有编程基础的小伙伴,建议你先看一些编程语言的书籍,掌握一门编程语言是必须的,因为大数据技术是由编程语言进行开发的,至少是要掌握一门编程语言的,而且还要有扎实的基础。《Head First Java, 2nd Edition(中文版)》这本书不仅内容丰富、有趣且通俗易懂,并且涵盖了所有 Java 相关的基础知识。如果你是 Java 初学者,这本书正适合你。《Java 核心技术(卷1、2)》写作风格相比 Head First 趣味性来说更显传统,所涵盖的内容包括 Java 基础知识及高级应用,是对于入门来说的另一种选择。《Java 编程思想(第4版)》必读之作,不仅涵盖所有 Java 基础,对于编程思想层面的提升也有很好的帮助。2、有一定的编程基础《为数据而生》书中分别阐述在大数据1.0、大数据2.0和大数据3.0时代下,相对应的数据分析需要做到分析、外化、集成。《智能时代》这本书作者分七章从不同角度对大数据进行介绍,分别以技术和思维方式的改变为主线,从工业革命这个角度嵌入,顺理成章的延伸出大数据与智能化,但是没有将过多笔墨放在技术的深究上,而是选择从应用层面体现大数据的理念。大数据应用则会渗透到各行各业,这正是作者的用心之处。《R语言预测实战》R语言横跨了金融、生物、医学、互联网等多个领域,主要用于统计、建模及可视化。由于上手快、效率高,备受技术人员青睐。预测是大数据挖掘的主要作用之一,借助R语言来做大数据预测,可以兼具效率与价值于一身。《数据之巅》这本书中,从小数据时代到大数据的崛起,作者以宏大的历史观、文化观、大数据观,给我们描绘了一幅数据科学、智慧文化的全景图。《Hadoop权威指南》《Hadoop权威指南(中文版)》从Hadoop的缘起开始,由浅入深,结合理论和实践,全方位地介绍Hadoop这一高性能处理海量数据集的理想工具。《Hive编程指南》《Hive编程指南》是一本Apache Hive的编程指南,旨在介绍如何使用Hive的SQL方法HiveQL来汇总、查询和分析存储在Hadoop分布式文件系统上的大数据集合。以上就是大数据学习书籍推荐,想要学习大数据的小伙伴可以酌情参考了!
叮当木马
1、《Hadoop权威指南》现在3.1版本刚刚发布,但官方并不推荐在生产环境使用。作为hadoop的入门书籍,从2.x版本开始也不失为良策。本书从Hadoop的缘起开始,由浅入深,结合理论和实践,全方位地介绍Hadoop这一高性能处理海量数据集的理想工具。刚刚更新的版本中,相比之前的版本增加了介绍YARN , Parquet , Flume, Crunch , Spark的章节,非常适合于Hadoop 初学者。2、《Learning Spark》《Spark 快速大数据分析》是一本为Spark 初学者准备的书,它没有过多深入实现细节,而是更多关注上层用户的具体用法。不过,本书绝不仅仅限于Spark 的用法,它对Spark 的核心概念和基本原理也有较为全面的介绍,让读者能够知其然且知其所以然。3、《Spark机器学习:核心技术与实践》以实践方式助你掌握Spark机器学习技术。本书采用理论与大量实例相结合的方式帮助开发人员掌握使用Spark进行分析和实现机器学习算法。通过这些示例和Spark在各种企业级系统中的应用,帮助读者解锁Spark机器学习算法的复杂性,通过数据分析产生有价值的数据洞察力。
优质会计资格证问答知识库