好程序员大数据入门学习之Hadoop技术优缺点

hcxy · · 715 次点击 · · 开始浏览    
这是一个创建于 的文章,其中的信息可能已经有所发展或是发生改变。

好程序员大数据入门学习之Hadoop技术优缺点

 

(1)Hadoop具有按位存储和处理数据能力的高可靠性。

(2)Hadoop通过可用的计算机集群分配数据,完成存储和计算任务,这些集群可以方便地扩展到数以千计的节点中,具有高扩展性。

(3)Hadoop能够在节点之间进行动态地移动数据,并保证各个节点的动态平衡,处理速度非常快,具有高效性。

(4)Hadoop能够自动保存数据的多个副本,并且能够自动将失败的任务重新分配,具有高容错性。

 

Hadoop的缺点

(1)Hadoop不适用于低延迟数据访问。

(2)Hadoop不能高效存储大量小文件。

(3)Hadoop不支持多用户写入并任意修改文件。

 

Hadoop的核心组件

Hadoop自诞生以来,主要出现了Hadoop1、Hadoop2、Hadoop3三个系列多个版本。

HDFS和MapReduce是Hadoop1的核心组件,Hadoop生态圈里的很多组件都是基于HDFS和MapReduce发展出来的。在继Hadoop1之后出现了Hadoop2,Hadoop2在Hadoop1的基础上做了改进。相比Hadoop1,Hadoop2的三大核心组件分别是HDFS、MapReduce、Yarn。目前市面上绝大部分企业使用的是Hadoop2,本书使用的是Hadoop2.7.3这一版本。

 

Hadoop2的一个公共模块和三大核心组件组成了四个模块,简介如下。

(1)HadoopCommon:为其他Hadoop模块提供基础设施。

(2)HDFS:具有高可靠性、高吞吐量的分布式文件系统。

(3)MapReduce:基于Yarn系统,分布式离线并行计算框架。

(4)Yarn:负责作业调度与集群资源管理的框架。

 

好程序员大数据培训的终极目标是将你培养成一名“复合型”研发人才,让你自己在掌握相关大数据技术的同时,也能够赢得一份高薪职位!好程序员大数据开发采用“T”字形的思维,以大数据的深度为主,以机器学习、云计算等作为宽度,相辅相成。此外好程序员大数据课程定期组织与一线名企的工程师进行面对面的就企业当下的项目讨论与研发,进而验证所学技术的正确方向。


有疑问加站长微信联系(非本文作者)

入群交流(和以上内容无关):加入Go大咖交流群,或添加微信:liuxiaoyan-s 备注:入群;或加QQ群:692541889

715 次点击  
加入收藏 微博
添加一条新回复 (您需要 登录 后才能回复 没有账号 ?)
  • 请尽量让自己的回复能够对别人有帮助
  • 支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`
  • 支持 @ 本站用户;支持表情(输入 : 提示),见 Emoji cheat sheet
  • 图片支持拖拽、截图粘贴等方式上传