博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
hadoop学习路线(转)
阅读量:5137 次
发布时间:2019-06-13

本文共 983 字,大约阅读时间需要 3 分钟。

刚刚入门hadoop,如何去学习hadoop。google一篇学习路线图,与童鞋们共勉:

转自:

-----------------------------------------------------


按照这个路线图来学习即可。

    1、M. Tim Jones的三篇文章:

    用Hadoop进行分布式数据处理第1部分(入门):

    用Hadoop进行分布式数据处理第2部分(进阶):

    用Hadoop进行分布式数据处理第3部分(应用程序开发):


    2、“银河里的星星”的博客,其中的Google论文系列(就包括开创性论文“MapReduce:简化大集群上的数据处理”)、搜索与分布式方面的介绍

    [google论文三]MapReduce简化大集群上的数据处理:

    词频统计的Map/Reduce程序可以从这里找到:

    Google论文系列:

    按照Hadoop各组件来串联:

    

    3、IBM developerWorks上的其他Hadoop文章,在dw上用Hadoop关键字进行搜索,可以找到大量Hadoop的文章

    下面一些需要看:

    Hadoop Distributed File System简介:

    使用Apache Pig处理数据:

        

    4、《开源软件架构》中的介绍

    (卷1第8章)HDFS--Hadoop分布式文件系统:

    英文原文:
 (其中的卷1第8章)

    

    5、阿里集团数据平台的官方博客,包含大量Hadoop研究和应用经验

    

    

    6、百度搜索研发部的官方博客,主要包含分布式系统(Hadoop)、搜索技术、数据挖掘、大型网站架构等方面的经验

   [/url]


    7、董的博客,关于Hadoop、分布式系统的研究

    


    8、官方文档当然更不能少了,主要包括Hadoop集群的搭建,MapReduce的使用,HDFS架构方面的介绍

    优先看稳定版:

    最新版(包括下一代MapReduce即YARN的介绍):

        

    9、caibinbupt的博客,Hadoop源代码分析系列

    

    千与的专栏,Hadoop-0.20.0源码分析

    

    

    10、spork的博客,其中关于Hadoop的系列

    

    

    11、chinacloud的博客,其中的Hadoop架构、分布式系统设计方面的一些经验

    

    

    12、beanmoon的博客,其中的Hadoop系列

    

转载于:https://www.cnblogs.com/jamesf/p/4751607.html

你可能感兴趣的文章
linux4.1.36 解决 SPI 时钟找不到 不生成设备 device
查看>>
ibatis 中isNull, isNotNull与isEmpty, isNotEmpty区别(转)
查看>>
Mysql Insert Or Update语法例子
查看>>
python+Eclipse+pydev环境搭建
查看>>
1.8
查看>>
Android各个文件夹对应的分辨率?
查看>>
CentOS 7 安装与卸载MySQL
查看>>
bzoj 4545: DQS的trie
查看>>
IO流的读写
查看>>
Java 如何抛出异常、自定义异常
查看>>
c语言实现n!算法
查看>>
中文文本分类之TextRNN
查看>>
HUAS 1483 mex(莫队算法)
查看>>
asp邮件发送
查看>>
Android ListView下拉刷新 Demo
查看>>
Python-装饰器(Decorator)
查看>>
SAP虚拟机的使用方法
查看>>
剑指offer(41-45)编程题
查看>>
Linux套接字和I/O模型
查看>>
HTML 之 CSS
查看>>