Oracle DBA培训网-中国Oracle培训领航专家

您当前的位置:优技培训(CUUG) > Hadoop大数据 > Hadoop培训教程 >

Hadoop大数据教程:基于Java API实现的编译

来源:优技培训(CUUG)

Hadoop大数据教程:基于Java API实现的编译,如果用户使用Eclipse开发,则需要导入hadoop-core-x.y.x.jar核心包,由于Eclipse会自动编译,则直接使用export功能导出词频统计的jar包即可;如果使用Linux中的vim开发,则应使用下面的方法进行编译并打包。

在上节Java实现中有三个类:WordcountMapper.java、WordcountReducer.java、MyWordCount.java,用户的当前工作目录只有这三个Java文件,则编译脚本如下:

#!/bin/bash

#编译并打包单词统计MapReduce程序

HADOOP_VERSION=1.0.4

HADOOP_HOME=/home/nuoline/Hadoop-$HADOOP_VERSION

LIB=${HADOOP_HOME}/Hadoop-core-${HADOOP_VERSION}.jar

mkdir wordcount

javac –cp $LIB –d wordcount *.java

jar -cvf /usr/nuoline/wordcount.jar -C wordcount/

在该脚本中的HADOOP_HOME是Hadoop的安装目录,LIB是词频统计的依赖库,只需要Hadoop-core-${HADOOP_VERSION}.jar核心包就可以。执行上述脚本就可以编译并打包词频统计程序。

精华阅读