Oracle DBA培训网-中国Oracle培训领航专家

您当前的位置:优技培训(CUUG) > Hadoop大数据 > Hadoop培训教程 >

Hadoop大数据教程:基于Java API实现作业提交

来源:优技培训(CUUG)

Hadoop大数据教程:基于Java API实现作业提交,使用Hadoop的提交命令就可以将在本地编译并打包好的程序提交到Hadoop集群运行,提交的脚本命令如下:

#!/bin/bash

#提交运行脚本

HADOOP_VERSION=1.0.4

jar_path = /usr/nuoline/wordcount/wordcount.jar #用户程序所在目录

HADOOP_HOME=/home/nuoline/Hadoop-$HADOOP_VERSION

input=/usr/nuoline/wordcount/input #HDFS中的输入路径

output=/usr/nuoline/wordcount/output #是HDFS中的输出路径

$HADOOP_HOME/bin/Hadoop jar $jar_path MyWordCount $input $output

在提交的脚本中至少需要指定HADOOP_HOME环境变量,同时还需要指定编译打包好的jar文件目录,执行命令后先根据HADOOP_HOME得到conf目录的配置文件,再确定提交集群的属性参数。

精华阅读