【丫发卡源码】【java框架整合源码】【ceph 12 部署源码】hadoop2.2 源码-皮皮网

【丫发卡源码】【java框架整合源码】【ceph 12 部署源码】hadoop2.2 源码

2024-12-22 18:00:16 来源：厦门小程序源码分类：热点

1.å¦ä½å¨win7ä¸çeclipseä¸è°è¯Hadoop2.2.0çç¨åº
2.如何在Mac使用Intellij idea搭建远程Hadoop开发环境

hadoop2.2 源码

å¦ä½å¨win7ä¸çeclipseä¸è°è¯Hadoop2.2.0çç¨åº

ä¸é¢å¼å§è¿å¥æ£é¢:

åºå· åç§° æè¿°

1 eclipse Juno Service Release 4.2çæ¬

2 æä½ç³»ç» Windows7

3 hadoopçeclipseæä»¶ hadoop-eclipse-plugin-2.2.0.jar

4 hadoopçéç¾¤ç¯å¢ èææºLinuxçCentos6.5åæºä¼ªåå¸å¼

5 è°è¯ç¨åº Hellow World

éå°çå ä¸ªé®é¢å¦ä¸ï¼

Javaä»£ç

java.io.IOException: Could not locate executable null\bin\winutils.exe in the Hadoop binaries.

è§£å³åæ³:

å¨org.apache.hadoop.util.Shellç±»çcheckHadoopHome()æ¹æ³çè¿åå¼éååºå®ç

æ¬æºhadoopçè·¯å¾ï¼æ£ä»å¨è¿éæ´æ¹å¦ä¸ï¼

Javaä»£ç

private static String checkHadoopHome() {

// first check the Dflag hadoop.home.dir with JVM scope

//System.setProperty("hadoop.home.dir", "...");

String home = System.getProperty("hadoop.home.dir");

// fall back to the system/user-global env variable

if (home == null) {

home = System.getenv("HADOOP_HOME");

}

try {

// couldn't find either setting for hadoop's home directory

if (home == null) {

throw new IOException("HADOOP_HOME or hadoop.home.dir are not set.");

}

if (home.startsWith("\"") && home.endsWith("\"")) {

home = home.substring(1, home.length()-1);

}

// check that the home setting is actually a directory that exists

File homedir = new File(home);

if (!homedir.isAbsolute() || !homedir.exists() || !homedir.isDirectory()) {

throw new IOException("Hadoop home directory " + homedir

+ " does not exist, is not a directory, or is not an absolute path.");

}

home = homedir.getCanonicalPath();

} catch (IOException ioe) {

if (LOG.isDebugEnabled()) {

LOG.debug("Failed to detect a valid hadoop home directory", ioe);

}

home = null;

}

//åºå®æ¬æºçhadoopå°å

home="D:\\hadoop-2.2.0";

return home;

}

ç¬¬äºä¸ªå¼å¸¸ï¼Could not locate executable D:\Hadoop\tar\hadoop-2.2.0\hadoop-2.2.0\bin\winutils.exe in the Hadoop binaries. æ¾ä¸å°winä¸çæ§è¡ç¨åºï¼å¯ä»¥å»ä¸è½½binåï¼è¦çæ¬æºçhadoopè·ç®å½ä¸çbinåå³å¯

ç¬¬ä¸ä¸ªå¼å¸¸ï¼

Javaä»£ç

Exception in thread "main" java.lang.IllegalArgumentException: Wrong FS: hdfs://...:/user/hmail/output/part-, expected: file:///

at org.apache.hadoop.fs.FileSystem.checkPath(FileSystem.java:)

at org.apache.hadoop.fs.RawLocalFileSystem.pathToFile(RawLocalFileSystem.java:)

at org.apache.hadoop.fs.RawLocalFileSystem.getFileStatus(RawLocalFileSystem.java:)

at org.apache.hadoop.fs.FilterFileSystem.getFileStatus(FilterFileSystem.java:)

at org.apache.hadoop.fs.ChecksumFileSystem$ChecksumFSInputChecker.<init>(ChecksumFileSystem.java:)

at org.apache.hadoop.fs.ChecksumFileSystem.open(ChecksumFileSystem.java:)

at org.apache.hadoop.fs.FileSystem.open(FileSystem.java:)

at com.netease.hadoop.HDFSCatWithAPI.main(HDFSCatWithAPI.java:)

ç¬¬åä¸ªå¼å¸¸ï¼

Javaä»£ç

Exception in thread "main" java.lang.UnsatisfiedLinkError: org.apache.hadoop.io.nativeio.NativeIO$Windows.access0(Ljava/lang/String;I)Z

(2)å¨ç³»ç»åéçPathéï¼è¿½å %HADOOP_HOME%/binå³å¯

Javaä»£ç

package com.qin.wordcount;

import java.io.IOException;

import org.apache.hadoop.fs.FileSystem;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.io.IntWritable;

import org.apache.hadoop.io.LongWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapred.JobConf;

import org.apache.hadoop.mapreduce.Job;

import org.apache.hadoop.mapreduce.Mapper;

import org.apache.hadoop.mapreduce.Reducer;

import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;

import org.apache.hadoop.mapreduce.lib.input.TextInputFormat;

import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

import org.apache.hadoop.mapreduce.lib.output.TextOutputFormat;

/***

* Hadoop2.2.0æµè¯

* æ¾WordCountçä¾å

* @author qindongliang

* hadoopææ¯äº¤æµç¾¤ï¼

* */

public class MyWordCount {

/**

* Mapper

* **/

private static class WMapper extends Mapper<LongWritable, Text, Text, IntWritable>{

private IntWritable count=new IntWritable(1);

private Text text=new Text();

@Override

protected void map(LongWritable key, Text value,Context context)

throws IOException, InterruptedException {

String values[]=value.toString().split("#");

//System.out.println(values[0]+"========"+values[1]);

count.set(Integer.parseInt(values[1]));

text.set(values[0]);

context.write(text,count);

}

/**

* Reducer

* **/

private static class WReducer extends Reducer<Text, IntWritable, Text, Text>{

private Text t=new Text();

@Override

protected void reduce(Text key, Iterable<IntWritable> value,Context context)

throws IOException, InterruptedException {

int count=0;

for(IntWritable i:value){

count+=i.get();

}

t.set(count+"");

context.write(key,t);

}

/**

* æ¹å¨ä¸

* (1)shellæºç éæ·»å checkHadoopHomeçè·¯å¾

* (2)è¡ï¼FileUtilséé¢

* **/

public static void main(String[] args) throws Exception{

// String path1=System.getenv("HADOOP_HOME");

// System.out.println(path1);

// System.exit(0);

JobConf conf=new JobConf(MyWordCount.class);

//Configuration conf=new Configuration();

//conf.set("mapred.job.tracker","...:");

//è¯»åpersonä¸çæ°æ®åæ®µ

// conf.setJar("tt.jar");

//æ³¨æè¿è¡ä»£ç æ¾å¨æåé¢ï¼è¿è¡åå§åï¼å¦åä¼æ¥

/**Jobä»»å¡**/

Job job=new Job(conf, "testwordcount");

job.setJarByClass(MyWordCount.class);

System.out.println("æ¨¡å¼ï¼ "+conf.get("mapred.job.tracker"));;

// job.setCombinerClass(PCombine.class);

// job.setNumReduceTasks(3);//è®¾ç½®ä¸º3

job.setMapperClass(WMapper.class);

job.setReducerClass(WReducer.class);

job.setInputFormatClass(TextInputFormat.class);

job.setOutputFormatClass(TextOutputFormat.class);

job.setMapOutputKeyClass(Text.class);

job.setMapOutputValueClass(IntWritable.class);

job.setOutputKeyClass(Text.class);

job.setOutputValueClass(Text.class);

String path="hdfs://...:/qin/output";

FileSystem fs=FileSystem.get(conf);

Path p=new Path(path);

if(fs.exists(p)){

fs.delete(p, true);

System.out.println("è¾åºè·¯å¾åå¨ï¼å·²å é¤ï¼");

}

FileInputFormat.setInputPaths(job, "hdfs://...:/qin/input");

FileOutputFormat.setOutputPath(job,p );

System.exit(job.waitForCompletion(true) ? 0 : 1);

}

æ§å¶å°ï¼æå°æ¥å¿å¦ä¸ï¼

Javaä»£ç

INFO - Configuration.warnOnceIfDeprecated() | mapred.job.tracker is deprecated. Instead, use mapreduce.jobtracker.address

æ¨¡å¼ï¼ local

è¾åºè·¯å¾åå¨ï¼å·²å é¤ï¼

INFO - Configuration.warnOnceIfDeprecated() | session.id is deprecated. Instead, use dfs.metrics.session-id

INFO - JvmMetrics.init() | Initializing JVM Metrics with processName=JobTracker, sessionId=

WARN - JobSubmitter.copyAndConfigureFiles() | Hadoop command-line option parsing not performed. Implement the Tool interface and execute your application with ToolRunner to remedy this.

WARN - JobSubmitter.copyAndConfigureFiles() | No job jar file set. User classes may not be found. See Job or Job#setJar(String).

INFO - FileInputFormat.listStatus() | Total input paths to process : 1

INFO - JobSubmitter.submitJobInternal() | number of splits:1

INFO - Configuration.warnOnceIfDeprecated() | user.name is deprecated. Instead, use mapreduce.job.user.name

INFO - Configuration.warnOnceIfDeprecated() | mapred.output.value.class is deprecated. Instead, use mapreduce.job.output.value.class

INFO - Configuration.warnOnceIfDeprecated() | mapred.mapoutput.value.class is deprecated. Instead, use mapreduce.map.output.value.class

INFO - Configuration.warnOnceIfDeprecated() | mapreduce.map.class is deprecated. Instead, use mapreduce.job.map.class

INFO - C

如何在Mac使用Intellij idea搭建远程Hadoop开发环境

（1）准备工作

1）

安装JDK

6或者JDK

2）

安装scala

2..x

(注意版本)

2）下载Intellij

IDEA最新版（本文以IntelliJ

IDEA

Community

Edition

.1.1为例说明，不同版本，源码界面布局可能不同）

3）将下载的源码Intellij

IDEA解压后，安装scala插件，源码丫发卡源码流程如下：

依次选择“Configure”–>

“Plugins”–>

“Browse

repositories”，源码输入scala，源码然后安装即可

（2）搭建Spark源码阅读环境（需要联网）

一种方法是源码直接依次选择“import

project”–>

选择spark所在目录

–>

“SBT”，之后intellij会自动识别SBT文件，源码并下载依赖的源码外部jar包，整个流程用时非常长，源码取决于机器的源码java框架整合源码网络环境（不建议在windows

下操作，可能遇到各种问题），源码一般需花费几十分钟到几个小时。源码注意，源码下载过程会用到git，源码因此应该事先安装了git。ceph 12 部署源码

第二种方法是首先在linux操作系统上生成intellij项目文件，然后在intellij

IDEA中直接通过“Open

Project”打开项目即可。在linux上生成intellij项目文件的方法（需要安装git，不需要安装scala，sbt会自动下载）是众创空间源码：在

spark源代码根目录下，输入sbt/sbt

gen-idea

注：如果你在windows下阅读源代码，建议先在linux下生成项目文件，然后导入到windows中的intellij

IDEA中。

（3）搭建Spark开发环境

在intellij

IDEA中创建scala

project，并依次选择“File”–>

“project

structure”

–>

“Libraries”，word批量替换源码选择“+”，将spark-hadoop

对应的包导入，比如导入spark-assembly_2.-0.9.0-incubating-hadoop2.2.0.jar（只需导入该jar

包，其他不需要），如果IDE没有识别scala

库，则需要以同样方式将scala库导入。之后开发scala程序即可：

编写完scala程序后，可以直接在intellij中，以local模式运行，方法如下：

点击“Run”–>

“Run

Configurations”，在弹出的框中对应栏中填写“local”，表示将该参数传递给main函数，如下图所示，之后点击“Run”–>

“Run”运行程序即可。

如果想把程序打成jar包，通过命令行的形式运行在spark

集群中，可以按照以下步骤操作：

依次选择“File”–>

“Project

Structure”

–>

“Artifact”，选择“+”–>

“Jar”

–>

“From

Modules

with

dependencies”，选择main函数，并在弹出框中选择输出jar位置，并选择“OK”。

最后依次选择“Build”–>

“Build

Artifact”编译生成jar包。

更多内容请点击【热点】专栏

【丫发卡源码】【java框架整合源码】【ceph 12 部署源码】hadoop2.2 源码

精彩资讯

推荐内容

【丫发卡源码】【java框架整合源码】【ceph 12 部署 源码】hadoop2.2 源码

精彩资讯

推荐内容

【丫发卡源码】【java框架整合源码】【ceph 12 部署源码】hadoop2.2 源码