在 Hadoop 伪分布式模式下充分利用所有内核-Java问题

Full utilization of all cores in Hadoop pseudo-distributed mode(在 Hadoop 伪分布式模式下充分利用所有内核)

本文介绍了在 Hadoop 伪分布式模式下充分利用所有内核的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

我在我的 4 核笔记本电脑上以伪分布式模式运行任务.如何确保所有核心都得到有效使用.目前，我的作业跟踪器显示一次只执行一项作业.这是否意味着只使用一个核心?

I am running a task in pseudo-distributed mode on my 4 core laptop. How can I ensure that all cores are effectively used. Currently my job tracker shows that only one job is executing at a time. Does that mean only one core is used?

以下是我的配置文件.

conf/core-site.xml:

<configuration>
   <property>
       <name>fs.default.name</name>
       <value>hdfs://localhost:9000</value>
   </property>
 </configuration>

conf/hdfs-site.xml:

<configuration>
  <property>
       <name>dfs.replication</name>
       <value>1</value>
  </property>
</configuration>

conf/mapred-site.xml:

<configuration>
   <property>
        <name>mapred.job.tracker</name>
        <value>localhost:9001</value>  
   </property>

</configuration>

根据答案，我需要在 mapred-site.xml 中添加以下属性

As per the answer, I need to add the following properties in mapred-site.xml

 <property>
     <name>mapred.map.tasks</name> 
     <value>4</value> 
  </property>
  <property>
     <name>mapred.reduce.tasks</name> 
     <value>4</value> 
  </property>

在 Hadoop 伪分布式模式下充分利用所有内核

问题描述

推荐答案

基础教程推荐