对于单个CDH(Hadoop)群集安装,我应该使用哪个主机?

我开始使用Windows 7计算机,并build立了一个which I run using VirtualBox的Ubuntu Linux虚拟机。 The Cloudera Manager Free Edition version 4已经执行,我一直在使用localhost:7180的提示。

当提示问我“为CDH群集安装指定主机”时,我现在停滞不前。 我可以在Linux虚拟机中单独安装所有的Hadoop组件吗?

请帮助我指出我应该指定主持人的正确方向。

你可以指定你的机器的主机名。 它只会在你的机器上安装所有的东西。

是的,你可以单独在linux虚拟机上运行cdh。 你可以使用“独立”或“伪分布”模式。 恕我直言,这样做的最有效的方法是使用“伪分布式”模式。

在这种情况下,有多个Java虚拟机(JVM)正在运行,因此它们被模拟为具有多个节点(每个线程被模拟为群集节点)的群集。

Cloudera记录了如何将其部署为“伪分布”:

https://www.cloudera.com/documentation/enterprise/5-6-x/topics/cdh_qs_cdh5_pseudo.html

注意:3种部署cdh的方法:

  1. 独立:单独使用一台机器,具有独特的jvm
  2. 伪分布:单独使用一台机器,但是几个jvm,如此模拟成一个集群
  3. 分布式:使用一个集群,所以有几个不同目的的节点(worker,namenode等)。