有了Hadoop 2.2的最新发行版,我发现发行说明提到这个版本在Windows上运行Hadoop有很大的改进。 我昨天下载了Hadoop 2.2,并且看到很多.cmd文件和.sh文件,这些文件可以确保这个版本具有在Windows环境下运行Hadoop的脚本和batch file。 不过,在查看Apache Hadoop文档时,我找不到有关如何在Windows上安装和运行这个更新版本的分步说明。 除此之外,看起来新版本已经embedded了YARN体系结构,并且在线上的一些教程中提供的旧configuration可能已经过时,并且不再适用。 有没有在线提供的Hadoop 2.2的良好文档? 我希望它专门用于在Windows下运行Hadoop。
如果我们直接采用Apache Hadoop 2.2.0发行版的二进制发行版,并尝试在Microsoft Windows上运行它,那么我们将遇到错误util.Shell:无法找到hadoop二进制路径中的winutils二进制文件。
Apache Hadoop 2.2.0发行版的二进制发行版不包含一些Windows原生组件(如winutils.exe,hadoop.dll等)。 这些是必需的(不是可选的)在Windows上运行Hadoop。
所以你需要在hadoop源代码分发版的BUILD.txt文件之后,从源代码编译hadoop的windows native二进制发行版。 您也可以按照以下文章的步骤一步一步指导屏幕截图
在Microsoft Windows操作系统中构建,安装,配置和运行Apache Hadoop 2.2.0
我正在寻找同样的事情。 我发现hortonworks interesteing。 他们致力于在Windows上安装hadoop。 我试了一下,但我仍然在启动所有服务时出错。 我在他们的论坛中收到的唯一建议是删除所有安装的东西并重新安装整个东西。 我还没有这样做。
作为一个prerequesite,你将需要有你的Windows在64位上运行。
试试看,让我知道,如果它在您的网站上工作。 在hortonworks网站上有一个“一步到一步”的指南。
干杯1月