为什么Hadoop与linux紧密结合?

我是Hadoop的新手。 Hadoop与Linux紧密结合的具体原因是什么?它运行的集群是同构的?

我正在寻找真正具体的细节,可以告诉我,为什么Hadoop不能很好地与Windows,以及如果有一些图书馆涉及一些特定的脚本?

我的项目是在不使用Cygwin的情况下部署Hadoop。 我已经看到了Hayes Davis的文章,他解释了如何在没有Cygwin的情况下安装Hadoop,但他说有一些bug。 我可能会从头开始在Windows上正确configurationHadoop,但是如果有人能够解释什么,具体来说就是Hadoop在Windows上无法正常工作的原因,这将非常有帮助。

根据他们的快速入门页面 ,它还没有经过很好的测试。

  • 支持GNU / Linux作为开发和生产平台。 已经在具有2000个节点的GNU / Linux群集上演示了Hadoop。
  • Win32被支持作为开发平台。 分布式操作在Win32上没有经过很好的测试,所以不支持作为生产平台。

与大多数人意识到的Windows相比,Windows有更好的远程管理支持,但是在设置大型计算场的方便性(和价格标签)方面,击败Linux依然很困难。 这只是一个猜测,但是也许那些需要建立如此大规模集群的研究人员不太可能将大部分预算投入到操作系统许可中。

您是否知道Microsoft和Hortonworks正在协作的Hadoop工作,实质上是对Apache项目进行了本地Windows支持的更改?

该项目仍处于预览阶段, Azure上的Hadoop是首次部署。 这是在Windows Azure云中的Windows server 2008 R2上运行的Hadoop。 它也可用于建立自己的群集的场所安装。

我建议学习更多,并注册该计划,因为你会重新创造他们已经花了几年的人。

得到验证的答案是从2012年起。以下是截至2017年Hadoop Wiki的最新消息

  • Hadoop版本2.2以上包括对Windows的本机支持。 官方Apache Hadoop版本不包括Windows二进制文件(截至2014年1月)。 但是,从源代码构建Windows包相当简单。