Apache Nutch命令无法执行

我遵循Apache Nutch Wiki中的每一步。 我正在使用MacOSX 10.8.3,我的JAVA_HOME已经完美设置,甚至可以在执行bin/nutch时看到各种命令选项(根据wiki)。

但是,当我使用bin/nutch crawl urls -dir crawl -depth 3 -topN 5 ,出现以下错误:

 bin/nutch: line 104: [: too many arguments Error: Could not find or load main class Engines 

仅供参考:我已经在apache-nutch-1.6/urls创build了一个urls目录

任何人都可以告诉可能是什么问题?

你可以尝试如下:

首先,通过蚂蚁建立nutch。

cd nutch-1.xx/runtime/local/

mkdir urls (用于种子列表目录)

mkdir crawl (for -dir选项)

vim urls/seed ,然后你添加一个或多个网址(例如: http : //www.examplesite.com )

bin/nutch crawl urls或 – bin/nutch crawl urls -dir crawl -depth 3 -topN 5

经过一番调查,我发现我忘了设置NUTCH_JAVA_HOME。 这是步骤:

 set NUTCH_JAVA_HOME=/System/Library/Frameworks/JavaVM.framework/Versions/1.6/Home export NUTCH_JAVA_HOME 

是的,我重置了JAVA_HOME:

 set JAVA_HOME=/System/Library/Frameworks/JavaVM.framework/Versions/1.6/Home export JAVA_HOME