如何在linux中看到Hive的orc文件的内容

有没有办法看到configuration单元0.11及以上使用的orc文件的内容。 我通常会cat gz文件,并解压缩它们以查看内容,例如:cat part-0000.gz | pigz -d | 更多注意:pigz是一个平行的gz程序。

我想知道是否有类似这样的orc文件。

Solutions Collecting From Web of "如何在linux中看到Hive的orc文件的内容"

ORC文件转储实用程序带有配置单元(0.11或更高版本):

 hive --orcfiledump <hdfs-location-of-orc-file> 

来源链接

现在还有一个用于Linux和MacOS的本机可执行文件,它以JSON打印orc文件的内容。 查看ORC项目( http://orc.apache.org/ )并构建C ++工具。

 % orc-contents examples/TestOrcFile.test1.orc 

还有一个本地元数据工具:

 % orc-metadata ../examples/TestOrcFile.test1.orc 

ORC项目也有一个独立的uber jar,可以从Java做同样的工作。

 % java -jar orc-tools-1.2.3-uber.jar data myfile.orc