hive on tez 配置

tez

tez需要自己编译安装

编译

brew install homebrew/versions/protobuf250

如果brew连不上,可以参考brew设置清华源

修改tez的pom.xml的hadoop.version

编译tez-ui可能会遇到nmp的问题,需要给命令行加代理。同时代理可能带来ssl CERT_UNTRUSTED,需要配置不用ssl:npm config set strict-ssl falseh或者直接设置不用https的repo:npm config set registry="http://registry.npm.taobao.org"stack overflow

配置

按照主页配置

将conf的tez路径写到配置里,注意端口要和hadoop的core-site一样

之后可以运行一下样例程序,看看tez有没有安装正确。

1
hadoop jar /usr/local/tez-0.7.1_hzq/tez-examples-0.7.1-SNAPSHOT.jar orderedwordcount /tmp/hzq/test /tmp/1

我运行时由于虚拟内存不足,container无法运行,可能会报container连不上,还可能会有个interruptedexception,这都是因为container在不同阶段被kill了引起的。按理来说应该修改默认内存大小,不过我偷懒直接设置了不检查内存yarn.nodemanager.vmem-check-enabled to false。终于tez跑成功了.

参考文献

hive 配置

集群上原本就有hive,所以不需要自己安装,直接修改配置,加上用tez驱动的选项即可:

1
2
3
4
<property>
<name>hive.execution.engine</name>
<value>tez</value>
</property>

参考文献

hive安装
hive配置


本文采用创作共用保留署名-非商业-禁止演绎4.0国际许可证,欢迎转载,但转载请注明来自http://thousandhu.github.io,并保持转载后文章内容的完整。本人保留所有版权相关权利。

本文链接:http://thousandhu.github.io/2016/04/01/hive-on-tez-配置/