最近在搭建通过网络直接连接数据库模式的Hive时总是在启动的时候报各种错误,所以今天,我们来总结一下这种模式的Hive的搭建过程。
【数据库安装】
安装mysql
yum install mysql-server -y
配置:
启动mysql服务:service mysqld start
设置mysql服务自启动: chkconfig mysqld on
安装好mysql后一定要配置用户的登录权限。因为mySql一定要允许外部访问。
查看当前存在数据库:show databases;
选择使用哪一个数据库:use mysql (数据库名)
查看当前数据库中有哪些表:show tables
修改用户访问权限:desc user;
查看user表中的主机用户名和密码:
修改权限:
所有权限 on 所有库的所有表 to ‘用户名’@’%’ identified by ‘密码’ with grant option
注:%指的是给所有主机
with grant option 表示当前用户有这些权限
因为%代表包括了所有主机,所以将其余删掉
配置好root用户后要使其生效:
两种方式:
重启mysql服务
刷新权限信息:
以root用户登录mysql: mysql –uroot –proot
【Hive安装】
第一步,上传hive安装包和mysql的jar包到另一台机器(不是装mysql的那台)
第二步,解压hive发布包到指定目录
第三步,配置hive的环境变量
第四步,修改配置文件:
将configure中的内容删掉:
. 指当前行, $指最后一行 ,d删除
设置参数:
只需要配置连接数据库的四个参数以及存储在hdfs中的指定路径。
第五步,在hive机器上执行,初始化
会报一个错:hive目录下没有mysql的jar包
将mysql的jar包拷到hive安装目录下的lib目录下后,重新执行schematool命令。
第六步,在mysql机器上,启动mysql服务
第七步,在hive机器上执行hive命令,连接hdfs。
在启动hive之前,要保证成功启动zookeeper集群,启动Yarn,启动完全分布式集群