1. GoldenDB组件及对应的用户和进程
GoldenDB数据库由管理节点、全局事务节点GTM、计算节点CN、数据节点DN等组成。
1.1. 管理节点
管理节点分为集群管理、Insight运维管理平台(InsightServer、RDB、ZK)。
1.1.1. 集群管理
1. 集群管理包括Metadataserver、ClusterManager和ProxyManager。
l MetadataServer:元数据管理模块,负责对元数据创建,修改、删除、查询、持久化等的管理工作。 --MDS
l Clustermanager:数据库集群管理模块,负责配合实施集群的管理,包括集群发现、集群组建、集群变更、集群查询、集群监控、DB主备切换等功能。--CM
l ProxyManager:Proxy集群管理模块,包括Proxy的发现、异常、查询,并接收MetaDataServer传递过来的用户操作。--PM
2. 默认安装用户为:ahmanager
查看进程状态命令:
dbstate
dbtool -pm -state
dbtool -mds -state
dbtool -cm -state
[ahmanager@db1 ~]$ dbstate
[metadataserver]The metadataserver process is running, PID:3489120
[proxymanager]The proxymanager process is running, PID:3489104
[clustermanager]The clustermanager process is running, PID:3489216
[ommagent]The ommagent process is running, PID:3489210
[ahmanager@db1 ~]$ dbtool -pm -state
Send message to module[ProxyManager,192.168.3.145:6006] localport[5600] pid[3429344] successfully!
The response message: RSP Code[0].{0:success; other: fail.}
[12-31 17:06:57:100]Successful response:
I am proxymanager and working at active mode!
~success~
[ahmanager@db1 ~]$ dbtool -mds -state
Send message to module[MetaDataServer,192.168.3.145:6406] localport[5600] pid[3431130] successfully!
The response message: RSP Code[0].{0:success; other: fail.}
[12-31 17:07:13:390]Successful response:
I am working
~success~
[ahmanager@db1 ~]$ dbtool -cm -state
Send message to module[ClusterManager,192.168.3.145:6016] localport[5600] pid[3432138] successfully!
The response message: RSP Code[0].{0:success; other: fail.}
[12-31 17:07:22:450]Successful response:
I am clustermanager and working at active mode
~success~
1.1.1.1. 程序异常日志
1. MDS、PM:
grep 20003 ~/log/alarm.info
2. CM:
grep 20001 ~/log/alarm.info
1.1.2. Insight运维管理平台
通过web界面提供人机交互功能,具体包括集群规划、集群变更、资源监控、权限管理、告警与监控、统计监控等功能。
1. 默认安装用户为:insight
2. Insightserver模块:对应进程
insight sh /data/goldendb/insight/bin/serverdbmonidamon
insight java -jar -Djava.io.tmpdir=/data/goldendb/insight/insightTmp -Xmx10g -Duser.timezone=GMT+08 ./insight.jar
3. 停止Insightserver(insight运维平台登录不上)
serverdbmoni –stop
4. 启动Insightserver
serverdbmoni –start
5. 查看Insightserver状态
serverdbmoni –status
6. RDB数据库:
ps -fu $USER | awk '{if($8~/^mysqld$/ || $8~/\/mysqld$/)print}'
[insight@db1 ~]$ ps -fu $USER | awk '{if($8~/^mysqld$/ || $8~/\/mysqld$/)print}'
insight 41119 1 5 12月27 ? 05:34:25 /data/goldendb/insight/bin/mysqld --defaults-file=/data/goldendb/insight/etc/my.cnf --datadir=/data/goldendb/insight/data/data --pid-file=/data/goldendb/insight/bin/mysqld1.pid
7. ZK(高可用管理):
安装目录cd ~/bigdata/zookeeper/bin
查看高可用模式
./zkServer.sh status
ZK进程启停
./zkServer.sh stop --停止该进程;
./zkServer.sh start --启动该进程;
1.2. 全局事务节点(GTM):
默认安装用户为:ahgtm1
进程:gtm、ommagent
查看进程状态:dbstate或dbtool -gtm -state
启动进程:dbmoni -start
停止进程:dbmoni –stop
1.2.1. 异常告警日志
grep 20003 ~/log/alarm.info
1.3. 计算节点CN
默认安装用户为:ahdbproxy1
进程:dbproxy、ommagent
查看进程状态:dbstate
启动进程:dbmoni -start
停止进程:dbmoni –stop
1.3.1. 警告日志
su - ahdbproxy1
grep ERROR $HOME/log/dbproxy.log
1.4. 数据节点DN
默认安装用户为:ahdb1、ahdb2 (……ahdbn)
查看数据库状态
ps -fu $USER | awk '{if($8~/^mysqld$/ || $8~/\/mysqld$/)print}'
或mysql.server status
查看进程状态:dbstate
启动进程:dbmoni -start
停止进程:dbmoni –stop
1.4.1. db日志:
su - ahdb1
$HOME/log/mysqld1.log
1.4.2. agent日志
su - ahdb1
$HOME/log/dbagent.log
1.4.3. agent重启日志
su - ahdb1
$HOME/log/dbmoni.log