Hadoop中RPC机制

HadoopRPC机制

RPC(Remote Procedure Call Protocol)远程过程调用协议,它是一种通过网络从远程计算机程序上请求服务,而不需要了解底层网络技术的协议。Hadoop底层的交互都是通过rpc进行的。例如:datanode和namenode 、tasktracker和jobtracker、secondary namenode和namenode之间的通信都是通过rpc实现的。下面是rpc交互过程图: 

1.客服端调用的总过程:

Hadoop的RPC客户端代码其实就一个类:org.apache.hadoop.ipc.Client。这个类使用Java的动态代理技术,生成服务器的业务接口的代理,通过socket将调用的业务方法和参数传送到服务器端,并且等待服务器端的响应。

客户端调用的序列图如下:

 

 例如:TaskTracker请求与JobTracker的通信:

TaskTracker通过:

      this.jobClient = (InterTrackerProtocol)

          RPC.waitForProxy(InterTrackerProtocol.class, InterTrackerProtocol.versionID,

                       jobTrackAddr, this.fConf);

中的InterTrackerProtocol 去和JobTracker通信。

在RPC中通过:

       VersionedProtocol proxy =

            (VersionedProtocol) Proxy.newProxyInstance(

            protocol.getClassLoader(), new Class[] { protocol },

            new Invoker(addr, ticket, conf, factory));

产生一个动态代理完成JobTracker和TaskTracker之间的心跳交流。

2.客服端向服务器发送连接

    客户端(C)要发起对服务端(S)方法的调用主要通过:

    public Writable call(Writable param, InetSocketAddress addr,

                       Class<?> protocol, UserGroupInformation ticket) 

                       throws InterruptedException, IOException 实现

2.1首先在该方法调用中:

    Call call = new Call(param); //将param转换成Call对象  其实就是将Invocation(用来序列化和反序列化RPC客户端的调用信息,包括方法名和参数信息)转化为Call 。

2.2 客服端创建一个通向服务端的连接connection,Connection connection = getConnection(addr, protocol, ticket, call);然后将此次调用放入CallList里,这样客户端就可以同时发生很多调用,每个调用用ID来识别。

(1) 根据RPC服务端的地址和接口从连接池中获取一个,如果取到Connection则直接返回。

(2) 否则新建一个Connection,并将它放入到连接池中

(3) 然后通过SocketFactory创建一个Socket,并建立到RPC服务端的连接,如果连接不成功,则重试。

(4) 创建和关联输入和输出流对象。

2.3 发送调用参数connection.sendParam(call)。调用参数是Client的调用方(比如NameNode,DataNode等)指定的,一般就是一个Invocation对象,里面包含要调用的方法和参数。

2.4等待调用结果.Client.Connection是个线程类,启动了之后唯一做的事情就是等待调用结果。

    synchronized (call) {   

          while (!call.done){   //done就是服务器端返回该call的结果,判断该call是否处理

          ……………………           

          ………………

       }

    }

3.服务器端对客服端的call请求处理

对于服务器端,其有一个方法start指定了启动服务器开始监听,这个start被四个类调用,分别是TaskTracker.initialize,Namenode.initialize,Jobtracker.offerService,Datanode.startDatanode,显然,任何两者之间的通信都是考这个client-server模型实现的。

3.1 server start后,干了三件事,就是启动三个线程

1.启动listener,监听客户端Call

2.启动response,随时准备将处理结果发回client

3.启动10个handler,处理具体的请求。

3.2上面三个线程的具体工作过程

3.2.1. Listener线程

该线程负责监听客户端请求以及数据的接收,然后将接收到的数据组成一个Call实例,放到请求队列里面。具体做法如下:

1) Listener线程循环等待RPC客户端的发送数据过来

2) 当有数据可以接收时,调用Connection的readAndProcess()方法。readAndProces()又调用processData()方法

3) Connection边接收边对数据进行处理,如果接收到一个完整的Call包,则构建一个Call对象。readAndProcess()调用processData()方法把Call对象加入到Call队列的,并将这个Call对象PUSH到Call队列中,由Handler线程来处理Call队列中的所有Call。

3.2.2.Handler线程

该线程负责从请求队列中取出调用请求,通过调用抽象方法

1) Handler线程循环监听Call队列,如果Call队列为空,则进入wait状态,否则按FIFO规则从Call队列取出Call

2) 将Call交给RPC.Server处理(调用RPC.Server的public Writable call(Class<?> protocol, Writable param, long receivedTime)

    throws IOException ),因为RPC对Server的一些功能进行了实现

3) 借助java里的反射机制,完成对目标方法的调用

4) 返回响应。由于响应需要通过SOCKET返回给RPC客户端,所以响应的类型必须是Writable。

3.2.2. Response线程   

 Response也监视responselist,如果responselist中某个call需要将结果写入客户端就写出,当某个call的结果被发送完毕,从responselist中删除该call对象。

注意:handler完成call之后就开始向客户端写call结果,但是结果可能太多,无法通过一次性发送完毕,而发送之后还要等待client接受完毕才能再发,如果现在handler在那里等待客户端接受完毕,然后再发,效率不高。解决办法是handler处理完毕之后,只向client发送一次处理结果。如果这一次将处理结果发送完毕,接下来就没有response的事情了,如果没有发送完毕,接下来response负责将剩下的处理结果发送给客户端。这样handler的并发量会大一些。

服务器实现中大量利用监视队列,比如handler就直观坚持calllist,一旦发现数据就开始处理,而response就监视responselist,发现数据需要发送就开始发送。

参考:

1.http://bbs.hadoopor.com/thread-329-1-2.html

2.http://jackosn-liao.iteye.com/blog/851914 

3. http://blog.csdn.net/wuixiaobao/article/details/6549781

4.http://bbs.hadoopor.com/thread-329-1-2.html

 

 

 

转载于:https://www.cnblogs.com/MGGOON/archive/2012/02/24/2367231.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/410054.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C++中如何读取一个数的位数_求1000以内的水仙花数

点击上方 蓝字关注我们大家好&#xff0c;我是阿汤哥。看知乎上有朋友说还不明白怎么判断水仙花数&#xff0c;今天我们就来看看这个问题。(PS&#xff1a;“求1000以内的水仙花数”这道题阿汤哥记忆犹新。到现在还记得这是我大一上学期期末考试的编程题。)怎么求水仙花数&…

双向绑定v-bind

通过v-model绑定输出数据<script> export default {data(){return {pagestyle:https://v4.bootcss.com/docs/4.3/dist/css/bootstrap.css,pagecss:https://v4.bootcss.com/docs/4.3/examples/sticky-footer-navbar/sticky-footer-navbar.css,mytitle:v-bind bootstrap样…

xyz坐标图_“色觉地图”的建立(二):辐照度与亮度、rgb空间、“颜色图”的混色方式...

上篇““色觉地图”的建立&#xff08;一&#xff09;&#xff1a;光感受器、色匹配实验与CIE RGB坐标系“中说到&#xff0c;人的色觉是线性的&#xff0c;我们可以用叠加原理“混色”——这意味着色觉的空间固定不变&#xff0c;我们可以任意选择一组基底&#xff08;或说坐标…

Nginx的应用之动静分离

Nginx 的动静分离 我们通过中间件将动态请求和静态请求进行分离&#xff0c;减少了不必要的请求消耗和延时。 动静分离后&#xff0c;即使动态服务不可用&#xff0c;但静态资源不会受到影响。 应用实例 1、准备环境 系统角色主机名IP服务CentOS 7.2反向代理Nginx_Proxy192.168…

3d打印英语文献_锐医学院 | 只需10分钟!解读康复医学文献+英语学习

文献解读英语学习只需10分钟锐医学院致力于专业康复教育培训同时&#xff0c;也在康复领域专家的合作下&#xff0c;一直在研究康复领域最前沿所取得的研究成果、存在的问题以及发展趋势进行系统和全面的叙述和评论与各领域康复专业人士分享。文献解读有助于发现前沿性问题&…

node.js通过回调函数获取异步函数的返回结果

html文件代码<!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><title>我的node.js首页</title> </head> <body></body> </html> 通过buffer流读取html文件var fs require(fs);…

bigdecimal 保留两位小数_一律使用 BigDecimal,避免后患?

你知道的越多&#xff0c;不知道的就越多&#xff0c;业余的像一棵小草&#xff01;你来&#xff0c;我们一起精进&#xff01;你不来&#xff0c;我和你的竞争对手一起精进&#xff01;编辑&#xff1a;业余草zhuanlan.zhihu.com/p/94144867推荐&#xff1a;https://www.xttbl…

tcp 四次挥手_tcp三次握手和四次挥手

SYN&#xff1a;一个很小的包&#xff0c;tcp的第一个包&#xff08;同步序列编号&#xff09;ACK:确认响应SYN、ACK:为1表示确认连接FIN表示关闭连接&#xff0c;PSH表示有 DATA数据传输&#xff0c;RST表示连接重置。Acknowledge number(ack)&#xff1a;确认号&#xff0c;大…

ssh登录服务器提示错误no hostkey alg

ssh登录服务器提示错误no hostkey alg ssh root192.168.1.100 -vvv提示失败&#xff1a;no hostkey alg 登录到192.168.1.100服务器 rm -rf /etc/ssh/ssh*key systemctl restart sshd #我还是移走了&#xff0c;没有删除。因为之前安装了telnet服务&#xff0c;因此不用担心连…

ms查约束具体代码_ECCV 2020附代码论文合集(CNN,图像分割)

ECCV 2020 共接受 1361 篇论文&#xff0c;涵盖了包括目标检测&#xff0c;语义分割&#xff0c;图像分类&#xff0c;点云&#xff0c;图像重建&#xff0c;神经网络模型等热门主题。对计算机视觉感兴趣的小伙伴们也许你们已经阅读完论文并对论文的内容跃跃欲试了吧&#xff0…

路径规划算法_自动驾驶汽车路径规划算法浅析

自动驾驶汽车的路径规划算法最早源于机器人的路径规划研究&#xff0c;但是就工况而言却比机器人的路径规划复杂得多&#xff0c;自动驾驶车辆需要考虑车速、道路的附着情况、车辆最小转弯半径、外界天气环境等因素。本文将为大家介绍四种常用的路径规划算法&#xff0c;分别是…

【转载】interpolation(插值)和 extrapolation(外推)的区别

根据已有数据以及模型&#xff08;函数&#xff09;预测未知区域的函数值&#xff0c;预测的点在已有数据范围内就是interpolation&#xff08;插值&#xff09;&#xff0c; 范围外就是extrapolation&#xff08;外推&#xff09;。 The Difference Between Extrapolation and…

vue computed使用_vue computed正确使用方式

最近面试中&#xff0c;遇到一个小伙子&#xff0c;谈到了vue中的 computed 和 watch 区别&#xff0c;最后得到了一个让我瞠目结舌的答案&#xff0c;只用 watch&#xff0c;从不用 computed 模板内的表达式非常便利&#xff0c;但是设计它们的初衷是用于简单运算的。在模板中…

Apache实验-目录别名

一、作用介绍 在一些情况下&#xff0c;我们的资源文件都在非/var/www/html目录下&#xff0c;例如/var/www/html/sohu。这样的话我们在输入网址的时候就需要在网站根目录下再输入完整的目录。所以我们可以定义一个别名来替代这个路径。可以简写网站的网址。 二、实例操作 目前…

黑苹果适合什么用途?_黑苹果系统,Ozmosis和四叶草、变色龙相比有什么区别和优势?...

黑苹果单系统&#xff0c;Ozmosis和四叶草、变色龙相比有什么区别和优势&#xff1f;黑苹果系统用于影视后期处理ozmosis由于调试灵活性差&#xff0c;每次调试都要刷bios&#xff0c;主板厂商提供的bios也就8mb&#xff0c;要把&#xff0c;ozmosis引导程序放进去&#xff0c;…

Apache的虚拟主机

一、虚拟主机的分类 基于IP的虚拟主机&#xff1a;一台服务器&#xff0c;多个ip&#xff0c;搭建多个网站 基于端口的虚拟主机&#xff1a;一台服务器&#xff0c;一个ip&#xff0c;利用不同端口&#xff0c;搭建多个网站 基于域名的虚拟主机&#xff1a;一台服务器&#xff…

zabbix解决中文乱码

解决中文乱码 yum install -y wqy-microhei-fonts #解决方法 中文乱码 \cp /usr/share/fonts/wqy-microhei/wqy-microhei.ttc /usr/share/fonts/dejavu/DejaVuSans.ttf #或者是服务器没有安装中文转载于:https://www.cnblogs.com/zhaojingyu/p/11438733.html

springboot启动过程_spring5/springboot2源码学习 -- spring boot 应用的启动过程

推荐阅读&#xff1a;Spring全家桶笔记&#xff1a;SpringSpring BootSpring CloudSpring MVC疫情期间“闭关修炼”&#xff0c;吃透这本Java核心知识&#xff0c;跳槽面试不心慌2020“闭关”跳槽季&#xff0c;啃透分布式三大技术&#xff1a;限流、缓存、通讯基本环境开发工具…

不出来信号 quartus_男人一旦动了真情,会向你发出这6个“信号”不爱的人装不出来...

恋爱的时候&#xff0c;女人都想知道一个男人是否真的爱你&#xff0c;是否真的在乎你&#xff0c;女人常常在猜测男人的心思。而对一个聪明的女人来说&#xff0c;她们会用眼睛&#xff0c;用心观察身边的那个男人。有人说如果男人对女人动了真情&#xff0c;他会在女人面前表…

python turtle画烟花_用Python写一个绚丽的烟花!

Python人工智能 - 一节课快速认识人工智能必备语言:python - 创客学院直播室​www.makeru.com.cn 哈喽大家好&#xff0c;小编来教大家如何用Python写一个绚丽的烟花&#xff0c;下面我们开始吧~ Turtle库Turtle&#xff0c;也叫海龟渲染器&#xff0c;使用Turtle库画图也叫海龟…