workflow源码解析:http客户端(一)

1、 示例程序

程序从stdin读取http/https URL,抓取网页并把内容打印到stdout,并将请求和响应的http header打印在stderr。
为了简单起见,程序用Ctrl-C退出,但会保证所有资源先被完全释放。

#include <signal.h>
#include <stdlib.h>
#include <stdio.h>
#include <string.h>
#include <string>
#include "workflow/HttpMessage.h"
#include "workflow/HttpUtil.h"
#include "workflow/WFTaskFactory.h"#ifndef _WIN32
#include <unistd.h>
#endif#define REDIRECT_MAX    5
#define RETRY_MAX       2void wget_callback(WFHttpTask *task)
{protocol::HttpRequest *req = task->get_req();protocol::HttpResponse *resp = task->get_resp();int state = task->get_state();int error = task->get_error();switch (state){case WFT_STATE_SYS_ERROR:fprintf(stderr, "system error: %s\n", strerror(error));break;case WFT_STATE_DNS_ERROR:fprintf(stderr, "DNS error: %s\n", gai_strerror(error));break;case WFT_STATE_SSL_ERROR:fprintf(stderr, "SSL error: %d\n", error);break;case WFT_STATE_TASK_ERROR:fprintf(stderr, "Task error: %d\n", error);break;case WFT_STATE_SUCCESS:break;}if (state != WFT_STATE_SUCCESS){fprintf(stderr, "Failed. Press Ctrl-C to exit.\n");return;}std::string name;std::string value;/* Print request. */fprintf(stderr, "%s %s %s\r\n", req->get_method(),req->get_http_version(),req->get_request_uri());protocol::HttpHeaderCursor req_cursor(req);while (req_cursor.next(name, value))fprintf(stderr, "%s: %s\r\n", name.c_str(), value.c_str());fprintf(stderr, "\r\n");/* Print response header. */fprintf(stderr, "%s %s %s\r\n", resp->get_http_version(),resp->get_status_code(),resp->get_reason_phrase());protocol::HttpHeaderCursor resp_cursor(resp);while (resp_cursor.next(name, value))fprintf(stderr, "%s: %s\r\n", name.c_str(), value.c_str());fprintf(stderr, "\r\n");/* Print response body. */const void *body;size_t body_len;resp->get_parsed_body(&body, &body_len);fwrite(body, 1, body_len, stdout);fflush(stdout);fprintf(stderr, "\nSuccess. Press Ctrl-C to exit.\n");
}void sig_handler(int signo) { }int main(int argc, char *argv[])
{WFHttpTask *task;if (argc != 2){fprintf(stderr, "USAGE: %s <http URL>\n", argv[0]);exit(1);}signal(SIGINT, sig_handler);std::string url = argv[1];if (strncasecmp(argv[1], "http://", 7) != 0 &&strncasecmp(argv[1], "https://", 8) != 0){url = "http://" + url;}task = WFTaskFactory::create_http_task(url, REDIRECT_MAX, RETRY_MAX,wget_callback);protocol::HttpRequest *req = task->get_req();req->add_header_pair("Accept", "*/*");req->add_header_pair("User-Agent", "Wget/1.14 (linux-gnu)");req->add_header_pair("Connection", "close");task->start();
#ifndef _WIN32pause();
#elsegetchar();
#endifreturn 0;
}

2、类继承关系

在这里插入图片描述

3、源码分析

  1. create_http_task
#HttpTaskImpl.cc
WFHttpTask *WFTaskFactory::create_http_task(const std::string& url,int redirect_max,int retry_max,http_callback_t callback)
{auto *task = new ComplexHttpTask(redirect_max,retry_max,std::move(callback));ParsedURI uri;URIParser::parse(url, uri);task->init(std::move(uri));task->set_keep_alive(HTTP_KEEPALIVE_DEFAULT);return task;
}
  1. ComplexHttpTask
#HttpTaskImpl.cc
class ComplexHttpTask : public WFComplexClientTask<HttpRequest, HttpResponse>
{
public:ComplexHttpTask(int redirect_max,int retry_max,http_callback_t&& callback):WFComplexClientTask(retry_max, std::move(callback)),redirect_max_(redirect_max),redirect_count_(0){HttpRequest *client_req = this->get_req();client_req->set_method(HttpMethodGet);client_req->set_http_version("HTTP/1.1");}protected:virtual CommMessageOut *message_out();virtual CommMessageIn *message_in();virtual int keep_alive_timeout();virtual bool init_success();virtual void init_failed();virtual bool finish_once();protected:bool need_redirect(ParsedURI& uri);bool redirect_url(HttpResponse *client_resp, ParsedURI& uri);void set_empty_request();void check_response();private:int redirect_max_;int redirect_count_;
};
  1. WFComplexClientTask
#WFTaskFactory.inl
template<class REQ, class RESP, typename CTX = bool>
class WFComplexClientTask : public WFClientTask<REQ, RESP>
{
protected:using task_callback_t = std::function<void (WFNetworkTask<REQ, RESP> *)>;public:WFComplexClientTask(int retry_max, task_callback_t&& cb):WFClientTask<REQ, RESP>(NULL, WFGlobal::get_scheduler(), std::move(cb)){type_ = TT_TCP;fixed_addr_ = false;retry_max_ = retry_max;retry_times_ = 0;redirect_ = false;ns_policy_ = NULL;router_task_ = NULL;}protected:// new api for childrenvirtual bool init_success() { return true; }virtual void init_failed() {}virtual bool check_request() { return true; }virtual WFRouterTask *route();virtual bool finish_once() { return true; }public:void init(const ParsedURI& uri){uri_ = uri;init_with_uri();}void init(ParsedURI&& uri){uri_ = std::move(uri);init_with_uri();}void init(TransportType type,const struct sockaddr *addr,socklen_t addrlen,const std::string& info);void set_transport_type(TransportType type){type_ = type;}TransportType get_transport_type() const { return type_; }virtual const ParsedURI *get_current_uri() const { return &uri_; }void set_redirect(const ParsedURI& uri){redirect_ = true;init(uri);}void set_redirect(TransportType type, const struct sockaddr *addr,socklen_t addrlen, const std::string& info){redirect_ = true;init(type, addr, addrlen, info);}bool is_fixed_addr() const { return this->fixed_addr_; }protected:void set_fixed_addr(int fixed) { this->fixed_addr_ = fixed; }void set_info(const std::string& info){info_.assign(info);}void set_info(const char *info){info_.assign(info);}protected:virtual void dispatch();virtual SubTask *done();void clear_resp(){size_t size = this->resp.get_size_limit();this->resp.~RESP();new(&this->resp) RESP();this->resp.set_size_limit(size);}void disable_retry(){retry_times_ = retry_max_;}protected:TransportType type_;ParsedURI uri_;std::string info_;bool fixed_addr_;bool redirect_;CTX ctx_;int retry_max_;int retry_times_;WFNSPolicy *ns_policy_;WFRouterTask *router_task_;RouteManager::RouteResult route_result_;WFNSTracing tracing_;public:CTX *get_mutable_ctx() { return &ctx_; }private:void clear_prev_state();void init_with_uri();bool set_port();void router_callback(void *t);void switch_callback(void *t);
};
  1. WFClientTask
#WFTask.inl
template<class REQ, class RESP>
class WFClientTask : public WFNetworkTask<REQ, RESP>
{
protected:virtual CommMessageOut *message_out(){/* By using prepare function, users can modify request after* the connection is established. */if (this->prepare)this->prepare(this);return &this->req;}virtual CommMessageIn *message_in() { return &this->resp; }protected:virtual WFConnection *get_connection() const{CommConnection *conn;if (this->target){conn = this->CommSession::get_connection();if (conn)return (WFConnection *)conn;}errno = ENOTCONN;return NULL;}protected:virtual SubTask *done(){SeriesWork *series = series_of(this);if (this->state == WFT_STATE_SYS_ERROR && this->error < 0){this->state = WFT_STATE_SSL_ERROR;this->error = -this->error;}if (this->callback)this->callback(this);delete this;return series->pop();}public:void set_prepare(std::function<void (WFNetworkTask<REQ, RESP> *)> prep){this->prepare = std::move(prep);}protected:std::function<void (WFNetworkTask<REQ, RESP> *)> prepare;public:WFClientTask(CommSchedObject *object, CommScheduler *scheduler,std::function<void (WFNetworkTask<REQ, RESP> *)>&& cb) :WFNetworkTask<REQ, RESP>(object, scheduler, std::move(cb)){}protected:virtual ~WFClientTask() { }
};
  1. WFNetworkTask
#WFTask.h
template<class REQ, class RESP>
class WFNetworkTask : public CommRequest
{
public:/* start(), dismiss() are for client tasks only. */void start(){assert(!series_of(this));Workflow::start_series_work(this, nullptr);}void dismiss(){assert(!series_of(this));delete this;}public:REQ *get_req() { return &this->req; }RESP *get_resp() { return &this->resp; }public:void *user_data;public:int get_state() const { return this->state; }int get_error() const { return this->error; }/* Call when error is ETIMEDOUT, return values:* TOR_NOT_TIMEOUT, TOR_WAIT_TIMEOUT, TOR_CONNECT_TIMEOUT,* TOR_TRANSMIT_TIMEOUT (send or receive).* SSL connect timeout also returns TOR_CONNECT_TIMEOUT. */int get_timeout_reason() const { return this->timeout_reason; }/* Call only in callback or server's process. */long long get_task_seq() const{if (!this->target){errno = ENOTCONN;return -1;}return this->get_seq();}int get_peer_addr(struct sockaddr *addr, socklen_t *addrlen) const;virtual WFConnection *get_connection() const = 0;public:/* All in milliseconds. timeout == -1 for unlimited. */void set_send_timeout(int timeout) { this->send_timeo = timeout; }void set_receive_timeout(int timeout) { this->receive_timeo = timeout; }void set_keep_alive(int timeout) { this->keep_alive_timeo = timeout; }public:/* Do not reply this request. */void noreply(){if (this->state == WFT_STATE_TOREPLY)this->state = WFT_STATE_NOREPLY;}/* Push reply data synchronously. */virtual int push(const void *buf, size_t size){return this->scheduler->push(buf, size, this);}/* To check if the connection was closed before replying.Always returns 'true' in callback. */bool closed() const{if (this->state == WFT_STATE_TOREPLY)return !this->get_target()->has_idle_conn();elsereturn this->state != WFT_STATE_UNDEFINED;}public:void set_callback(std::function<void (WFNetworkTask<REQ, RESP> *)> cb){this->callback = std::move(cb);}protected:virtual int send_timeout() { return this->send_timeo; }virtual int receive_timeout() { return this->receive_timeo; }virtual int keep_alive_timeout() { return this->keep_alive_timeo; }protected:int send_timeo;int receive_timeo;int keep_alive_timeo;REQ req;RESP resp;std::function<void (WFNetworkTask<REQ, RESP> *)> callback;protected:WFNetworkTask(CommSchedObject *object, CommScheduler *scheduler,std::function<void (WFNetworkTask<REQ, RESP> *)>&& cb) :CommRequest(object, scheduler),callback(std::move(cb)){this->send_timeo = -1;this->receive_timeo = -1;this->keep_alive_timeo = 0;this->target = NULL;this->timeout_reason = TOR_NOT_TIMEOUT;this->user_data = NULL;this->state = WFT_STATE_UNDEFINED;this->error = 0;}virtual ~WFNetworkTask() { }
};
  1. CommRequest
# CommRequest.h
class CommRequest : public SubTask, public CommSession
{
public:CommRequest(CommSchedObject *object, CommScheduler *scheduler){this->scheduler = scheduler;this->object = object;this->wait_timeout = 0;}CommSchedObject *get_request_object() const { return this->object; }void set_request_object(CommSchedObject *object) { this->object = object; }int get_wait_timeout() const { return this->wait_timeout; }void set_wait_timeout(int timeout) { this->wait_timeout = timeout; }public:virtual void dispatch(){if (this->scheduler->request(this, this->object, this->wait_timeout,&this->target) < 0){this->handle(CS_STATE_ERROR, errno);}}protected:int state;int error;protected:CommTarget *target;
#define TOR_NOT_TIMEOUT			0
#define TOR_WAIT_TIMEOUT		1
#define TOR_CONNECT_TIMEOUT		2
#define TOR_TRANSMIT_TIMEOUT	3int timeout_reason;protected:int wait_timeout;CommSchedObject *object;CommScheduler *scheduler;protected:virtual void handle(int state, int error);
};

(1)应用程序调用start()时,调用到 WFNetworkTask类的

`void start(){assert(!series_of(this));Workflow::start_series_work(this, nullptr);}`

(2)

inline void
Workflow::start_series_work(SubTask *first, series_callback_t callback)
{new SeriesWork(first, std::move(callback));first->dispatch();
}

(3)调用 WFComplexClientTask<REQ, RESP, CTX>::dispatch() (这里为什么不是调用 CommRequest 的 dispatch

template<class REQ, class RESP, typename CTX>
void WFComplexClientTask<REQ, RESP, CTX>::dispatch()
{switch (this->state){case WFT_STATE_UNDEFINED:       // 第一次是这个状态if (this->check_request())   // 这里直接return true {if (this->route_result_.request_object)    // 第一次走着初始化是空的,直接到下面产生router_task_{case WFT_STATE_SUCCESS:   // 第二次就直接success了this->set_request_object(route_result_.request_object);this->WFClientTask<REQ, RESP>::dispatch(); //这里会调用到 CommRequest 的 dispatchreturn;}// 第一次直接过来了,产生route做dns解析// 产生一个router_task_插入到前面去做dns解析router_task_ = this->route();series_of(this)->push_front(this);series_of(this)->push_front(router_task_);}default:break;}this->subtask_done();
}

(4)CommRequest::dispatch 组成
dns解析完后,

this->WFClientTask<REQ, RESP>::dispatch();

调用CommRequest的dispatch

void CommRequest::dispatch()
{// 发送请求this->scheduler->request(this, this->object, this->wait_timeout,&this->target);...
}

(5)scheduler是在 WFComplexClientTask的初始化列表中创建,此时传入的是NULL

WFComplexClientTask(int retry_max, task_callback_t&& cb):WFClientTask<REQ, RESP>(NULL, WFGlobal::get_scheduler(), std::move(cb))

而什么时候才初始化呢? 在WFComplexClientTask的dispatch中set_request_object

template<class REQ, class RESP, typename CTX>
void WFComplexClientTask<REQ, RESP, CTX>::dispatch()
{switch (this->state){case WFT_STATE_UNDEFINED:if (this->check_request()){if (this->route_result_.request_object){case WFT_STATE_SUCCESS:this->set_request_object(route_result_.request_object);this->WFClientTask<REQ, RESP>::dispatch();return;}...
}

这里如何产生的route_result_.request_object,是通过dns去做的,这里先略过,在dns那一节详细阐述。

可以看出我们给个url,dns解析出来之后,我们有了request的目标了

(6)scheduler 的reques执行的是

/* wait_timeout in microseconds, -1 for no timeout. */int request(CommSession *session, CommSchedObject *object,int wait_timeout, CommTarget **target){int ret = -1;*target = object->acquire(wait_timeout);  //获取通信targetif (*target){ret = this->comm.request(session, *target); // 调用request去发request请求if (ret < 0)(*target)->release();}return ret;}

这里CommTarget 才是通讯目标,基本上就是ip+port, 还有两个超时参数。连接池什么的都在target里

4、参考链接

https://github.com/chanchann/workflow_annotation/blob/main/src_analysis/18_http_01.md

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/638690.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LeetCode 105. 从前序与中序遍历序列构造二叉树

105. 从前序与中序遍历序列构造二叉树 给定两个整数数组 preorder 和 inorder &#xff0c;其中 preorder 是二叉树的先序遍历&#xff0c; inorder 是同一棵树的中序遍历&#xff0c;请构造二叉树并返回其根节点。 示例 1: 输入: preorder [3,9,20,15,7], inorder [9,3,15,…

【二叉树练习2】

文章目录 判断是否是完全二叉树找出p和q的最近的公共祖先非递归实现前序遍历非递归实现中序遍历非递归实现后序遍历 判断是否是完全二叉树 boolean isCompleteTree(TreeNode root){if (root null){return true;}//创建队列Queue<TreeNode> queue new LinkedList<>…

从一到无穷大 #21 从基于多数据模型分析负载的Benchmark讨论多模数据库的发展方向

本作品采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可。 本作品 (李兆龙 博文, 由 李兆龙 创作)&#xff0c;由 李兆龙 确认&#xff0c;转载请注明版权。 文章目录 引言M2Bench测试结果从Lindorm看待多模的发展方向总结 引言 《M2Bench: A Database …

【手撕C语言 第六集】函数(上)

文章目录 一、函数是什么&#xff1f;二、C语言中函数的分类&#xff1a;1.库函数1.1 如何学会使用库函数&#xff1f; 2. 自定义函数 三、函数的参数1.实际参数&#xff08;实参&#xff09;&#xff1a;2.形式参数&#xff08;形参&#xff09;&#xff1a; 四、函数的调用&a…

JS加密/解密之一个少见的js解密

直接上源代码 (function(){var tfK,EAc715-704;function JQI(d){var q514800;var yd.length;var i[];for(var v0;v<y;v){i[v]d.charAt(v)};for(var v0;v<y;v){var pq*(v245)(q%31355);var eq*(v264)(q%20133);var kp%y;var oe%y;var mi[k];i[k]i[o];i[o]m;q(pe)%3352359…

【漏洞复现】Hikvision综合安防管理平台config信息泄露漏洞

Nx01 产品简介 Hikvision&#xff08;海康威视&#xff09;是一家在中国颇具影响力的安防公司&#xff0c;其网络摄像头产品在市场上占据了相当大的份额。综合安防管理平台基于“统一软件技术架构”理念设计&#xff0c;采用业务组件化技术&#xff0c;满足平台在业务上的弹性扩…

关于程序员的未来的这件事情,我是这么看的!

关于程序员的未来在哪里&#xff1f;很多想做程序员以及已经入坑的程序员都想知道&#xff0c;我作为一名工龄超过12年的资深大龄程序员&#xff0c;我其实也想知道&#xff0c;我也没办法确定程序员的未来在哪里。 或者我也不知道&#xff0c;为什么互联网当初招聘那么多的程…

【数据库原理】(37)Web与数据库

随着网络的高速发展和网络服务的日趋完善&#xff0c;网络上的信息量呈几何级数增长。为了有效地组织、存储、管理和使用网上的信息&#xff0c;数据库技术被广泛地应用于网络领域。特别是在Internet上&#xff0c;已建立了数以万计的网站&#xff0c;其中大中型网站的后台大多…

【数据库原理】(38)数据仓库

数据仓库&#xff08;Data Warehouse, DW&#xff09;是为了满足企业决策分析需求而设计的数据环境&#xff0c;它与传统数据库有明显的不同。 一.数据库仓库概述 定义: 数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合&#xff0c;用于支持企业管理和…

机械设计-哈工大课程学习-螺旋传动

二、摩擦类型 1、静态摩擦&#xff1a;这是身体静止时所经历的摩擦。换句话说&#xff0c;就是身体有运动倾向时的摩擦力。 2、动态摩擦&#xff1a;这是身体在运动时所经历的摩擦。也称为动摩擦。动摩擦有以下两种类型&#xff1a; ①滑动摩擦&#xff1a;一个物体在另一个…

C# Socket通信从入门到精通(17)——单个异步UDP服务器监听一个客户端C#代码实现

前言: 我们在开发UDP通信程序时,除了开发UDP同步客户端程序,有时候我们也需要开发异步UDP服务器程序,所谓的异步最常见的应用就是服务器接收客户端数据以后,程序不会卡在数据接收这里,而是可以继续往下执行,这在实际项目中是经常会遇到的,所以说掌握异步UDP服务器程序…

学会这个工具,小白也可制作门窗电子画册

​随着互联网技术的发展&#xff0c;现在制作电子画册已经变得非常简单。如果你是一个新手&#xff0c;也可以通过学习一些技巧来制作门窗电子画册。 那么&#xff0c;如何制作门窗电子画册呢&#xff1f;其实&#xff0c;这个过程并不复杂。只需要一台电脑和一个基本的操作工具…

K8s(七)四层代理Service

Service概述 Service在Kubernetes中提供了一种抽象的方式来公开应用程序的网络访问&#xff0c;并提供了负载均衡和服务发现等功能&#xff0c;使得应用程序在集群内外都能够可靠地进行访问。 每个Service都会自动关联一个对应的Endpoint。当创建一个Service时&#xff0c;Ku…

Es bulk批量导入数据(1w+以上)

最近在学习es的理论知识以及实际操作&#xff0c;随时更新~ 概要&#xff1a;首先你得有1w条数据的json&#xff0c;然后用java读取json文件导入 一. 创建Json数据 首先我生成1.5w条数据&#xff0c;是为了实践分页查询&#xff0c;用from-size和scroll翻页去实践 生成四个字段…

检索增强(RAG)的方式---重排序re-ranking

提升RAG&#xff1a;选择最佳嵌入Embedding&重排序Reranker模型 检索增强生成(RAG)技术创新进展&#xff1a;自我检索、重排序、前瞻检索、系统2注意力、多模态RAG RAG的re-ranking指的是对初步检索出来的候选段落或者文章&#xff0c;通过重新排序的方式来提升检索质量。…

mac安装部署gitbook教程

mac安装部署gitbook教程 前言一、安装准备二、GitBook安装项目初始化 前言 一些自己实际操作的记录。 一、安装准备 Node.js gitbook基于Node.js&#xff0c;所以需要提前安装。 下载地址&#xff1a;https://nodejs.org/en/&#xff0c;可以下载比较新的版本。(但我的建议是不…

Linux指令补充和权限简单介绍

一.tar指令 形式&#xff1a;tar [-cxtzjvf] 文件与目录 ....
 参数&#xff1a;
 -c &#xff1a;建立一个压缩文件的参数指令(create 的意思)&#xff1b; -x &#xff1a;解开一个压缩文件的参数指令&#xff01; -t &#xff1a;查看 tarfile 里面的文件&#xff01; -…

为什么C++17要引入std::string_view?

目录 1.引言 2.原理分析 2.1.结构 2.2.构造函数 2.3.成员函数 2.4.std::string_view字面量 3.实例 3.1.std::string_view和std::string的运算符操作 3.2.查找函数使用 3.3.std::string_view和临时字符串 4.总结 1.引言 在C/C日常编程中&#xff0c;我们常进行数据的…

JDK8新增的时间类

目录 内容大纲&#xff1a; 1、Zoneld时区 2、Instant时间戳 3、ZoneDateTime带时区的时间 4、DateTimeFormatter用于时间的格式化和解析 5、Calendar类&#xff1a; 6、工具类 内容大纲&#xff1a; 1、Zoneld时区 方法名说明static Set<String>getArailableZoneIds()获…

java集合(4)

1.HashSet集合 1.1HashSet集合概述和特点【应用】 底层数据结构是哈希表 存取无序 不可以存储重复元素 没有索引,不能使用普通for循环遍历 1.2HashSet集合的基本应用【应用】 存储字符串并遍历 public class HashSetDemo {public static void main(String[] args) {//创…