dubbo知识点总结 持续更新

Dubbo 支持哪些协议,每种协议的应用场景,优缺点?

dubbo 单一长连接和 NIO 异步通讯,适合大并发小数据量的服务调用,

 以及消费者远大于提供者。传输协议 TCP,异步,Hessian 序列化;

rmi 采用 JDK 标准的 rmi 协议实现,传输参数和返回参数对象需要实现

Serializable 接口,使用 java 标准序列化机制,使用阻塞式短连接,传输数

据包大小混合,消费者和提供者个数差不多,可传文件,传输协议 TCP

多个短连接,TCP 协议传输,同步传输,适用常规的远程服务调用和 rmi

操作。在依赖低版本的 Common-Collections 包,java 序列化存在安全漏 洞;

webservice 基于 WebService 的远程调用协议,集成 CXF 实现,提供和

原生 WebService 的互操作。多个短连接,基于 HTTP 传输,同步传输,适

用系统集成和跨语言调用;

http 基于 Http 表单提交的远程调用协议,使用 Spring HttpInvoke

 现。多个短连接,传输协议 HTTP,传入参数大小混合,提供者个数多于消

 费者,需要给应用程序和浏览器 JS 调用;

hessian 集成 Hessian 服务,基于 HTTP 通讯,采用 Servlet 暴露服务,

Dubbo 内嵌 Jetty 作为服务器时默认实现,提供与 Hession 服务互操作。多

个短连接,同步 HTTP 传输,Hessian 序列化,传入参数较大,提供者大于

消费者,提供者压力较大,可传文件;

memcache 基于 memcached 实现的 RPC 协议

redis 基于 redis 实现的 RPC 协议

Dubbo 超时时间怎样设置?

 Dubbo 超时时间设置有两种方式:

服务提供者端设置超时时间,在 Dubbo 的用户文档中,推荐如果能在服务

端多配置就尽量多配置,因为服务提供者比消费者更清楚自己提供的服务特

性。

服务消费者端设置超时时间,如果在消费者端设置了超时时间,以消费者端

为主,即优先级更高。因为服务调用方设置超时时间控制性更灵活。如果消

费方超时,服务端线程不会定制,会产生警告。

Dubbo 有些哪些注册中心?

Multicast 注册中心: Multicast 注册中心不需要任何中心节点,只要广播地

址,就能进行服务注册和发现。基于网络中组播传输实现;

Zookeeper 注册中心: 基于分布式协调系统 Zookeeper 实现,采用

 Zookeeper watch 机制实现数据变更;

redis 注册中心: 基于 redis 实现,采用 key/Map 存储,住 key 存储服务名

 和类型,Map key 存储服务 URLvalue 服务过期时间。基于 redis 的发

 /订阅模式通知数据变更;

Simple 注册中心

Dubbo 集群的负载均衡有哪些策略  

 

 

 Dubbo 提供了常见的集群策略实现,并预扩展点予以自行实现。

Random LoadBalance: 随机选取提供者策略,有利于动态调整提供者权

重。截面碰撞率高,调用次数越多,分布越均匀;

RoundRobin LoadBalance: 轮循选取提供者策略,平均分布,但是存在请

求累积的问题;

LeastActive LoadBalance: 最少活跃调用策略,解决慢提供者接收更少的

请求;

ConstantHash LoadBalance: 一致性 Hash 策略,使相同参数请求总是发

到同一提供者,一台机器宕机,可以基于虚拟节点,分摊至其他提供者,避

免引起提供者的剧烈变动;

Dubbo 是什么?

Dubbo 是一个分布式、高性能、透明化的 RPC 服务框架,提

供服务自动注册、自动发现等高效服务治理方案, 可以和

Spring 框架无缝集成。

Dubbo 的主要应用场景?

透明化的远程方法调用,就像调用本地方法一样调用远程方法,

只需简单配置,没有任何 API 侵入。

软负载均衡及容错机制,可在内网替代 F5 等硬件负载均衡器,

降低成本,减少单点。

服务自动注册与发现,不再需要写死服务提供方地址,注册中心

基于接口名查询服务提供者的 IP 地址,并且能够平滑添加或删

除服务提供者。

Dubbo 的核心功能?

 

 

主要就是如下 3 个核心功能:

. Remoting网络通信框架,提供对多种 NIO 框架抽象封装,包括

同步转异步请求-响应模式的信息交换方式。

. Cluster:服务框架,提供基于接口方法的透明远程过程调用,包括多

协议支持,以及软负载均衡,失败容错,地址路由,动态配置等集群

支持。

. Registry:服务注册,基于注册中心目录服务,使服务消费方能动态

的查找服务提供方,使地址透明,使服务提供方可以平滑增加或减少

机器。

. Dubbo 的核心组件?

.

Dubbo 服务注册与发现的流程?

 

流程说明:

. Provider(提供者)绑定指定端口并启动服务

. 指供者连接注册中心,并发本机 IP、端口、应用信息和提供服务信息

发送至注册中心存储

. Consumer(消费者),连接注册中心 ,并发送应用信息、所求服务信

息至注册中心

. 注册中心根据 消费 者所求服务信息匹配对应的提供者列表发送至

Consumer 应用缓存。

. Consumer 在发起远程调用时基于缓存的消费者列表择其一发起调

用。

. Provider 状态变更会实时通知注册中心、在由注册中心实时推送至

Consumer

 

 

设计的原因:

. Consumer Provider 解偶,双方都可以横向增减节点数。

. 注册中心对本身可做对等集群,可动态增减节点,并且任意一台宕掉

后,将自动切换到另一台

. 去中心化,双方不直接依懒注册中心,即使注册中心全部宕机短时间

内也不会影响服务的调用

. 服务提供者无状态,任意一台宕掉后,不影响使用

Dubbo 的架构设计?

 

Dubbo 框架设计一共划分了 10 个层:

. 服务接口层(Service:该层是与实际业务逻辑相关的,根据服务提供方和服务消费方的业务设计对应的接口和实现。

. 配置层(Config:对外配置接口,以 ServiceConfig 和ReferenceConfig 为中心。

. 服务代理层(Proxy):服务接口透明代理,生成服务的客户端 Stub和服务器端 Skeleton

 服务注册层(Registry:封装服务地址的注册与发现,以服务 URL为中心。

 

. 集群层(Cluster:封装多个提供者的路由及负载均衡,并桥接注册中心,以 Invoker 为中心。

. 监控层(MonitorRPC 调用次数和调用时间监控。

. 远程调用层(Protocol:封将 RPC 调用,以 Invocation Result为中心,扩展接口为 ProtocolInvoker Exporter

. 信息交换层(Exchange:封装请求响应模式,同步转异步,以Request 和 Response 为中心。

. 网络传输层(Transport:抽象 mina netty 为统一接口,以Message 为中心。

 

 

Dubbo 支持哪些协议,每种协议的应用场景,优缺点?

. dubbo 单一长连接和 NIO 异步通讯,适合大并发小数据量的服务

调用,以及消费者远大于提供者。传输协议 TCP,异步,Hessian

列化;

. rmi 采用 JDK 标准的 rmi 协议实现,传输参数和返回参数对象需要

实现 Serializable 接口,使用 java 标准序列化机制,使用阻塞式短连

接,传输数据包大小混合,消费者和提供者个数差不多,可传文件,

 

传输协议 TCP 多个短连接,TCP 协议传输,同步传输,适用常规的

远程服务调用和 rmi 互操作。在依赖低版本的 Common-Collections

包,java 序列化存在安全漏洞;

. webservice 基于 WebService 的远程调用协议,集成 CXF 实现,

提供和原生 WebService 的互操作。多个短连接,基于 HTTP 传输,

同步传输,适用系统集成和跨语言调用;

. http 基于 Http 表单提交的远程调用协议,使用 Spring

HttpInvoke 实现。多个短连接,传输协议 HTTP,传入参数大小混

合,提供者个数多于消费者,需要给应用程序和浏览器 JS 调用;

. hessian 集成 Hessian 服务,基于 HTTP 通讯,采用 Servlet 暴露

服务,Dubbo 内嵌 Jetty 作为服务器时默认实现,提供与 Hession

务互操作。多个短连接,同步 HTTP 传输,Hessian 序列化,传入参

数较大,提供者大于消费者,提供者压力较大,可传文件;

. memcache 基于 memcached 实现的 RPC 协议

. redis 基于 redis 实现的 RPC 协议

dubbo 推荐用什么协议?

默认使用 dubbo 协议

Dubbo 有些哪些注册中心?

. Multicast 注册中心: Multicast 注册中心不需要任何中心节点,只

要广播地址,就能进行服务注册和发现。基于网络中组播传输实现;

 

. Zookeeper 注册中心: 基于分布式协调系统 Zookeeper 实现,采用

 

Zookeeper watch 机制实现数据变更;

. redis 注册中心: 基于 redis 实现,采用 key/Map 存储,住 key 存储

服务名和类型,Map key 存储服务 URLvalue 服务过期时间。基

redis 的发布/订阅模式通知数据变更;

. Simple 注册中心

Dubbo 默认采用注册中心?

采用 Zookeeper

为什么需要服务治理?

. 过多的服务 URL 配置困难

. 负载均衡分配节点压力过大的情况下也需要部署集群

. 服务依赖混乱,启动顺序不清晰

 

. 过多服务导致性能指标分析难度较大,需要监控

Dubbo 的注册中心集群挂掉,发布者和订阅者之间还能通信么?

可以的,启动 dubbo 时,消费者会从 zookeeper 拉取注册的生产者

的地址接口等数据,缓存在本地。

每次调用时,按照本地存储的地址进行调用。

Dubbo Spring 的关系?

Dubbo 采用全 Spring 配置方式,透明化接入应用,对应用没有任何

API 侵入,只需用 Spring 加载 Dubbo 的配置即可,Dubbo 基于

Spring Schema 扩展进行加载。

Dubbo 使用的是什么通信框架?

默认使用 NIO Netty 框架

Dubbo 集群提供了哪些负载均衡策略?

Random LoadBalance: 随机选取提供者策略,有利于动态调整提供者权重。截面碰撞率高,调用次数越多,分布越均匀;

RoundRobin LoadBalance: 轮循选取提供者策略,平均分布,但是存在请求累积的问题;

LeastActive LoadBalance: 最少活跃调用策略,解决慢提供者接收更少的请求;

ConstantHash LoadBalance: 一致性 Hash 策略,使相同参数请求

 

总是发到同一提供者,一台机器宕机,可以基于虚拟节点,分摊至其

他提供者,避免引起提供者的剧烈变动;

缺省时为 Random 随机调用

Dubbo 的集群容错方案有哪些?

. Failover Cluster

. 失败自动切换,当出现失败,重试其它服务器。通常用于读操作,但重试会带来更长延迟。

. Failfast Cluster

. 快速失败,只发起一次调用,失败立即报错。通常用于非幂等性的写操作,比如新增记录。

. Failsafe Cluster

. 失败安全,出现异常时,直接忽略。通常用于写入审计日志等操作。

. Failback Cluster

. 失败自动恢复,后台记录失败请求,定时重发。通常用于消息通知操作。

. Forking Cluster

并行调用多个服务器,只要一个成功即返回。通常用于实时性要求较高的读操作,但需要浪费更多服务资源。可通过 forks="2" 来设置最大并行数。

 

. Broadcast Cluster

. 广播调用所有提供者,逐个调用,任意一台报错则报错 。通常用于通知所有提供者更新缓存或日志等本地资源信息。

Dubbo 的默认集群容错方案?

Failover Cluster

Dubbo 支持哪些序列化方式?

默认使用 Hessian 序列化,还有 DuddoFastJsonJava 自带序列

化。

Dubbo 超时时间怎样设置?

Dubbo 超时时间设置有两种方式:

. 服务提供者端设置超时时间,在 Dubbo 的用户文档中,推荐如果能

在服务端多配置就尽量多配置,因为服务提供者比消费者更清楚自己

提供的服务特性。

. 服务消费者端设置超时时间,如果在消费者端设置了超时时间,以消

费者端为主,即优先级更高。因为服务调用方设置超时时间控制性更

灵活。如果消费方超时,服务端线程不会定制,会产生警告。

 

服务调用超时问题怎么解决?

dubbo 在调用服务不成功时,默认是会重试两次的。

Dubbo 在安全机制方面是如何解决?

Dubbo 通过 Token 令牌防止用户绕过注册中心直连,然后在注册中

心上管理授权。Dubbo 还提供服务黑白名单,来控制服务所允许的调

用方。

Dubbo Dubbox 之间的区别?

dubbox 基于 dubbo 上做了一些扩展,如加了服务可 restful

用,更新了开源组件等。

Dubbo Spring Cloud 的关系?

Dubbo SOA 时代的产物,它的关注点主要在于服务的调用,流

量分发、流量监控和熔断。而 Spring Cloud 诞生于微服务架构时

代,考虑的是微服务治理的方方面面,另外由于依托了 Spirng

Spirng Boot 的优势之上,两个框架在开始目标就不一致,Dubbo

定位服务治理、Spirng Cloud 是一个生态。

Dubbo Spring Cloud 的区别?

最大的区别:Dubbo 底层是使用 Netty 这样的 NIO 框架,是基于

 

TCP 协议传输的,配合以 Hession 序列化完成 RPC 通信。

SpringCloud 是基于 Http 协议+Rest 接口调用远程过程的通信,

相对来说,Http 请求会有更大的报文,占的带宽也会更多。但是

REST 相比 RPC 更为灵活,服务提供方和调用方的依赖只依靠一纸契

约,不存在代码级别的强依赖。

 Dubbo zookeeper 做注册中心,如果注册中心集群都挂掉,发布者和订阅者之间还能通信么?

可以通信的,启动 dubbo 时,消费者会从 zk 拉取注册的生产者的地址接口等数据,缓存在本地。每次调用时,按照本

地存储的地址进行调用;

注册中心对等集群,任意一台宕机后,将会切换到另一台;注册中心全部宕机后,服务的提供者和消费者仍能通过本

地缓存通讯。服务提供者无状态,任一台 宕机后,不影响使用;服务提供者全部宕机,服务消费者会无法使用,并无

限次重连等待服务者恢复;

挂掉是不要紧的,但前提是你没有增加新的服务,如果你要调用新的服务,则是不能办到的。

附文档截图:

dubbo 服务负载均衡策略?

l Random LoadBalance

随机,按权重设置随机概率。在一个截面上碰撞的概率高,但调用量越大分布越均匀,而且按概率使用权重后也比

较均匀,有利于动态调整提供者权重。(权重可以在 dubbo 管控台配置)

l RoundRobin LoadBalance

轮循,按公约后的权重设置轮循比率。存在慢的提供者累积请求问题,比如:第二台机器很慢,但没挂,当请求调

到第二台时就卡在那,久而久之,所有请求都卡在调到第二台上。

l LeastActive LoadBalance

最少活跃调用数,相同活跃数的随机,活跃数指调用前后计数差。使慢的提供者收到更少请求,因为越慢的提供者的

调用前后计数差会越大。

l ConsistentHash LoadBalance

一致性 Hash,相同参数的请求总是发到同一提供者。当某一台提供者挂时,原本发往该提供者的请求,基于虚拟节

点,平摊到其它提供者,不会引起剧烈变动。缺省只对第一个参数 Hash

Dubbo 在安全机制方面是如何解决的

Dubbo 通过 Token 令牌防止用户绕过注册中心直连,然后在注册中心上管理授权。Dubbo 还提供服务黑白名单,来控

制服务所允许的调用方。

dubbo 连接注册中心和直连的区别

在开发及测试环境下,经常需要绕过注册中心,只测试指定服务提供者,这时候可能需要点对点直连,

点对点直联方式,将以服务接口为单位,忽略注册中心的提供者列表,

服务注册中心,动态的注册和发现服务,使服务的位置透明,并通过在消费方获取服务提供方地址列表,实现软负载

均衡和 Failover 注册中心返回服务提供者地址列表给消费者,如果有变更,注册中心将基于长连接推送变更数据给

消费者。

服务消费者,从提供者地址列表中,基于软负载均衡算法,选一台提供者进行调用,如果调用失败,再选另一台调

用。注册中心负责服务地址的注册与查找,相当于目录服务,服务提供者和消费者只在启动时与注册中心交互,注册

中心不转发请求,服务消费者向注册中心获取服务提供者地址列表,并根据负载算法直接调用提供者,注册中心,服

务提供者,服务消费者三者之间均为长连接,监控中心除外,注册中心通过长连接感知服务提供者的存在,服务提供

者宕机,注册中心将立即推送事件通知消费者

注册中心和监控中心全部宕机,不影响已运行的提供者和消费者,消费者在本地缓存了提供者列表

注册中心和监控中心都是可选的,服务消费者可以直连服务提供者。

 

 

dubbo 通信协议 dubbo 协议为什么要消费者比提供者个数多:

dubbo 协议采用单一长连接,假设网络为千兆网卡(1024Mbit=128MByte)

根据测试经验数据每条连接最多只能压满 7MByte(不同的环境可能不一样,供参考),理论上 1 个服务提供者需要 20

个服务消费者才能压满网卡。

dubbo 通信协议 dubbo 协议为什么不能传大包:

dubbo 协议采用单一长连接,

如果每次请求的数据包大小为 500KByte,假设网络为千兆网卡(1024Mbit=128MByte),每条连接最大 7MByte(不同的

环境可能不一样,供参考)

单个服务提供者的 TPS(每秒处理事务数)最大为:128MByte / 500KByte = 262

单个消费者调用单个服务提供者的 TPS(每秒处理事务数)最大为:7MByte / 500KByte = 14

 

dubbo 通信协议 dubbo 协议为什么采用异步单一长连接:

因为服务的现状大都是服务提供者少,通常只有几台机器,

而服务的消费者多,可能整个网站都在访问该服务,

比如 Morgan 的提供者只有 6 台提供者,却有上百台消费者,每天有 1.5 亿次调用,

如果采用常规的 hessian 服务,服务提供者很容易就被压跨,

通过单一连接,保证单一消费者不会压死提供者,

长连接,减少连接握手验证等,

并使用异步 IO,复用线程池,防止 C10K 问题。

dubbo 通信协议 dubbo 协议适用范围和适用场景

适用范围:传入传出参数数据包较小(建议小于 100K),消费者比提供者个数

多,单一消费者无法压满提供者,尽量不要用 dubbo协议传输大文件或超大字 符串。 适用场景:常规远程服务方法调用

dubbo协议补充:

连接个数:单连接

连接方式:长连接

传输协议:TCP

传输方式:NIO 异步传输

序列化:Hessian 二进制序列化

RMI 协议

RMI协议采用 JDK标准的 java.rmi.*实现,采用阻塞式短连接和 JDK标准序列

化方式,Java标准的远程调用协议。

连接个数:多连接

连接方式:短连接

传输协议:TCP

传输方式:同步传输

序列化:Java标准二进制序列化 适用范围:传入传出参数数据包大小混合,消费者与提供者个数差不多,可传

文件。 适用场景:常规远程服务方法调用,与原生 RMI服务互操作

Hessian 协议

Hessian协议用于集成 Hessian的服务,Hessian底层采用 Http通讯,采用

Servlet暴露服务,Dubbo缺省内嵌 Jetty作为服务器实现

基于 Hessian的远程调用协议。 连接个数:多连接

连接方式:短连接

传输协议:HTTP 传输方式:同步传输 序列化:Hessian二进制序列化

适用范围:传入传出参数数据包较大,提供者比消费者个数多,提供者压力较

大,可传文件。

适用场景:页面传输,文件传输,或与原生 hessian服务互操作

http

采用 Spring HttpInvoker实现

基于 http表单的远程调用协议。

连接个数:多连接

连接方式:短连接

传输协议:HTTP

传输方式:同步传输

序列化:表单序列化(JSON

适用范围:传入传出参数数据包大小混合,提供者比消费者个数多,可用浏览

器查看,可用表单或 URL传入参数,暂不支持传文件。

适用场景:需同时给应用程序和浏览器 JS使用的服务。

Webservice

基于 CXF frontend-simple transports-http实现

基于 WebService的远程调用协议。 连接个数:多连接 连接方式:短连接 传输协议:HTTP 传输方式:同步传输 序列化:SOAP文本序列化 适用场景:系统集成,跨语言调用。

Thrif

Thrift Facebook捐给 Apache的一个 RPC框架,当前 dubbo 支持的 thrift

协议是对 thrift 原生协议的扩展,在原生协议的基础上添加了一些额外的头信 息,比如 service namemagic number

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/445235.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

无限踩坑系列(6)-mySQL数据库链接错误

mySQL数据库链接错误错误1错误2长链接短连接应用场景需要一直访问mySQL数据库,遇到如下错误:错误1 释放已经释放的数据库链接conn.,或者,操作已经释放的数据库链接conn.或者失去链接后再操作数据库都可能会报这个错误 aise err.I…

初探函数式编程和面对对象式编程

文章目录目录1.函数式编程和面向对象编程概念1.1 函数式编程1.2 面向对象编程2.函数式编程和面向对象编程的优缺点2.1 函数式编程优点缺点2.2 面对对象编程优点缺点3.为什么在并行计算中函数式编程比较好3.1 什么是并行计算3.2 函数式编程兴起原因目录 1.函数式编程和面向对象…

搜索详解

搜索 一.dfs和bfs简介 深度优先遍历(dfs) 本质: 遍历每一个点。 遍历流程: 从起点开始,在其一条分支上一条路走到黑,走不通了就往回走,只要当前有分支就继续往下走,直到将所有的点遍历一遍。 剪枝&a…

特征工程总结

目录1 特征工程是什么? 2 数据预处理   2.1 无量纲化     2.1.1 标准化     2.1.2 区间缩放法     2.1.3 标准化与归一化的区别   2.2 对定量特征二值化   2.3 对定性特征哑编码   2.4 缺失值计算   2.5 数据变换 3 特征选择   3.1 Filter …

Jmeter测试并发https请求成功了

Jmeter2.4 如何测试多个并发https请求,终于成功了借此机会分享给大家 首先要安装jmeter2.4版本的,而且不建议大家使用badboy,因为这存在兼容性问题。对于安装,我就不讲了,我就说说如何测试https,想必大家都…

关系数据库——sql基础1定义

关系数据库标准语言SQL 基本概念 SQL语言是一个功能极强的关系数据库语言。同时也是一种介于关系代数与关系演算之间的结构化查询语言(Structured Query Language),其功能包括数据定义、数据查询、数据操纵和数据控制。 SQL的特点&#xff…

大数据学习(09)--Hadoop2.0介绍

文章目录目录1.Hadoop的发展与优化1.1 Hadoop1.0 的不足与局限1.2 Hadoop2.0 的改进与提升2.HDFS2.0 的新特性2.1 HDFS HA2.2 HDFS Federation3. 新一代的资源管理器YARN3.1 MapReduce1.0 缺陷3.2 YARN的设计思路3.3 YARN 体系结构3.4 YARN工作流程3.5 YARN框架与MapReduce1.0框…

Java多线程常用方法

start()与run() start() 启动线程并执行相应的run()方法 run() 子线程要执行的代码放入run()方法 getName()和setName() getName() 获取此线程的名字 setName() 设置此线程的名字 isAlive() 是判断当前线程是否处于活动状态。活动状态就是已经启动尚未终止。 curren…

MachineLearning(2)-图像分类常用数据集

图像分类常用数据集1 CIFAR-102.MNIST3.STL_104.Imagenet5.L-Sun6.caltech-101在训练神经网络进行图像识别分类时,常会用到一些通用的数据集合。利用这些数据集合可以对比不同模型的性能差异。下文整理常用的图片数据集合(持续更新中)。基本信息对比表格…

大数据学习(09)--spark学习

文章目录目录1.spark介绍1.1 spark介绍1.2 scale介绍1.3 spark和Hadoop比较2.spark生态系统3.spark运行框架3.1 基本概念3.2 架构的设计3.3 spark运行基本流程3.4 spark运行原理3.5 RDD运行原理3.5.1 设计背景3.5.2 RDD概念和特性3.5.3 RDD之间的依赖关系3.5.4 stage的划分3.5.…

机器学习中的聚类方法总结

聚类定义 定义 聚类就是对大量未知标注 的数据集,按数据 的内在相似性将数据集划分为多个类别,使 类别内的数据相似度较大而类别间的数据相 似度较小。是无监督的分类方式。 聚类思想 给定一个有N个对象的数据集,构造数据的k 个簇&#x…

关系数据库——关系数据语言

关系 域:一组具有相同数据类型的值的集合(即取值范围) 笛卡尔积:域上的一种集合运算。结果为一个集合,集合的每一个元素是一个元组,元组的每一个分量来自不同的域。 基数:一个域允许的不同取值…

机器学习问题总结(01)

文章目录1.请描述推荐系统中协同过滤算法CF的原理2.请描述决策树的原理、过程、终止条件,以及如何防止过拟合2.1决策树生成算法2.2 剪枝处理(防止过拟合)2.3 停止条件2.4 棵决策树的生成过程2.5 决策树的损失函数3.请描述K-means的原理&#…

Python实例讲解 -- 解析xml

Xml代码 <?xml version"1.0" encoding"utf-8"?> <info> <intro>信息</intro> <list id001> <head>auto_userone</head> <name>Jordy</name> <number&g…

python(22)--面向对象1-封装

python面向对象1面向过程/面向对象2面向对象核心概念-类3类的设计3.1类三要素-类名、属性、方法3.2面向对象基础语法3.2.1查看对象的常用方法3.2.2类定义3.2.3创建类对象3.2.4__init__()方法3.2.5 self参数3.2.6类内置方法和属性_del_()方法--销毁对象_str_()方法--定制化输出对…

机器学习问题总结(02)

文章目录1.stacking模型以及做模型融合的知识1.1 从提交结果中融合1.2 stacking1.3 blending2. 怎样去优化SVM算法模型的&#xff1f;2.1 SMO优化算法2.2 libsvm 和 Liblinear3.现有底层是tensorflow的keras框架&#xff0c;如果现在有一个tensorflow训练好的模型&#xff0c;k…

C/C++常见面试题(四)

C/C面试题集合四 目录 1、什么是C中的类&#xff1f;如何定义和实例化一个类&#xff1f; 2、请解释C中的继承和多态性。 3、什么是虚函数&#xff1f;为什么在基类中使用虚函数&#xff1f; 4、解释封装、继承和多态的概念&#xff0c;并提供相应的代码示例 5、如何处理内…

机器学习问题总结(03)

文章目录1.struct和class区别&#xff0c;你更倾向用哪个2.kNN&#xff0c;朴素贝叶斯&#xff0c;SVM的优缺点&#xff0c;各种算法优缺点2.1 KNN算法2.2 朴素贝叶斯2.3SVM算法2.4 ANN算法2.5 DT算法3. 10亿个整数&#xff0c;1G内存&#xff0c;O(n)算法&#xff0c;统计只出…

redis——新版复制

sync虽然解决了数据同步问题&#xff0c;但是在数据量比较大情况下&#xff0c;从库断线从来依然采用全量复制机制&#xff0c;无论是从数据恢复、宽带占用来说&#xff0c;sync所带来的问题还是很多的。于是redis从2.8开始&#xff0c;引入新的命令psync。 psync有两种模式&a…

Python(23)-面向对象2-继承,多态

面向对象基本概念2--继承、多态1.继承基本概念2.子类重写父类方法2.1完全重写2.2扩展父类方法--super()3.多继承4.新式类和旧式类5.多态基本概念6.类属性、类方法-classmethod6.1类属性6.2类方法classmethod7.静态方法staticmethod8.案例分析本系列博文来自学习《Python基础视频…