本文主要针对React源码进行解析,内容有:
1、Diff算法原理、两次遍历
2、Diff瓶颈及限制
3、Diff更新之单节点和多节点原理
一、Diff源码解析
以下是关于 React Diff 算法的详细解析及实例:
1、React Diff 算法的基本概念和重要性
1.1 概念
React Diff
算法是 React
用于比较虚拟 DOM 树之间差异的一种高效算法。其目的是在更新组件时,尽可能高效地找出真实 DOM 中需要更新的最小部分
,从而减少不必要的 DOM 操作,提高渲染性能。
会将当前组件与该组件上次更新时对应的Fiber
节点进行比较,将比较的结果生成新的Fiber
节点
1.2 重要性
在前端应用中,频繁的 DOM 操作是非常昂贵的,会导致性能下降。通过 Diff 算法,React 可以在每次状态变化时,先在虚拟 DOM 层面进行比较和计算,只对实际发生变化的部分进行真实 DOM 的更新,大大提高了应用的性能和响应速度。
2、Diff 算法的原理
2.1 树的层级比较
(1) 不同类型的元素,React销毁原节点,新建节点
React 首先会对新旧两棵虚拟 DOM 树进行层级比较。如果两棵树的根节点类型不同,React 会直接销毁旧树,重新创建新树并插入到 DOM 中。
例如,旧的根节点是一个 <div>
,新的根节点是一个 <span>
,那么 React 会将旧的 <div>
及其子树从 DOM 中移除,然后创建新的 <span>
及其子树并插入到 DOM 中。
(2)同一层级节点比较
当根节点类型相同时,React 会进一步比较同一层级的子节点。
1、对于类型为元素的节点(如 <div>
、<p>
等):
- 首先比较节点的属性(如
className
、style
等),如果属性发生了变化,React 会更新相应的 DOM 属性。 - 然后比较子节点。React 采用了一种高效的策略,通过给每个子节点设置唯一的
key
属性来辅助比较。
2、 key
的作用:
key
是用来帮助 React 识别哪些子元素发生了变化。在列表渲染中,如果子元素没有设置key
,React 会进行低效的顺序比较。当设置了key
后,React 可以更准确、更快速地找到变化的元素。
例如,在渲染一个列表时:
{[1, 2, 3].map((item) => (<li key={item}>{item}</li>))}
- 如果列表中的元素顺序发生了变化,React 可以通过
key
快速识别出哪些元素移动了,哪些元素是新增或删除的,而不是对整个列表进行重新渲染。
3、使用index作为key有性能问题
:
- 如果列表顺序发生变化,可能无法有效的复用组件
- 删除或者增加元素时,索引改变,可能会重建元素而不是复用
3、实例分析
假设初始状态有以下组件结构:
<div id="parent"><p className="text">Hello</p><ul><li>Item 1</li><li>Item 2</li></ul>
</div>
当状态更新后变为:
<div id="parent"><p className="new-text">World</p><ul><li>Item 2</li><li>Item 3</li></ul>
</div>
-
树的层级比较
根节点<div>
类型没有变化,继续比较子节点。 -
子节点比较
<p>
节点:
类型相同,但是className
从"text"
变为"new-text"
,并且文本从"Hello"
变为"World"
。React 会更新<p>
元素的className
和文本内容。
<ul>
节点:
类型相同,继续比较子<li>
节点。
第一个<li>
节点:
旧列表中的"Item 1"
消失,React 会从 DOM 中移除对应的<li>
元素。
第二个<li>
节点:
文本从"Item 2"
没有变化,但是位置发生了变化,React 会根据新的位置进行 DOM 操作,将其移动到新的位置。
新增了"Item 3"
的<li>
节点,React 会创建新的<li>
元素并插入到 DOM 中。
通过这样的 Diff 算法,React 能够高效地处理组件的更新,只对实际发生变化的部分进行 DOM 操作,保证了应用的性能和用户体验。
4、相关节点
结合render
和commit
阶段,一个DOM节点最多有4个节点
与之相关:
- current Fiber。如果该DOM节点已在页面中,current Fiber代表该DOM节点对应的Fiber节点;
- workInProgress Fiber。如果该DOM节点将在本次更新中渲染到页面中,workInProgress Fiber代表该DOM节点对应的Fiber节点;
- DOM节点本身;
- JSX对象。即ClassComponent的render方法的返回结果,或FunctionComponent的调用结果。JSX对象中包含描述DOM节点的信息;
5、Diff的瓶颈及处理方法
diff操作本身也会带来性能损耗,React文档中提到,即使在最前沿的算法中,将前后两棵树完全比对的算法的复杂程度为 O(n^3)
,其中n是树中元素的数量;如果在React中使用了该算法,那么展示1000个元素所需要执行的计算量将在十亿的量级范围。这个开销实在是太过高昂;
为了降低算法复杂度,React的diff会预设三个限制:
- 只对
同级元素
进行diff。如果一个DOM节点在前后两次更新中跨越了层级,那么React会忽略; - 两个不同类型的元素会产生出不同的树。如果元素由div变为p,React会
销毁
div及其子孙节点,并新建p及其子孙节点; - 开发者可以通过 key prop来暗示哪些子元素在不同的渲染下能保持稳定;
6、Diff是如何实现的
Diff的入口函数是reconcileChildFibers:会根据newChild(即JSX对象)类型调用不同的处理函数
// 根据newChild类型选择不同diff函数处理
function reconcileChildFibers(returnFiber: Fiber,currentFirstChild: Fiber | null,newChild: any,
): Fiber | null {const isObject = typeof newChild === 'object' && newChild !== null;if (isObject) {// object类型,可能是 REACT_ELEMENT_TYPE 或 REACT_PORTAL_TYPEswitch (newChild.$$typeof) {case REACT_ELEMENT_TYPE:// 调用 reconcileSingleElement 处理// // ...省略其他case}}if (typeof newChild === 'string' || typeof newChild === 'number') {// 调用 reconcileSingleTextNode 处理// ...省略}if (isArray(newChild)) {// 调用 reconcileChildrenArray 处理// ...省略}// 一些其他情况调用处理函数// ...省略// 以上都没有命中,删除节点return deleteRemainingChildren(returnFiber, currentFirstChild);
}
根据同级的节点数量将Diff分为两类:
- 当newChild类型为object、number、string,代表同级只有一个节点
- 当newChild类型为Array,同级有多个节点
7、单节点diff
可以用文字来描述一个 React Diff 单节点更新的简单逻辑:
7.1 整体流程:
-
开始比较:
首先获取旧的虚拟 DOM 节点和新的虚拟 DOM 节点。
检查它们的类型是否相同(例如都是<div>
、<p>
等)。 -
类型相同的处理:
如果类型相同,进一步检查属性。
属性比较可以看作是一个属性列表的对比,对于不同的属性(如className
、style
等)进行标记。
然后检查子节点。
对于子节点,如果是文本节点,对比文本内容是否变化;如果是元素节点,递归地进行同样的节点类型、属性和子节点的比较。 -
类型不同的处理:
如果类型不同,直接标记该节点及其子树需要完全更新。
旧节点将从 DOM 中卸载,新节点将创建并插入到 DOM 中。
大致可以用以下的流程图来表示(简化版):
开始
|
V
节点类型相同?
|---- 否 ----> 卸载旧节点,创建新节点插入DOM
|
V
属性有变化?
|---- 否 ----> 不操作属性
|
V
检查子节点
|
V
子节点变化?
|---- 否 ----> 不操作子节点
|
V
结束
通过这个流程图也可以解释单节点diff的过程:
以下是 React Diff 单节点更新的原理及实例解析:
7.2 实例
假设初始有以下组件:
function App() {return (<div id="myDiv" className="oldClass"><p>Initial Text</p></div>);
}
当状态更新后变为:
function App() {return (<div id="myDiv" className="newClass"><p>Updated Text</p></div>);
}
-
节点类型检查:
前后都是<div>
,节点类型未变,继续下一步。 -
属性比较:
id
属性未变。
className
从oldClass
变为newClass
,React 会更新 DOM 中<div>
元素的className
属性。 -
子节点比较:
<p>
标签仍然存在。
文本从Initial Text
变为Updated Text
,React 会更新<p>
元素中的文本内容。
通过这样的过程,React 在 Diff 算法中对单节点进行了有效的更新,只更新了发生变化的部分,避免了不必要的 DOM 操作,从而提高了性能。
8、多节点diff
8.1 概述
对于多节点的functionComponent,reconcileChildFibers的newChild参数类型为Array,执行reconcileChildrenArray
if (isArray(newChild)) {// 调用 reconcileChildrenArray 处理// ...省略
}
同级多个节点的diff,归纳为:
- 节点更新
// 更新前
<ul><li key="0" className="before">0<li><li key="1">1<li>
</ul>// 更新后 情况1 —— 节点属性变化
<ul><li key="0" className="after">0<li><li key="1">1<li>
</ul>// 更新后 情况2 —— 节点类型更新
<ul><div key="0">0</div><li key="1">1<li>
</ul>
- 节点新增或减少
// 更新前
<ul><li key="0">0<li><li key="1">1<li>
</ul>// 更新后 情况1 —— 新增节点
<ul><li key="0">0<li><li key="1">1<li><li key="2">2<li>
</ul>// 更新后 情况2 —— 删除节点
<ul><li key="1">1<li>
</ul>
- 节点位置变化
// 更新前
<ul><li key="0">0<li><li key="1">1<li>
</ul>// 更新后
<ul><li key="1">1<li><li key="0">0<li>
</ul>
前提:操作优先级一样,但实际开发中,React团队发现,相较于新增和删除,更新组件发生的频率更高。所以Diff会优先判断当前节点是否属于更新。
8.2 思路
react团队提供的思路:2轮遍历
- 处理 更新 的节点;
- 处理非 更新 的节点;
8.3 第一轮遍历
- let i = 0,遍历newChildren,将newChildren[i]与oldFiber比较,判断DOM节点是否可复用;
- 如果可复用,i++,继续比较newChildren[i]与oldFiber.sibling,可以复用则继续遍历;
- 如果不可复用,分两种情况:
- key不同导致不可复用,立即跳出整个遍历,第一轮遍历结束;
- key相同type不同导致不可复用,会将oldFiber标记为DELETION,并继续遍历;
- 如果newChildren遍历完(即 i === newChildren.length - 1 )或者oldFiber遍历完(即oldFiber.sibling === null),跳出遍历,第一轮遍历结束;
8.4 第二轮遍历
-
newChildren 和 oldFiber 同时遍历完
不需要第二轮的遍历,直接进行 update,diff结束; -
newChildren没遍历完,oldFiber遍历完
已有的DOM节点都对比结束,这时还有新加入的节点,意味着本次更新有新节点插入,我们只需要遍历剩下的newChildren为生成的workInProgress fiber依次标记Placement; -
newChildren遍历完,oldFiber没遍历完
本次更新比之前的节点数量少,有节点被删除了。所以需要遍历剩下的oldFiber,依次标记Deletion; -
newChildren与oldFiber都没遍历完
意味着有节点更新了位置
😖如何处理更新后的节点,将oldFiber放入map数据结构中
我们将所有还未处理的oldFiber存入以index为key,oldFiber为value的Map中
let existingChildren= new Map();
existingChildren.set(index, oldFiber);
接下来遍历剩余的newChildren
,通过newChildren[i].index
就能在existingChildren
中找到key相同的oldFiber
😖标记节点是否移动
本次更新中节点是按newChildren的顺序排列。在遍历newChildren过程中,每个遍历到的可复用节点一定是当前遍历到的所有可复用节点中最靠右的那个,即一定在lastPlacedIndex对应的可复用的节点在本次更新中位置的后面;
所以只需要比较遍历到的可复用节点在上次更新时是否也在lastPlacedIndex对应的oldFiber后面,就能知道两次更新中这两个节点的相对位置改变没有;
我们用变量oldIndex表示遍历到的可复用节点在oldFiber中的位置索引。
如果oldIndex < lastPlacedIndex
,代表本次更新该节点需要向右移动
;
8.5 代码示例
// 之前
abcd// 之后
acdb===第一轮遍历开始===
a(之后)vs a(之前)
key不变,可复用
此时 a 对应的oldFiber(之前的a)在之前的数组(abcd)中索引为0
所以 lastPlacedIndex = 0;继续第一轮遍历...c(之后)vs b(之前)
key改变,不能复用,跳出第一轮遍历
此时 lastPlacedIndex === 0;
===第一轮遍历结束======第二轮遍历开始===
newChildren === cdb,没用完,不需要执行删除旧节点
oldFiber === bcd,没用完,不需要执行插入新节点将剩余oldFiber(bcd)保存为map// 当前oldFiber:bcd
// 当前newChildren:cdb继续遍历剩余newChildrenkey === c 在 oldFiber中存在
const oldIndex = c(之前).index;
此时 oldIndex === 2; // 之前节点为 abcd,所以c.index === 2
比较 oldIndex 与 lastPlacedIndex;如果 oldIndex >= lastPlacedIndex 代表该可复用节点不需要移动
并将 lastPlacedIndex = oldIndex;
如果 oldIndex < lastplacedIndex 该可复用节点之前插入的位置索引小于这次更新需要插入的位置索引,代表该节点需要向右移动在例子中,oldIndex 2 > lastPlacedIndex 0,
则 lastPlacedIndex = 2;
c节点位置不变继续遍历剩余newChildren// 当前oldFiber:bd
// 当前newChildren:dbkey === d 在 oldFiber中存在
const oldIndex = d(之前).index;
oldIndex 3 > lastPlacedIndex 2 // 之前节点为 abcd,所以d.index === 3
则 lastPlacedIndex = 3;
d节点位置不变继续遍历剩余newChildren// 当前oldFiber:b
// 当前newChildren:bkey === b 在 oldFiber中存在
const oldIndex = b(之前).index;
oldIndex 1 < lastPlacedIndex 3 // 之前节点为 abcd,所以b.index === 1
则 b节点需要向右移动
===第二轮遍历结束===最终acd 3个节点都没有移动,b节点被标记为移动