PHP 反序列化漏洞:手写序列化文本

文章目录

  • 参考
  • 环境
  • 序列化文本
  • Scalar Type
      • 整数
      • 浮点数
      • 布尔值
      • 字符串
  • Compound Type
      • 数组
          • 数据结构
          • 序列化文本
      • 对象
          • 数据结构
          • 序列化文本
  • Special Type
      • NULL
          • 数据结构
          • 序列化文本
  • 手写序列化文本过程中的注意事项
      • 个数描述须于现实相符
      • 序列化文本前缀的大小写变化
      • 符号
      • 公共属性

参考

项目描述
搜索引擎BingGoogle
AI 大模型文心一言通义千问讯飞星火认知大模型ChatGPT
PHP 手册PHP Manual

环境

项目描述
PHP8.0.0

序列化文本

在 PHP 反序列化漏洞中,我们都需要使用到 序列化文本。常常采用的方法是通过 PHP 代码创建目标数据后再使用 serialize() 函数将其转化为序列化文本。对此,请参考如下示例:

<?php# 定义目标数据
class MyClass
{public $name = 'RedHeart';public $nation = 'China';
}$myClass = new MyClass();# 通过 serialize 函数获得序列化文本
var_dump(serialize($myClass));

执行效果

string(69) "O:7:"MyClass":2:{s:4:"name";s:8:"RedHeart";s:6:"nation";s:5:"China";}"

此办法虽然可行,但我们仍需要 对 PHP 中各种数据类型的序列化文本的结构有一定认识。在某些特殊场景下,手写序列化文本 才是最好的选择🧙🏻‍♂️。

Scalar Type

在 PHP 中,标量数据类型 Scalar Type 是多种基础类型的统称。标量数据类型具体而言,包含 整型 int浮点型 float布尔型 boolean字符串 string 四种类型。

整数

在 PHP 中,整数数据类型用于表示 整型数值,可以是 正数负数。整数的序列化文本由 i: 和具体的数值组成,且序列化文本以 ; 结尾。对此,请参考如下示例:

<?phpvar_dump(serialize(1));
var_dump(serialize(999));
var_dump(serialize(-0));
var_dump(serialize(-93));

执行效果

string(4) "i:1;"
string(6) "i:999;"
string(4) "i:0;"
string(6) "i:-93;"

浮点数

数学中,数值包含整数及小数。而在 PHP 中,小数被称为浮点数。浮点数的序列化文本由 d: 和具体的浮点数值组成,且序列化文本以 ; 结尾。对此,请参考如下示例:

<?phpvar_dump(serialize(1.000));
var_dump(serialize(999.36));
var_dump(serialize(-0.374));
# 数值中的 e 或 E 表示科学计数法,
# 就 339E-10 而言,表示 339 * 10 ** -10
var_dump(serialize(339E-10));

执行效果

string(4) "d:1;"
string(9) "d:999.36;"
string(9) "d:-0.374;"
string(10) "d:3.39E-8;"

为什么使用 d: 而不是 f: 呢?d 即双精度浮点数,全称为 double。在PHP的内部实现中,浮点数使用 双精度浮点数(double-precision floating-point numbers) 来表示。双精度浮点数相比于单精度浮点数(通常表示为 float),具体存在如下区别:

  1. 单精度浮点数
    使用 32 位存储,通常以 IEEE 754 单精度标准表示。单精度浮点数提供约 7 位有效数字的精度,适用于大多数应用场景,但对于某些需要更高精度的计算来说可能不够。

  2. 双精度浮点数
    使用 64 位存储,通常以 IEEE 754 双精度标准表示。双精度浮点数提供约 15 ~ 16 位有效数字的精度,因此比单精度浮点数具有更高的精度,适用于需要更精确计算的应用。

布尔值

布尔值常用于 逻辑运算,用于表示某一 个条件语句的对错。布尔值由 组成,分别与序列化文本 b:1;b:0; 相对应。

字符串

在 PHP 中,字符串用于表示 文本数据。字符串的序列化文本由 s字符串所占用的字节数 以及 具体的字符串值 三部分组成,每两部分内容 使用 : 进行分隔,且序列化文本以分号 ; 进行结尾。对此,请参考如下示例:

<?phpvar_dump(serialize('Hello World'));
var_dump(serialize('3.1415926'));
var_dump(serialize('����.?'));
var_dump(serialize('你好,中国'));

执行效果

string(19) "s:11:"Hello World";"
string(16) "s:9:"3.1415926";"
string(23) "s:15:"����.?";"
string(23) "s:15:"你好,中国";"

Compound Type

Compound Type 类型指的是 由其他数据类型组合而成的复合数据类型。在 PHP 中,主要有两种复合数据类型,即 数组 Array对象 Object。复合类型 可以包含多个值或属性,并且允许以不同的方式组合不同类型的数据

数组

数据结构

数组是一个包含 键值对 的数据结构,其中键通常是 整数或字符串,而值可以是 任意数据类型(标量数据类型、复合数据类型或 NULL)。数组用于存储和操作多个相关的值。对此,请参考如下示例:

<?php$arr = [1, 2, 3, 4];
$arr1 = ['arr' => $arr, 'arr1' => 'Nested Array', 3 => 'I am three'
];var_dump($arr1);
var_dump($arr1['arr1']);
var_dump($arr[2]);
var_dump($arr1[3]);

执行效果

array(3) {["arr"]=>array(4) {[0]=>int(1)[1]=>int(2)[2]=>int(3)[3]=>int(4)}["arr1"]=>string(12) "Nested Array"[3]=>string(10) "I am three"
}
string(12) "Nested Array"
int(3)
string(10) "I am three"
序列化文本

数组的序列化文本的大致格式如下:

a:数组中的元素个数:{键的序列化文本(分号结尾)值的序列化文本(分号结尾)}

举个栗子

<?php$arr = [1, 2, 3, 4];
$arr1 = ['arr' => $arr,'arr1' => 'Nested Array',3 => 'I am three'
];
$arr2 = [];var_dump(serialize($arr));
var_dump(serialize($arr1));
var_dump(serialize($arr2));

执行效果

string(38) "a:4:{i:0;i:1;i:1;i:2;i:2;i:3;i:3;i:4;}"
string(107) "a:3:{s:3:"arr";a:4:{i:0;i:1;i:1;i:2;i:2;i:3;i:3;i:4;}s:4:"arr1";s:12:"Nested Array";i:3;s:10:"I am three";}"
string(6) "a:0:{}"

对象

数据结构

对象是基于 类 Class 定义的数据类型,每个对象都是该类的实例,并且可以包含属性和方法。对象用于表示具有 一组属性和相关行为 的实体。对此,请参考如下示例:

<?phpclass MyClass
{public $name = 'RedHeart';public $nation = 'China';function sayHello() {print('Hello China' . "\n");}
}# 实例化对象
$myClass = new MyClass();# 访问对象的属性
var_dump($myClass -> name);
var_dump($myClass -> nation);
# 访问对象的方法
$myClass -> sayHello();

执行效果

string(8) "RedHeart"
string(5) "China"
Hello China
序列化文本

对象的序列化文本的大致结构为:

O:对象名称所包含的字符数:对象的名称:对象的属性个数:{属性的序列化文本(分号结尾)属性值的序列化文本(分号结尾)}

举个栗子

<?phpclass MyClass
{public $name = 'RedHeart';public $nation = 'China';function sayHello() {print('Hello China' . "\n");}
}$myClass = new MyClass();var_dump(serialize($myClass));

执行效果

string(69) "O:7:"MyClass":2:{s:4:"name";s:8:"RedHeart";s:6:"nation";s:5:"China";}"

Special Type

在 PHP 中,Special Type 类型用于描述一些具有 特殊用途或特殊性质的数据类型或值。这类特殊类型 不属于标量类型或复合类型,在编程中 具有独特的用途和特性

NULL

数据结构

在 PHP 中,NULL 是一个特殊的值,常用于处理缺失的数据或未初始化的变量

注:

在 PHP 中,NULLTRUEFALSE 一般,都是 不区分大小写的。对此,请参考如下示例:

<?phpvar_dump(NULL);
var_dump(NuLL);
var_dump(null);var_dump(TRue);
var_dump(falSe);

执行效果

NULL
NULL
NULL
bool(true)
bool(false)
序列化文本

对于 不同形态(大小写之分)NULL,其序列化文本均为 N;,对此,请参考如下示例:

<?phpvar_dump(serialize(NULL));
var_dump(serialize(NuLL));
var_dump(serialize(null));

执行效果

string(2) "N;"
string(2) "N;"
string(2) "N;"

手写序列化文本过程中的注意事项

个数描述须于现实相符

在部分 PHP 序列化文本中,存在 描述元素个数的数值,这些数值 需要与实际的元素个数相符合。否则,PHP 将为此抛出异常。对此,请参考如下示例:

<?php# 错误的序列化文本
$serialize_text = 'a:2:{s:4:"name";s:8:"RedHeart";}';
var_dump(unserialize($serialize_text));# 正确的序列化文本
$serialize_text = 'a:1:{s:4:"name";s:8:"RedHeart";}';
var_dump(unserialize($serialize_text));

执行效果

PHP Notice:  unserialize(): Unexpected end of serialized data in C:\test.php on line 6
PHP Notice:  unserialize(): Error at offset 31 of 32 bytes in C:\test.php on line 6Notice: unserialize(): Unexpected end of serialized data in C:\test.php on line 6Notice: unserialize(): Error at offset 31 of 32 bytes in C:\test.php on line 6
bool(false)
array(1) {["name"]=>string(8) "RedHeart"
}

序列化文本前缀的大小写变化

对于不同的数据类型,PHP 在将其转化为序列化文本后都将为其添加 独特的前缀。前缀中的 字母的大小写需要进行严格控制。否则,PHP 将为此抛出异常。
具体而言,除字符串前缀 s: 中的字母 对大小写不敏感外,其他数据类型的前缀中的字母都 仅存在一种大小写形式(大写或小写)。对此,请参考如下示例:

<?phpvar_dump(unserialize('s:11:"Hello World";'));
var_dump(unserialize('S:11:"Hello World";'));var_dump(unserialize('i:1;'));
var_dump(unserialize('I:1;'));var_dump(unserialize('a:1:{S:4:"name";S:8:"RedHeart";}'));
var_dump(unserialize('A:1:{s:4:"name";s:8:"RedHeart";}'));

执行效果

PHP Notice:  unserialize(): Error at offset 0 of 4 bytes in C:\test.php on line 8
PHP Notice:  unserialize(): Error at offset 0 of 32 bytes in C:\test.php on line 11
string(11) "Hello World"
string(11) "Hello World"
int(1)Notice: unserialize(): Error at offset 0 of 4 bytes in C:\test.php on line 8
bool(false)
array(1) {["name"]=>string(8) "RedHeart"
}Notice: unserialize(): Error at offset 0 of 32 bytes in C:\test.php on line 11
bool(false)

符号

在 PHP 中的序列化文本中,所有符号都必须使用英式符号,而不能使用 中式符号。否则,PHP 将为此抛出异常。
在序列化文本中,如果需要使用到引号,则 引号必须使用双引号 而不是单引号。否则,PHP 将为此抛出异常。

公共属性

在 PHP 中,仅推荐在 PHP 对象中 仅包含公共属性 时手写相关的序列化文本 (不推荐不意味着不可行,因篇幅原因不在本篇博客中进行说明)。这是因为,在 PHP 中,当对象被序列化时,对象的非公共属性的名称会被特殊处理以表示其可见性。对此,请参考如下示例:

<?phpclass MyClass
{# 私有属性private $name = 'RedHeart';# 受保护属性protected $nation = 'China';
}var_dump(serialize(new MyClass()));

执行效果

string(82) "O:7:"MyClass":2:{s:13:" MyClass name";s:8:"RedHeart";s:9:" * nation";s:5:"China";}"

MyClass 类中的私有属性名称 name 在转化为序列化文本后,成了 s:13:" MyClass name;",相比原先的 name 增加了两个空格(实际上是 控制字符 NUL,无法通过空格进行代替)及所属类的名称 MyClass

这样的处理方式是为了 在反序列化对象时能够正确地还原属性的可见性。当 PHP 在反序列化时遇到这些特殊的前缀,PHP 会 知道如何正确地设置属性的可见性。公共属性不会有这种特殊处理,它们在序列化后的文本中保持原始的属性名。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/91959.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

编程每日一练(多语言实现)基础篇:求总数问题

文章目录 一、实例描述二、技术要点三、代码实现3.1 C 语言实现3.2 Python 语言实现3.3 Java 语言实现3.4 JavaScript 语言实现 一、实例描述 集邮爱好者把所有的邮票存放在三个集邮册中&#xff0c;在A册内存放全部的十分之二&#xff0c;在B册内存放不知道是全部的七分之几&…

MyBatis的一级缓存和二级缓存:原理和作用

MyBatis的一级缓存和二级缓存&#xff1a;原理和作用 引言 在数据库访问中&#xff0c;缓存是一种重要的性能优化手段&#xff0c;它可以减少数据库查询的次数&#xff0c;加快数据访问速度。MyBatis作为一款流行的Java持久层框架&#xff0c;提供了一级缓存和二级缓存来帮助…

基于Java的大学生就业招聘系统设计与实现(源码+lw+部署文档+讲解等)

文章目录 前言具体实现截图论文参考详细视频演示为什么选择我自己的网站自己的小程序&#xff08;小蔡coding&#xff09;有保障的售后福利 代码参考源码获取 前言 &#x1f497;博主介绍&#xff1a;✌全网粉丝10W,CSDN特邀作者、博客专家、CSDN新星计划导师、全栈领域优质创作…

【数据结构】排序算法(一)—>插入排序、希尔排序、选择排序、堆排序

&#x1f440;樊梓慕&#xff1a;个人主页 &#x1f3a5;个人专栏&#xff1a;《C语言》《数据结构》《蓝桥杯试题》《LeetCode刷题笔记》《实训项目》 &#x1f31d;每一个不曾起舞的日子&#xff0c;都是对生命的辜负 目录 前言 1.直接插入排序 2.希尔排序 3.直接选择排…

Synchronized 原 理

Synchronized 其 原 理 是 什 么 ? synchronized 是 Java 中实现互斥同步的一种机制。当查看被 synchronized 修饰的代码块编译后的字节码,会发现编译器生成了 monitorenter 和 monitorexit 两个字节码指令。 这两个指令的作用如下: monitorenter:当虚拟机执行到 monitor…

OpenCV之分水岭算法(watershed)

Opencv 中 watershed函数原型&#xff1a; void watershed( InputArray image, InputOutputArray markers ); 第一个参数 image&#xff0c;必须是一个8bit 3通道彩色图像矩阵序列&#xff0c;第一个参数没什么要说的。关键是第二个参数 markers&#xff0c;Opencv官方文档的说…

全网最全Python系列教程(非常详细)---集合讲解(学Python入门必收藏)

&#x1f9e1;&#x1f9e1;&#x1f9e1;这篇是关于Python中集合的讲解&#xff0c;涉及到以下内容&#xff0c;欢迎点赞和收藏&#xff0c;你点赞和收藏是我更新的动力&#x1f9e1;&#x1f9e1;&#x1f9e1; 1、集合是什么&#xff1f; 2、集合应该怎么去定义&#xff1f…

搭建前端框架

在终端进入web目录&#xff0c;然后创建vuecrud工程 创建工程并引入ElementUI和axios手把手教学>传送门:VueCLI脚手架搭建

C进阶-字符串和内存函数

文章目录 一、求字符串长度二、长度不受限制的字符串函数三、长度受限制的字符串函数介绍四、字符串查找五、错误信息报告六、字符操作七、内存操作函数 前言 C语言中对字符和字符串的处理很是频繁&#xff0c;但是C语言本身是没有字符串类型的&#xff0c;字符串通常放在常量…

力扣 -- 718. 最长重复子数组

解题步骤&#xff1a; 参考代码&#xff1a; class Solution { public:int findLength(vector<int>& nums1, vector<int>& nums2) {int m nums1.size();int n nums2.size();//多开一行&#xff0c;多开一列vector<vector<int>> dp(m 1, ve…

Ghostscript 在 Linux 和 Windows 系统的应用与问题解决

&#x1f337;&#x1f341; 博主猫头虎&#xff08;&#x1f405;&#x1f43e;&#xff09;带您 Go to New World✨&#x1f341; &#x1f984; 博客首页——&#x1f405;&#x1f43e;猫头虎的博客&#x1f390; &#x1f433; 《面试题大全专栏》 &#x1f995; 文章图文…

钱小雨--进

i-love-you 今日&#xff1a;小雨 地点&#xff1a;钱塘江 2023.10.01

【剑指Offer】4.二维数组中的查找

题目 在一个二维数组array中&#xff08;每个一维数组的长度相同&#xff09;&#xff0c;每一行都按照从左到右递增的顺序排序&#xff0c;每一列都按照从上到下递增的顺序排序。请完成一个函数&#xff0c;输入这样的一个二维数组和一个整数&#xff0c;判断数组中是否含有该…

道可云元宇宙每日资讯|甸柳中心幼儿园智慧幼+元宇宙空间上线

道可云元宇宙每日简报&#xff08;2023年9月27日&#xff09;讯&#xff0c;今日元宇宙新鲜事有&#xff1a; 甸柳中心幼儿园“智慧幼”元宇宙空间上线 9月26日&#xff0c;狮子座甸柳中心幼儿园“智慧幼”元宇宙空间上线仪式在山东新闻大厦成功举办。狮子座甸柳中心幼儿园“智…

背诵不等于理解,深度解析大模型背后的知识储存与提取

自然语言模型的背诵 (memorization) 并不等于理解。即使模型能完整记住所有数据&#xff0c;也可能无法通过微调 (finetune) 提取这些知识&#xff0c;无法回答简单的问题。 随着模型规模的增大&#xff0c;人们开始探索大模型是如何掌握大量知识的。一种观点认为这归功于 “无…

Unity 项目规范系列教程-简介

本系列教程前端是借助Unity开发&#xff0c;后端使用Golang语言。开发一套游戏&#xff1a;包含登录&#xff0c;玩家移动同步等。 在本系类教程中会重点关注一些项目规范。比如&#xff1a; 文件夹目录结构等。开发UI时创建图集&#xff0c;图集的作用和注意事项导入贴图时图…

【ARMv8 SIMD和浮点指令编程】NEON 加载指令——如何将数据从内存搬到寄存器(其它指令)?

除了基础的 LDx 指令,还有 LDP、LDR 这些指令,我们也需要关注。 1 LDNP (SIMD&FP) 加载 SIMD&FP 寄存器对,带有非临时提示。该指令从内存加载一对 SIMD&FP 寄存器,向内存系统发出访问是非临时的提示。用于加载的地址是根据基址寄存器值和可选的立即偏移量计算…

计算机网络(一):概述

参考引用 计算机网络微课堂-湖科大教书匠计算机网络&#xff08;第7版&#xff09;-谢希仁 1. 计算机网络在信息时代的作用 计算机网络已由一种通信基础设施发展成为一种重要的信息服务基础设施计算机网络已经像水、电、煤气这些基础设施一样&#xff0c;成为我们生活中不可或…

docker的组件和资源管理

Docker是一种开源的容器化平台&#xff0c;它提供了一种轻量级、可移植和可扩展的方式来打包、部署和运行应用程序。Docker的构成包括以下几个关键组件&#xff1a; Docker Engine&#xff1a;Docker Engine是Docker的核心组件&#xff0c;它负责管理容器的生命周期和资源隔离…

网络协议--概述

1.2 分层 网络协议通常分不同层次进行开发&#xff0c;每一层分别负责不同的通信功能。一个协议族&#xff0c;比如TCP/IP&#xff0c;是一组不同层次上的多个协议的组合。 TCP/IP通常被认为是一个四层协议系统&#xff0c;如图1-1所示。每一层负责不同的功能&#xff1a; 1.链…