用 Go 优雅地清理 HTML 并抵御 XSS——Bluemonday

1、背景与动机

只要你的服务接收并回显用户生成内容(UGC)——论坛帖子、评论、富文本邮件正文、Markdown 等——就必须考虑 XSS(Cross‑Site Scripting)攻击风险。浏览器在解析 HTML 时会执行脚本;如果不做清理,恶意用户可插入 <script>onerror 等内容窃取 Cookie 或劫持会话。

Bluemonday 的使命就是 “先 allowlist,后输出”:只留下安全允许的元素与属性,其余一律剥离,保证最终字符串对浏览器“无害”。

2、XSS 攻击原理与防线简述

攻击类型触发机理常见载体
反射型恶意片段拼进 URL,服务器原样输出搜索框、重定向链接
存储型恶意脚本写入数据库,其他用户浏览时触发论坛帖子、评论
DOM 型前端 JS 对外部数据拼接 innerHTMLJSONP、模板拼接

综合防御思路

  1. 输入校验:长度、格式、白名单字符集。
  2. 输出编码/清理:HTMLEscape、CSP、Bluemonday 等。
  3. 最小权限:Cookie HttpOnly/SameSite、前后端分离降低风险。

3、认识 Bluemonday

3.1 主要特性

  • 纯 Go 实现;零 CGo 依赖,可用在任意平台。
  • 基于允许列表(Allowlist);默认拒绝一切未知元素,安全系数高。
  • 多种预置策略StrictPolicyUGCPolicyNewPolicy() 自定义。
  • 线程安全:Policy 对象是只读,可被多个 goroutine 并发复用。
  • 支持 string/[]byte/io.Reader 三种输入形式,便于流式处理。citeturn0search1

3.2 安装与版本管理

go get github.com/microcosm-cc/bluemonday@latest

Bluemonday 发布节奏相对稳定,建议在 go.mod 中锁定次版本号(v1.x.y)以避免潜在破坏性变更。

4、快速上手:StrictPolicy 一键剥离标签

最“硬核”的策略就是全部移除标签,仅保留文本

policy := bluemonday.StrictPolicy()
clean  := policy.Sanitize(`<p>Hello <strong>世界</strong>!<script>alert(1)</script></p>`)
// clean == "Hello 世界!"

该策略实现了 “硬删除脚本 + 去掉所有属性” 的极致安全;在 Markdown‑>HTML 渲染前做一次清理,可有效杀死脚本注入。citeturn0search0

5 、进阶使用:UGCPolicy 与自定义策略

5.1 UGCPolicy——保留安全富文本

StrictPolicy 虽安全,却也太“干净”。当你需要 保留 <a><em><ul> 等常用排版元素 时,可以使用官方预设的 UGCPolicy()

p   := bluemonday.UGCPolicy()
out := p.Sanitize(`<a href="http://evil.com" onclick="steal()">点我</a>`)
fmt.Println(out)
// <a href="http://evil.com" rel="nofollow">点我</a>

重点:

  • 允许 <a>、自动加 rel="nofollow"
  • 过滤一切 JS‑相关属性onclick, onerror 等)。
  • 自动修正不完整/畸形标签,防跳脱闭合漏洞。citeturn0search2

5.2 手写自定义 Policy

如果业务场景需要 保留特定 CSS class、data-* 自定义属性,可通过 NewPolicy() 自定义:

p := bluemonday.NewPolicy()// 允许 block/inline 常用元素
p.AllowElements("p", "ul", "li", "strong", "em")// 允许 <a>,但仅开放 href=https://* 并加 rel="noopener"
p.AllowAttrs("href").Matching(bluemonday.UrlRegexp).OnElements("a")
p.RequireNoFollowOnLinks(false)
p.AddTargetBlankToFullyQualifiedLinks(true)// 允许 <span class="highlight">
p.AllowAttrs("class").Matching(regexp.MustCompile(`^(highlight)$`)).OnElements("span")// …更多颗粒度设置

Bluemonday 的 API 链式可读性高;官方文档中每个 Allow* 方法都带示例,可参考并组合。

6、性能、并发与内存开销

  • 并发安全:Policy 初始化后为只读结构体,可在全局变量缓存并被 goroutine 复用。
  • 基于标准库 html Tokenizer:解析成本≈ O(n),常规博文(~5 KB)清理耗时 < 100 µs。
  • 零分配策略SanitizeBytes 复用切片,避免多余 copy。

性能调优要点:

  1. 单例化 Policy,避免每次请求都 NewPolicy()
  2. 对高并发流量可用 sync.Pool 复用临时缓冲区,减轻 GC 压力。

7、与 Gin 集成的落地示例

// middleware/htmlsan.go
var htmlPolicy = bluemonday.UGCPolicy()func SanitizeHTML() gin.HandlerFunc {return func(c *gin.Context) {if c.Request.Method == http.MethodPost || c.Request.Method == http.MethodPut {// 读 bodyraw, _ := io.ReadAll(c.Request.Body)clean := htmlPolicy.SanitizeBytes(raw)// 重写 body 并继续链路c.Request.Body = io.NopCloser(bytes.NewReader(clean))c.Request.ContentLength = int64(len(clean))}c.Next()}
}

注册:

r := gin.Default()
r.Use(middleware.SanitizeHTML())
  • 适用于 富文本编辑器上传评论接口 等写操作。
  • 若上传为 JSON,可在绑定结构体前使用 json.Decoder + htmlPolicy.Sanitize() 逐字段过滤。

8、单元测试与安全基线

func TestStripXSS(t *testing.T) {cases := []struct{in, out string}{{`<img src=x onerror=alert(1)>`, ``},{`<a href="javascript:alert(1)">x</a>`, `<a rel="nofollow">x</a>`},}p := bluemonday.UGCPolicy()for _, c := range cases {if got := p.Sanitize(c.in); got != c.out {t.Errorf("want %q, got %q", c.out, got)}}
}
  • 建议将常见 XSS Payload 集合(OWASP Cheat Sheet)纳入回归测试。
  • 关注安全通报:例如 Go‑2022‑0588 提及自定义策略允许 style 时可能触发 CSS XSS,应尽量避免。

9、常见陷阱 & 优化建议

场景潜在风险建议
盲目 AllowElements("style")CSS 注入绕过使用 CSP 并限制 style
文件上传富文本嵌入 <img src="data:…">内嵌恶意 SVG限制 src 协议为 https
前端再拼接 innerHTML += …DOM XSS前端使用 textContent 或框架安全输出
大文件批量清理内存飙升使用 SanitizeReader 流式处理

10、 结语

Bluemonday 把复杂的 XSS 防御落地成本降到了“引一个包 + 三行代码”
然而安全永远不是“一招鲜”:

  • 输入校验、输出清理、浏览器 CSP 缺一不可。
  • 单元测试 & 安全扫描 持续跟进新 Payload。
  • 合理选择 StrictPolicy / UGCPolicy / 自定义混合策略,平衡 用户体验安全强度

把好内容入口关,让你的 Go Web 服务拥有“消毒后”的纯净输入!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/78007.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Redis SCAN 命令的详细介绍

Redis SCAN 命令的详细介绍 以下是 Redis SCAN​ 命令的详细介绍&#xff0c;结合其核心特性、使用场景及底层原理进行综合说明&#xff1a; 工作原理图 &#xff1a; ​ 一、核心特性 非阻塞式迭代 通过游标&#xff08;Cursor&#xff09; 分批次遍历键&#xff0c;避免一次…

SpringBoot3集成MyBatis-Plus(解决Boot2升级Boot3)

总结&#xff1a;目前升级仅发现依赖有变更&#xff0c;其他目前未发现&#xff0c;如有发现&#xff0c;后续会继续更新 由于项目架构提升&#xff0c;以前开发的很多公共的组件&#xff0c;以及配置都需要升级&#xff0c;因此记录需要更改的配置&#xff08;记录时间&#…

基于mybatis与PageHelper插件实现条件分页查询(3.19)

实现商品分页例子 需要先引入mybatis与pagehelper插件&#xff0c;在pom.xml里 <!-- Mybatis --> <dependency><groupId>org.mybatis.spring.boot</groupId><artifactId>mybatis-spring-boot-starter</artifactId><version>3.0.3&l…

Spring Bean 全方位指南:从作用域、生命周期到自动配置详解

目录 1. Bean 的作用域 1.1 singleton 1.2 prototype 1.3 request 1.4 session 1.5 application 1.5.1 servletContext 和 applicationContext 区别 2. Bean 的生命周期 2.1 详解初始化 2.1.1 Aware 接口回调 2.1.2 执行初始化方法 2.2 代码示例 2.3 源码 [面试题…

C++ (非类型参数)

模板除了定义类型参数之外&#xff0c;也可以在模板内定义非类型参数 非类型参数不是类型&#xff0c;而是值&#xff0c;比如&#xff1a;指针&#xff0c;整数&#xff0c;引用 非类型参数的用法&#xff1a; 1.整数常量&#xff1a;非类型参数最常见的形式是整数常量&…

短视频+直播商城系统源码全解析:音视频流、商品组件逻辑剖析

时下&#xff0c;无论是依托私域流量运营的品牌方&#xff0c;还是追求用户粘性与转化率的内容创作者&#xff0c;搭建一套完整的短视频直播商城系统源码&#xff0c;已成为提升用户体验、增加商业变现能力的关键。本文将围绕三大核心模块——音视频流技术架构、商品组件设计、…

5.QT-常用控件-QWidget|enabled|geometry|window frame(C++)

控件概述 实现图形化界面的程序. Qt中已经给我们提供了很多的“控件" 就需要学习和了解这些控件&#xff0c;学会如何使用这些控件 编程讲究的是“站在巨人的肩膀上”&#xff0c;而不是“从头发明轮子" 一个图形化界面上的内容&#xff0c;不需要咱们全都从零去实…

2025-04-22| Docker: --privileged参数详解

在 Docker 中&#xff0c;--privileged 是一个运行容器时的标志&#xff0c;它赋予容器特权模式&#xff0c;大幅提升容器对宿主机资源的访问权限。以下是 --privileged 的作用和相关细节&#xff1a; 作用 完全访问宿主机的设备&#xff1a; 容器可以访问宿主机的所有设备&am…

高性能服务器配置经验指南1——刚配置好服务器应该做哪些事

文章目录 安装ubuntu安装必要软件设置用户远程连接安全问题ClamAV安装教程步骤 1&#xff1a;更新系统软件源步骤 2&#xff1a;升级系统&#xff08;可选但推荐&#xff09;步骤 3&#xff1a;安装 ClamAV步骤 4&#xff1a;更新病毒库步骤 5&#xff1a;验证安装ClamAV 常用命…

直流绝缘监测解决方案:保障工业与新能源系统的安全运行

一、引言 随着工业自动化和新能源技术的快速发展&#xff0c;直流供电系统在光伏发电、储能电站、电动汽车充电桩等领域的应用日益广泛。然而&#xff0c;直流系统的正负极不接地&#xff08;IT系统&#xff09;特性&#xff0c;使得绝缘故障可能导致漏电、短路甚至设备损毁等…

VSCode 用于JAVA开发的环境配置,JDK为1.8版本时的配置

插件安装 JAVA开发在VSCode中&#xff0c;需要安装JAVA的必要开发。当前安装只需要安装 “Language Support for Java(TM) by Red Hat”插件即可 安装此插件后&#xff0c;会自动安装包含如下插件&#xff0c;不再需要单独安装 Project Manager for Java Test Runner for J…

C++入门语法

C入门 首先第一点&#xff0c;C中可以混用C语言中的语法。但是C语言是不兼容C的。C主要是为了改进C语言而创建的一门语言&#xff0c;就是有人用C语言用不爽了&#xff0c;改出来个C。 命名空间 c语言中会有如下这样的问题&#xff1a; 那么C为了解决这个问题就整出了一个命名…

输入框仅支持英文、特殊符号、全角自动转半角 vue3

需求&#xff1a;封装一个输入框组件 1.只能输入英文。 2.输入的小写英文自动转大写。 3.输入的全角特殊符号自动转半角特殊字符 效果图 代码 <script setup> import { defineEmits, defineModel, defineProps } from "vue"; import { debounce } from "…

Uniapp:创建项目

目录 一、前提准备二、创建项目三、项目结构四、运行测试 一、前提准备 首先要创建uniapp项目&#xff0c;需要先下载HBuilderX&#xff0c;HBuilderX是一款开箱即用的工具&#xff0c;下载完毕之后&#xff0c;解压到指定的目录即可使用&#xff0c;需要注意的是最好路径里面…

ESM 内功心法:化解 require 中的夺命一击!

前言 传闻在JavaScript与TypeScript武林中,曾有两大绝世心法:CommonJS与ESM。两派高手比肩而立,各自称霸一方,江湖一度风平浪静。 岂料,时局突变。ESM逐步修成阳春白雪之姿,登堂入室,成为主流正统。CommonJS则渐入下风,功力不济,逐渐退出主舞台。 话说某日,一位前…

【STL】unordered_set

在 C C C 11 11 11 中&#xff0c; S T L STL STL 标准库引入了一个新的标准关联式容器&#xff1a; u n o r d e r e d _ s e t unordered\_set unordered_set&#xff08;无序集合&#xff09;。功能和 s e t set set 类似&#xff0c;都用于存储唯一元素。但是其底层数据结…

go语言八股文

1.go语言的接口是怎么实现 接口&#xff08;interface&#xff09;是一种类型&#xff0c;它定义了一组方法的集合。任何类型只要实现了接口中定义的所有方法&#xff0c;就被认为实现了该接口。 代码的实现 package mainimport "fmt"// 定义接口 type Shape inte…

kafka auto.offset.reset详解

在 Kafka 中&#xff0c;auto.offset.reset latest 的含义及行为如下&#xff1a; 1. ​​核心定义​​ 当消费者组​​首次启动​​或​​无法找到有效的 offset​​&#xff08;例如 offset 过期、被删除或从未提交&#xff09;时&#xff0c;消费者会从分区的​​最新位置…

深度学习-损失函数

目录 1. 线性回归损失函数 1.1 MAE损失 1.2 MSE损失 2. CrossEntropyLoss 2.1 信息量 2.2 信息熵 2.3 KL散度 2.4 交叉熵 3. BCELoss 4. 总结 1. 线性回归损失函数 1.1 MAE损失 MAE&#xff08;Mean Absolute Error&#xff0c;平均绝对误差&#xff09;通常也被称…

第六篇:linux之解压缩、软件管理

第六篇&#xff1a;linux之解压缩、软件管理 文章目录 第六篇&#xff1a;linux之解压缩、软件管理一、解压和压缩1、window压缩包与linux压缩包能否互通&#xff1f;2、linux下压缩包的类型3、打包与压缩 二、软件管理1、rpm1、什么是rpm&#xff1f;2、rpm包名组成部分3、如何…