编码与转换 编码与转换是一种在不改变数据核心含义的前提下,改变其表示或传输方式的技术。常见的例子包括 URL 编码、Base64、HTML 实体编码和 Unicode 转换。攻击者利用这些方法作为“小工具”,以绕过输入过滤器、躲避 Web 应用防火墙,或突破数据清理流程。 概要 Unicode Unicode 正规化 Punycode Base64 实验环境 参考文献 Unicode Unicode 是一种通用字符编码标准,用于表示世界上几乎所有书写系统的文本。每个字符(字母、数字、符号、表情符号)都被分配一个唯一的代码点(例如,“A”的代码点是 U+0041)。UTF-8 和 UTF-16 等 Unicode 编码格式定义了如何将这些代码点存储为字节。