在JavaScript中,可以通过不同的方式将字符串序列化为二进制数据。以下是几种常见的方法:
-
TextEncoder 和 TextDecoder
JavaScript 提供了TextEncoder
和TextDecoder
对象,可以用来处理字符串和二进制数据之间的转换。// 将字符串转换为二进制数据 const encoder = new TextEncoder(); const text = 'Hello, 你好!'; const encoded = encoder.encode(text);// 将二进制数据解码为字符串 const decoder = new TextDecoder(); const decoded = decoder.decode(encoded);console.log(encoded); // Uint8Array(15) [72, 101, 108, 108, 111, 44, 32, 228, 189, 160, 229, 165, 189, 33] console.log(decoded); // Hello, 你好!
这种方法可以处理 UTF-8 编码的字符串。
-
TypedArray
可以使用 TypedArray 来处理二进制数据,例如Uint8Array
。// 将字符串转换为 Uint8Array const text = 'Hello, 你好!'; const bytes = new Uint8Array(text.length); for (let i = 0; i < text.length; i++) {bytes[i] = text.charCodeAt(i); }console.log(bytes); // Uint8Array(15) [72, 101, 108, 108, 111, 44, 32, 203, 156, 229, 165, 189, 33]
这种方法需要注意字符编码的处理,特别是非 ASCII 字符。
-
直接操作字符串的 UTF-16 编码
JavaScript 中的字符串使用 UTF-16 编码,可以直接操作其编码单元(16 位)。// 将字符串转换为 UTF-16 编码 const text = 'Hello, 你好!'; const bytes = new Uint16Array(text.length); for (let i = 0; i < text.length; i++) {bytes[i] = text.charCodeAt(i); }console.log(bytes); // Uint16Array(8) [72, 101, 108, 108, 111, 44, 20320, 22909]
这种方法比较底层,需要理解字符串的 UTF-16 编码方式。
根据具体的需求和场景,可以选择适合的方法将字符串序列化为二进制数据。