文章目录
- 解决方法
- ASCII“字符”
- 1、ASCII 打印字符
- 2、ASCII 非打印控制字符
- 3、扩展 ASCII 打印字符
- 4、ASCII 之外
- ASCII 字符输入方法与常用地方
- 1、在文档中插入 ASCII 字符
- 2、输入方法
前言
xml 中包含了非打印字符的情况下,即使是放在cdata 中,在不同平台上解析结果不一样,ios 基本上会解析失败,Android基本上都能正确解析,H5有的能正常解析,有的不能正常解析,在这种情况下,要对这个字符进行过滤后再解析,因为这种字符在视觉上是不会呈现,但在word等文档中可以看到一些符号,和格式控制。
解决方法
过滤去除,去除时要取字符的ASCLL码值来判断,0-8,11,12,14-32的都去除
java 代码 逐字符检查过滤
public static String replaceLowASCIICharacters(String tmp) {StringBuilder info = new StringBuilder();for (int i = 0; i < tmp.length(); i++) {char c = tmp.charAt(i);if ((int) c <= 8) {continue;}if ((int) c >= 11 && (int) c <= 12) {continue;}if ((int) c >= 14 && (int) c <= 32) {continue;}info.append(c);}return info.toString();}
ASCII“字符”
1、ASCII 打印字符
数字 32–126 分配给了能在键盘上找到的字符,当您查看或打印文档时就会出现。注:十进制32代表空格 ,十进制数字 127 代表 DELETE 命令。
ASCII码和相应数字的对照表
2、ASCII 非打印控制字符
ASCII 表上的数字 0–31 分配给了控制字符,用于控制像打印机等一些外围设备。例如,12 代表换页/新页功能。此命令指示打印机跳到下一页的开头。
ASCII 非打印控制字符表
3、扩展 ASCII 打印字符
扩展的 ASCII 字符满足了对更多字符的需求。扩展的 ASCII 包含 ASCII 中已有的 128 个字符(数字 0–32 显示在下图中),又增加了 128 个字符,总共是 256 个。即使有了这些更多的字符,许多语言还是包含无法压缩到 256 个字符中的符号。因此,出现了一些 ASCII 的变体来囊括地区性字符和符号.
可复制字符表:
十进制 | 十六进制 | 字符 | 十进制 | 十六进制 | 字符 |
---|---|---|---|---|---|
128 | 80 | Ç | 192 | C0 | └ |
129 | 81 | ü | 193 | C1 | |
130 | 82 | é | 194 | C2 | ┬ |
129 | 81 | ü | 193 | C1 | ┴ |
130 | 82 | é | 194 | C2 | ┬ |
131 | 83 | â | 195 | C3 | ├ |
132 | 84 | ä | 196 | C4 | ─ |
133 | 85 | à | 197 | C5 | ┼ |
134 | 86 | å | 198 | C6 | ╞ |
135 | 87 | ç | 199 | C7 | ╟ |
136 | 88 | ê | 200 | C8 | ╚ |
137 | 89 | ë | 201 | C9 | ╔ |
138 | 8A | è | 202 | CA | ╩ |
139 | 8B | ï | 203 | CB | ╦ |
140 | 8C | î | 204 | CC | ╠ |
141 | 8D | ì | 205 | CD | ═ |
142 | 8E | Ä | 206 | CE | ╬ |
143 | 8F | Å | 207 | CF | ╧ |
144 | 90 | É | 208 | D0 | ╨ |
145 | 91 | æ | 209 | D1 | ╤ |
146 | 92 | Æ | 210 | D2 | ╥ |
147 | 93 | ô | 211 | D3 | ╙ |
148 | 94 | ö | 212 | D4 | Ô |
149 | 95 | ò | 213 | D5 | ╒ |
150 | 96 | û | 214 | D6 | ╓ |
151 | 97 | ù | 215 | D7 | ╫ |
152 | 98 | ÿ | 216 | D8 | ╪ |
153 | 99 | Ö | 217 | D9 | ┘ |
154 | 9A | Ü | 218 | DA | ┌ |
155 | 9B | ¢ | 219 | DB | █ |
156 | 9C | £ | 220 | DC | ▄ |
157 | 9D | ¥ | 221 | DD | ▌ |
158 | 9E | ₧ | 222 | DE | ▐ |
159 | 9F | ƒ | 223 | DF | ▀ |
160 | A0 | á | 224 | E0 | α |
161 | A1 | í | 225 | E1 | ß |
162 | A2 | ó | 226 | E2 | Γ |
163 | A3 | ú | 227 | E3 | π |
164 | A4 | ñ | 228 | E4 | Σ |
165 | A5 | Ñ | 229 | E5 | σ |
166 | A6 | ª | 230 | E6 | µ |
167 | A7 | º | 231 | E7 | τ |
168 | A8 | ¿ | 232 | E8 | Φ |
169 | A9 | ⌐ | 233 | E9 | Θ |
170 | AA | ¬ | 234 | EA | Ω |
171 | AB | ½ | 235 | EB | δ |
172 | AC | ¼ | 236 | EC | ∞ |
173 | AD | ¡ | 237 | ED | φ |
174 | AE | « | 238 | EE | ε |
175 | AF | » | 239 | EF | ∩ |
176 | B0 | ░ | 240 | F0 | ≡ |
177 | B1 | ▒ | 241 | F1 | ± |
178 | B2 | ▓ | 242 | F2 | ≥ |
179 | B3 | │ | 243 | F3 | ≤ |
180 | B4 | ┤ | 244 | F4 | ⌠ |
181 | B5 | ╡ | 245 | F5 | ⌡ |
182 | B6 | ╢ | 246 | F6 | ÷ |
183 | B7 | ╖ | 247 | F7 | ≈ |
184 | B8 | ╕ | 248 | F8 | ≈ |
185 | B9 | ╣ | 249 | F9 | ∙ |
186 | BA | ║ | 250 | FA | · |
187 | BB | ╗ | 251 | FB | √ |
188 | BC | ╝ | 252 | FC | ⁿ |
189 | BD | ╜ | 253 | FD | ² |
190 | BE | ╛ | 254 | FE | ■ |
191 | BF | ┐ | 255 | FF |
4、ASCII 之外
另一个更新的字符表称为Unicode (Unicode:Unicode Consortium 开发的一种字符编码标准。该标准采用多(于一)个字节代表每一字符,实现了使用单个字符集代表世界上几乎所有书面语言)。 因为 Unicode 表大得多,它可以表示 65,536 个字符,而 ASCII 表只能表示 128 个字符,扩展的 ASCII 表也只能表示 256 个字符。这一更大的容量使不同语言的大多数字符都能包含在同一个字符集中。
ASCII 字符输入方法与常用地方
1、在文档中插入 ASCII 字符
该功能需要 Excel、FrontPage、InfoPath、OneNote、Outlook、PowerPoint、Project、Publisher、Word 或 Visio。
2、输入方法
除了在键盘上键入字符外,也可以使用该符号的字符代码作为键盘快捷键。
要从上面的图表中插入 ASCII 字符,在按住 ALT 的同时键入等价的十进制数字。
例如,要插入度数符号,在按住 ALT 的同时在数字键盘上键入 0176。
注意:必须使用数字键盘来键入数字,而不是键盘。如果您的键盘需要打开 Num Lock 键才能在数字键盘上键入数字,请务必打开它。