编码作用:
https://baike.baidu.com/item/魏杰/15581?fr=aladdin
如果我们想要这种表单提交中链接的中文信息不显示出来,那么我们就需要通过MIME编码把中文转换成另外一种编码显示出来,但是这种编码在国内的浏览器中运用的并不多,谷歌浏览器用到该编码。
如
https://baike.baidu.com/item/%E9%AD%8F%E6%9D%B0/15581?fr=aladdin
好了,切入正题吧!
URLEncoder和URLDecoder用于完成普通字符串和application/x-www-form-urlencodedMIME字符串之间的相互转换.
--------------------------------------------------------------------------------
中文API解释:
java.net
类 URLEncoder
java.lang.Objectjava.net.URLEncoder
public class URLEncoderextends Object
HTML 格式编码的实用工具类。该类包含了将 String 转换为 application/x-www-form-urlencoded
MIME 格式的静态方法。有关 HTML 格式编码的更多信息,请参阅 HTML 规范。
对 String 编码时,使用以下规则:
- 字母数字字符 "
a
" 到 "z
"、"A
" 到 "Z
" 和 "0
" 到 "9
" 保持不变。 - 特殊字符 "
.
"、"-
"、"*
" 和 "_
" 保持不变。 - 空格字符 "
+
"。 - 所有其他字符都是不安全的,因此首先使用一些编码机制将它们转换为一个或多个字节。然后每个字节用一个包含 3 个字符的字符串 "
%xy
" 表示,其中 xy 为该字节的两位十六进制表示形式。推荐的编码机制是 UTF-8。但是,出于兼容性考虑,如果未指定一种编码,则使用相应平台的默认编码。
例如,使用 UTF-8 编码机制,字符串 "The string ü@foo-bar" 将转换为 "The+string+%C3%BC%40foo-bar",因为在 UTF-8 中,字符 ü 编码为两个字节,C3 (十六进制)和 BC (十六进制),字符 @ 编码为一个字节 40 (十六进制)。
代码练习:
package netCode;import java.io.UnsupportedEncodingException;
import java.net.URL;
import java.net.URLDecoder;
import java.net.URLEncoder;public class URLCoding {public static void main(String[] args) throws UnsupportedEncodingException {//获取平台默认的字符集System.out.println(System.getProperty("file.encoding"));String name = "魏杰DreamZuora";//encode(String name)之所以过时了。是因为平台不确定你的编码格式再解码就麻烦,默认GBKSystem.out.println(URLEncoder.encode(name));//输出结果%CE%BA%BD%DCDreamZuora//正确方式String URLName = URLEncoder.encode(name, "GBK");System.out.println(URLName);//解码String string = URLDecoder.decode(URLName, "GBK");System.out.println(string);String n = new String(name.getBytes(),"GBK");System.out.println(n);
/* 输出结果:* GBK%CE%BA%BD%DCDreamZuora%CE%BA%BD%DCDreamZuora魏杰DreamZuora魏杰DreamZuora*/}
}
编码和解码:
在Web的浏览器中,不同的浏览器的编码和解码规则是不一样的.
对于W3C浏览器:遵循W3C组织规范的浏览器,(非IE).
编码:byte[] data = “任小龙”.getByte(String charsetName);
解码:String str = new String(data, String charsetName);
对于IE浏览器:
编码使用的application/x-www-form-urlencodedMIME机制.