设置utf8编码问题

注意:乱码和request的具体实现类有关,现在已经查到的是RequestDispatcher.forward调用前使用的是org.apache.catalina.connector.RequestFacade类而RequestDispatcher.forward调用后使用的是org.apache.catalina.core.ApplicationHttpRequest,他们内部在ParseParameter的时候, 用来解码的默认的编码逻辑不同,使用不同的协议时,影响乱码的因素不同! 
具体参考:Tomcat源码分析--ServletRequest.getParameterValues内部分析,Request字符集&QueryStringEncoding 

乱码的产生 
譬如汉字“中”,以UTF-8编码后得到的是3字节的值%E4%B8%AD,然后通过GET或者POST方式把这3个字节提交到Tomcat容器,如果你不告诉Tomcat我的参数是用UTF-8编码的,那么tomcat就认为你是用ISO-8859-1来编码的,而ISO8859-1(兼容URI中的标准字符集US-ASCII)是兼容ASCII的单字节编码并且使用了单字节内的所有空间,因此Tomcat就以为你传递的用ISO-8859-1字符集编码过的3个字符,然后它就用ISO-8859-1来解码,得到中-,解码后。字符串中-在Jvm是以Unicode的形式存在的,而HTTP传输或者数据库保存的其实是字节,因此根据各终端的需要,你可以把unicode字符串中-用UTF-8编码后得到相应的字节后存储到数据库(3个UTF-8字符),也可以取得这3个字符对应的ISO-8859-1的3个字节,然后用UTF-8重新编码后得到unicode字符“中”(特性:把其他任何编码的字节流当作ISO-8859-1编码看待都没有问题),然后用response传递给客户端(根据你设置的content-type不同,传递的字节也是不同的!) 
总结: 

  • 1,HTTP GET或者POST传递的是字节?数据库保存的也是字节(譬如500MB空间就是500M字节)
  • 2,乱码产生的原因是编码和解码的字符集(方式)不同导致的,即对于几个不同的字节,在不同的编码方案下对应的字符可能不同,也可能在某种编码下有些字节不存在(这也是乱码中?产生的原因)
  • 3,解码后的字符串在jvm中以Unicode的形式存在
  • 4,如果jvm中存在的Unicode字符就是你预期的字符(编码,解码的字符集相同或者兼容),那么没有任何问题,如果jvm中存在的字符集不是你预期的字符,譬如上述例子中jvm中存在的是3个Unicode字符,你也可以通过取得这3个unicode字符对应的3个字节,然后用UTF-8对这3个字节进行编码生成新的Unicode字符:汉字“中”
  • 5,ISO8859-1是兼容ASCII的单字节编码并且使用了单字节内的所有空间,在支持ISO-8859-1的系统中传输和存储其他任何编码的字节流都不会被抛弃。换言之,把其他任何编码的字节流当作ISO-8859-1编码看待都没有问题。


下面的代码显示,使用不同的编码来Encoder会得到不同的结果,同时如果Encoder和Decoder不一致或者使用的汉字在编码ISO-8859-1中不存在时,都会表现为乱码的形式! 

Java代码  收藏代码
  1. try {    
  2.   
  3.         // 汉字“中”用UTF-8进行URLEncode的时候,得到%e4%b8%ad(对应的ISO-8859-1的字符是中)  
  4.         String item = new String(new byte[] { (byte) 0xe4, (byte) 0xb8, (byte) 0xad }, "UTF-8");  
  5.         // 中  
  6.         System.out.println(item);  
  7.   
  8.         item = new String(new byte[] { (byte) 0xe4, (byte) 0xb8, (byte) 0xad }, "ISO-8859-1");  
  9.         // 中  
  10.         System.out.println(item);  
  11.   
  12.         System.out.println(new BigInteger("253").toByteArray());  
  13.         System.out.println(Integer.toBinaryString(253));  
  14.   
  15.         // 中  
  16.         item = new String(item.getBytes("ISO_8859_1"), "UTF-8");  
  17.         System.out.println(item);  
  18.         // 中  
  19.         item = new String(item.getBytes("UTF-8"), "ISO_8859_1");  
  20.         System.out.println(item);  
  21.   
  22.         // 汉字中以UTF-8编码为     %E4%B8%AD(3字节)  
  23.         System.out.println(URLEncoder.encode("中", "UTF-8"));    
  24.         // 汉字中以UTF-8编码为     %3F      (1字节 这是由于汉字在ISO-8859-1字符集中不存在,返回的是?在ISO-8859-1下的编码)  
  25.         System.out.println(URLEncoder.encode("中", "ISO-8859-1"));    
  26.         // 汉字中以UTF-8编码为     %D6%D0        (2字节)  
  27.         System.out.println(URLEncoder.encode("中", "GB2312"));    
  28.             
  29.         // 把汉字中对应的UTF-8编码                 %E4%B8%AD 用UTF-8解码得到正常的汉字 中  
  30.         System.out.println(URLDecoder.decode("%E4%B8%AD", "UTF-8"));    
  31.         // 把汉字中对应的ISO-8859-1编码    %3F       用ISO-8859-1解码得到?  
  32.         System.out.println(URLDecoder.decode("%3F", "ISO-8859-1"));    
  33.         // 把汉字中对应的GB2312编码                 %D6%D0        用GB2312解码得到正常的汉字 中   
  34.         System.out.println(URLDecoder.decode("%D6%D0", "GB2312"));    
  35.         // 把汉字中对应的UTF-8编码                 %E4%B8%AD 用ISO-8859-1解码  
  36.         // 得到字符中(这个就是所谓的乱码,其实是3字节%E4%B8%AD中每个字节对应的ISO-8859-1中的字符)  
  37.         // ISO-8859-1字符集使用了单字节内的所有空间  
  38.         System.out.println(URLDecoder.decode("%E4%B8%AD", "ISO-8859-1"));  
  39.         // 把汉字中对应的UTF-8编码                 %E4%B8%AD 用GB2312解码  
  40.         // 得到字符涓?,因为前2字节 %E4%B8对应的GB2312的字符就是涓,而第3字节%AD在GB2312编码中不存在,故返回?  
  41.         System.out.println(URLDecoder.decode("%E4%B8%AD", "GB2312"));    
  42.     } catch (UnsupportedEncodingException e) {    
  43.         // TODO Auto-generated catch block    
  44.         e.printStackTrace();    
  45.     }    


Tomcat关于encoding编码的默认设置以及相关标准: 
对于Get请求,"URI Syntax"规范规定HTTP query strings(又叫GET parameters)使用US-ASCII编码,所有不在这个编码范围内的字符,必须经常一定的转码:%61的形式(encode)。又由于ISO-8859-1 and ASCII对于0x20 to 0x7E范围内的字符是兼容的,大部分的web容器譬如Tomcat容器默认使用ISO-8859-1解码URI中%xx部分的字节。可以使用Connector中的URIEncoding来修改这个默认用来解码URI中%xx部分字节的字符集。URIEncoding要和get请求query string中encode的编码一直,或者通过设置Content-Type来告诉容器你使用什么编码来转码url中的字符 

POST请求应该自己通过参数Content-Type指定所使用的编码,由于许多客户端都没有设置一个明确的编码,tomcat就默认使用ISO-8859-1编码。注意:用来对URI进行解码的字符集,Request字符集,Response字符集的区别!不同的Request实现中,对于上述3个编码的关系是不同的 

对于POST请求,ISO-8859-1是Servlet规范中定义的HTTP request和response的默认编码。如果request或者response的字符集没有被设定,那么Servlet规范指定使用编码ISO-8859-1,请求和相应指定编码是通过Content-Type响应头来设定的。 

如果Get、Post请求没有通过Content-Type来
设置编码的话,Tomcat默认使用ISO-8859-1编码。可以使用SetCharacterEncodingFilter来修改Tomcat请求的默认编码设置(encoding:使用的编码, ignore:true,不管客户端是否指定了编码都进行设置, false,只有在客户端没有指定编码的时候才进行编码设置, 默认true) 
注意:一般这个Filter建议放在所有Filter的最前面(Servlet3.0之前基于filter-mapping在web.xml中的顺序, Servlet3.0之后有参数可以指定顺序),因为一旦从request里面取值后,再进行设置的话,设置无效。因为在第一次从request取值时,tomcat会把querystring或者post方式提交的变量,用指定的编码转成从parameters数组,以后直接从这个数组中获取相应参数的值! 

到处都使用UTF-8建议操作: 

  • 1, Set URIEncoding="UTF-8" on your <Connector> in server.xml.使得Tomcat Http Get请求使用UTF-8编码
  • 2, Use a character encoding filter with the default encoding set to UTF-8. 由于很多请求本身没有指定编码, Tomcat默认使用ISO-8859-1编码作为HttpServletRequest的编码,通过filter修改
  • 3, Change all your JSPs to include charset name in their contentType. For example, use <%@page contentType="text/html; charset=UTF-8" %> for the usual JSP pages and <jsp:directive.page contentType="text/html; charset=UTF-8" /> for the pages in XML syntax (aka JSP Documents). 指定Jsp页面使用的编码
  • 4, Change all your servlets to set the content type for responses and to include charset name in the content type to beUTF-8. Use response.setContentType("text/html; charset=UTF-8") or response.setCharacterEncoding("UTF-8"). 设置Response返回结果的编码
  • 5, Change any content-generation libraries you use (Velocity, Freemarker, etc.) to use UTF-8 and to specify UTF-8 in the content type of the responses that they generate.指定所有模版引擎佘勇的编码
  • 6, Disable any valves or filters that may read request parameters before your character encoding filter or jsp page has a chance to set the encoding to UTF-8. SetCharacterEncodingFilter一般要放置在第一位,否则可能无效



Java代码  收藏代码
    1. /* 
    2. * Licensed to the Apache Software Foundation (ASF) under one or more 
    3. * contributor license agreements.  See the NOTICE file distributed with 
    4. * this work for additional information regarding copyright ownership. 
    5. * The ASF licenses this file to You under the Apache License, Version 2.0 
    6. * (the "License"); you may not use this file except in compliance with 
    7. * the License.  You may obtain a copy of the License at 
    8. *     http://www.apache.org/licenses/LICENSE-2.0 
    9. * Unless required by applicable law or agreed to in writing, software 
    10. * distributed under the License is distributed on an "AS IS" BASIS, 
    11. * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. 
    12. * See the License for the specific language governing permissions and 
    13. * limitations under the License. 
    14. */  
    15.   
    16. package filters;  
    17.   
    18.   
    19. import java.io.IOException;  
    20. import javax.servlet.Filter;  
    21. import javax.servlet.FilterChain;  
    22. import javax.servlet.FilterConfig;  
    23. import javax.servlet.ServletException;  
    24. import javax.servlet.ServletRequest;  
    25. import javax.servlet.ServletResponse;  
    26.   
    27.   
    28. /** 
    29.  * <p>Example filter that sets the character encoding to be used in parsing the 
    30.  * incoming request, either unconditionally or only if the client did not 
    31.  * specify a character encoding.  Configuration of this filter is based on 
    32.  * the following initialization parameters:</p> 
    33.  * <ul> 
    34.  * <li><strong>encoding</strong> - The character encoding to be configured 
    35.  *     for this request, either conditionally or unconditionally based on 
    36.  *     the <code>ignore</code> initialization parameter.  This parameter 
    37.  *     is required, so there is no default.</li> 
    38.  * <li><strong>ignore</strong> - If set to "true", any character encoding 
    39.  *     specified by the client is ignored, and the value returned by the 
    40.  *     <code>selectEncoding()</code> method is set.  If set to "false, 
    41.  *     <code>selectEncoding()</code> is called <strong>only</strong> if the 
    42.  *     client has not already specified an encoding.  By default, this 
    43.  *     parameter is set to "true".</li> 
    44.  * </ul> 
    45.  * 
    46.  * <p>Although this filter can be used unchanged, it is also easy to 
    47.  * subclass it and make the <code>selectEncoding()</code> method more 
    48.  * intelligent about what encoding to choose, based on characteristics of 
    49.  * the incoming request (such as the values of the <code>Accept-Language</code> 
    50.  * and <code>User-Agent</code> headers, or a value stashed in the current 
    51.  * user's session.</p> 
    52.  * 
    53.  * @author Craig McClanahan 
    54.  * @version $Id: SetCharacterEncodingFilter.java 939521 2010-04-30 00:16:33Z kkolinko $ 
    55.  */  
    56.   
    57. public class SetCharacterEncodingFilter implements Filter {  
    58.   
    59.   
    60.     // ----------------------------------------------------- Instance Variables  
    61.   
    62.   
    63.     /** 
    64.      * The default character encoding to set for requests that pass through 
    65.      * this filter. 
    66.      */  
    67.     protected String encoding = null;  
    68.   
    69.   
    70.     /** 
    71.      * The filter configuration object we are associated with.  If this value 
    72.      * is null, this filter instance is not currently configured. 
    73.      */  
    74.     protected FilterConfig filterConfig = null;  
    75.   
    76.   
    77.     /** 
    78.      * Should a character encoding specified by the client be ignored? 
    79.      */  
    80.     protected boolean ignore = true;  
    81.   
    82.   
    83.     // --------------------------------------------------------- Public Methods  
    84.   
    85.   
    86.     /** 
    87.      * Take this filter out of service. 
    88.      */  
    89.     public void destroy() {  
    90.   
    91.         this.encoding = null;  
    92.         this.filterConfig = null;  
    93.   
    94.     }  
    95.   
    96.   
    97.     /** 
    98.      * Select and set (if specified) the character encoding to be used to 
    99.      * interpret request parameters for this request. 
    100.      * 
    101.      * @param request The servlet request we are processing 
    102.      * @param result The servlet response we are creating 
    103.      * @param chain The filter chain we are processing 
    104.      * 
    105.      * @exception IOException if an input/output error occurs 
    106.      * @exception ServletException if a servlet error occurs 
    107.      */  
    108.     public void doFilter(ServletRequest request, ServletResponse response,  
    109.                          FilterChain chain)  
    110.     throws IOException, ServletException {  
    111.   
    112.         // Conditionally select and set the character encoding to be used  
    113.         if (ignore || (request.getCharacterEncoding() == null)) {  
    114.             String encoding = selectEncoding(request);  
    115.             if (encoding != null)  
    116.                 request.setCharacterEncoding(encoding);  
    117.         }  
    118.   
    119.     // Pass control on to the next filter  
    120.         chain.doFilter(request, response);  
    121.   
    122.     }  
    123.   
    124.   
    125.     /** 
    126.      * Place this filter into service. 
    127.      * 
    128.      * @param filterConfig The filter configuration object 
    129.      */  
    130.     public void init(FilterConfig filterConfig) throws ServletException {  
    131.   
    132.     this.filterConfig = filterConfig;  
    133.         this.encoding = filterConfig.getInitParameter("encoding");  
    134.         String value = filterConfig.getInitParameter("ignore");  
    135.         if (value == null)  
    136.             this.ignore = true;  
    137.         else if (value.equalsIgnoreCase("true"))  
    138.             this.ignore = true;  
    139.         else if (value.equalsIgnoreCase("yes"))  
    140.             this.ignore = true;  
    141.         else  
    142.             this.ignore = false;  
    143.   
    144.     }  
    145.   
    146.   
    147.     // ------------------------------------------------------ Protected Methods  
    148.   
    149.   
    150.     /** 
    151.      * Select an appropriate character encoding to be used, based on the 
    152.      * characteristics of the current request and/or filter initialization 
    153.      * parameters.  If no character encoding should be set, return 
    154.      * <code>null</code>. 
    155.      * <p> 
    156.      * The default implementation unconditionally returns the value configured 
    157.      * by the <strong>encoding</strong> initialization parameter for this 
    158.      * filter. 
    159.      * 
    160.      * @param request The servlet request we are processing 
    161.      */  
    162.     protected String selectEncoding(ServletRequest request) {  
    163.   
    164.         return (this.encoding);  
    165.   
    166.     }  
    167.   
    168.   
    169. }

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/290453.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

王道408数据结构——第八章 排序

文章目录一、排序定义二、插入排序——直接插入排序1. 描述2. 代码和示例3. 空间效率4. 时间效率5. 稳定性6. 适用性三、插入排序——折半插入排序1. 描述2. 时间效率3. 稳定性四、插入排序——希尔排序&#xff08;缩小增量排序&#xff09;1. 描述2. 代码和示例3. 空间效率4.…

Avalonia跨平台入门第二十一篇之玩耍CEF

在前面分享的几篇中咱已经玩耍了Popup、ListBox多选、Grid动态分、RadioButton模板、控件的拖放效果、控件的置顶和置底、控件的锁定、自定义Window样式、动画效果、Expander控件、ListBox折叠列表、聊天窗口、ListBox图片消息、窗口抖动、语音发送、语音播放、语音播放问题;今…

golang实现自定义驱动的Cache

近期在写 ActivedRouter项目的时候需求一个缓存模型&#xff0c;要求缓存模型支持不同驱动,例如:memory、file、redis、mysql&#xff0c;实现思路代码如下: cache.go文件,定义缓存对外接口 //ActivedRouter //Author:usher.yue //Amail:usher.yuegmail.com //TencentQQ:422366…

【自定义控件】c#winform自定义控件实现标签控件

介绍首先我们设计这个控件的时候要明白控件是怎样交互的&#xff0c; 熟悉b站的小伙伴应该知道 &#xff0c;我们上传视频的时候会去选择标签 &#xff0c;我们输入标签文本 按下回车就代表该标签已经添加成功了&#xff0c;效果图如下&#xff01;控件拆分我们首先拆分一下该控…

ASP.NET 使用Ajax(转)

之前在Ajax初步理解中介绍了对Ajax的初步理解&#xff0c;本文将介绍在ASP.NET中如何方便使用Ajax&#xff0c;第一种当然是使用jQuery的ajax&#xff0c;功能强大而且操作简单方便&#xff0c;第二种是使用.NET封装好的ScriptManager。 $.ajax向普通页面发送get请求 这是最简单…

fir.im 持续集成技术实践

互联网时代&#xff0c;人人都在追求产品的快速响应、快速迭代和快速验证。不论是创业团队还是大中型企业&#xff0c;都在探索属于自己的敏捷开发、持续交付之道。fir.im 团队也在全面实施敏捷&#xff0c;并推出新持续集成服务— flow.ci &#xff0c;以帮助企业将开发测试流…

宇宙最強的IDE - Visual Studio 25岁生日快乐

每位开发者从入门开始或多或少都会接触过 Visual Studio &#xff0c; 现今的 Visual Studio 除了支持传统的 C , C# , Visual Basic.NET ,F# 的编程语言外&#xff0c;还可以做 Python , Node.js 的开发。在应用场景上也从单一的桌面应用&#xff0c;延伸到 Web &#xff0c; …

有没有一段代码,让你觉得人类的智慧也可以璀璨无比?【转】

转自&#xff1a;https://www.zhihu.com/question/30262900 作者&#xff1a;烧茄子链接&#xff1a;https://www.zhihu.com/question/30262900/answer/48741026来源&#xff1a;知乎著作权归作者所有。商业转载请联系作者获得授权&#xff0c;非商业转载请注明出处。当然是这个…

如何使用 abp 创建 module 并应用单独的数据库迁移

最近在学习使用 abp 来做一些小程序。abp 是一个功能丰富的 .NET 开发框架&#xff0c;完全开源&#xff0c;遵循 DDD&#xff08;领域驱动&#xff09;设计模式&#xff0c;支持微服务开发&#xff0c;集成了 Identity、角色权限、本地化、动态代理、后台任务、分布式消息、审…

MinGW安装和使用基础教程

MinGW全称Minimalist GNU For Windows&#xff0c;是个精简的Windows平台C/C、ADA及Fortran编译器&#xff0c;相比Cygwin而言&#xff0c;体积要小很多&#xff0c;使用较为方便。MinGW提供了一套完整的开源编译工具集&#xff0c;以适合Windows平台应用开发&#xff0c;且不依…

px,em,rem,vw单位在网页和移动端的应用

px&#xff1a; 是网页设计中最常用的单位&#xff0c;然而1px到底是多大长&#xff0c;恐怕没有人能回答上来 它用来表示屏幕设备物理上能显示的最小的一个点&#xff0c;这个点不是固定宽度的&#xff0c;不同设备上点的长度、比例有可能会不同。 假设&#xff1a;你现在用的…

cs-Panination

ylbtech-Unitity: cs-PaninationPager.cs IPagingOption.cs IPagedList.cs PagingOption.cs PagedList.cs PagingExtensions.cs 1.A,效果图返回顶部 1.B,源代码返回顶部1.B.1,Pager.cs using System; using System.Collections.Generic; using System.Linq; using System.Text…

SignalR的使用

什么是 SignalR&#xff1f;ASP.NET Core SignalR 是一个开放源代码库&#xff0c;可用于简化向应用添加实时 Web 功能。实时 Web 功能使服务器端代码能够将内容推送到客户端。适合 SignalR 的候选项&#xff1a;需要从服务器进行高频率更新的应用。示例包括游戏、社交网络、投…

NHibernate之旅(7):初探NHibernate中的并发控制

本节内容 什么是并发控制&#xff1f; 悲观并发控制(Pessimistic Concurrency)乐观并发控制(Optimistic Concurrency)NHibernate支持乐观并发控制实例分析结语什么是并发控制&#xff1f; 当很多人试图同一时候改动数据库中的数据时&#xff0c;必须实现一个控制系统&#xff0…

期望DP

期望DP的一般做法是从末状态開始递推&#xff1a; Problem DescriptionAkemi Homura is a Mahou Shoujo (Puella Magi/Magical Girl).Homura wants to help her friend Madoka save the world. But because of the plot of the Boss Incubator, she is trapped in a labyrinth …

神奇的[Caller*]属性

前言上次&#xff0c;我们《使用 CallerArgumentExpression 检查弃元参数》&#xff0c;它实际是利用编译器编译时将变量名称传入。其实&#xff0c;.NET中提供了多个[Caller*]属性&#xff0c;帮助我们轻松获取调用者信息。CallerFilePathAttribute允许获取包含调用方的源文件…

java dateTime + long

2019独角兽企业重金招聘Python工程师标准>>> public static void main(String[] args) throws Exception{SimpleDateFormat sdfnew SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); // long timeStartsdf.parse("2011-09-20 12:30:45").getTime();l…

.NET Core中异常过滤器ExceptionFilter的使用介绍

介绍实现需要继承IExceptionFilter 或 IAsyncExceptionFilter。可用于实现常见的错误处理策略。使用场景首先讲一下我们为什么要使用异常过滤器 &#xff0c;如果业务场景复杂&#xff0c;只使用HttpStatusCode&#xff0c;抛出异常后,后期要加很多字段来描述。那么这种就比较不…

程序一启动检查网络,如果没有网络就退出程序

转载于:https://www.cnblogs.com/songxing10000/p/4823812.html

看小说的这些年

从大一开始&#xff0c;就开始看起了小说&#xff0c;不是那种名著类型&#xff0c;而是快餐小说&#xff0c;玄幻、都市、言情、科幻&#xff0c;什么都会看&#xff0c;因为看多了&#xff0c;就会发现&#xff0c;已经没什么可以看的。 谈起快餐小说&#xff0c;已经有很多被…