以下是 Java web应用的常见编码问题

  1、html页面的编码

  在web应用中,通常浏览器会根据http header: Content-type的值来决定用什么encoding, 比如遇到Content-Type: text/html; charset=UTF-8, 页面使用的UTF-8编码。但是考虑到离线的html(用户可能把页面html保存到本地), 打开离线的html的时候要在meta指定编码,当然不指定也会有default值,那么不指定有时可能出现乱码。

  Meta标签

<meta http-equiv="Content-Type" content="text/html; charset=UTF-8"/>

  2、HttpRequest的编码

  通常浏览在发送一个请求到服务器的时候,不会设置字符编码,在服务器端为了统一编码,可以在filter中使用request.setCharacterEncoding("UTF-8")来设置编码.一般浏览器都是用默认的ISO-8859-1字符编码,要解决中文参数乱码的时候都必须这一步。

  3、httpresponse的编码

  httpresponse中可以设置输出到浏览器的数据使用的编码方法是response.setCharacterEncoding("UTF-8")和response.setContentType("text/html;charset=UTF-8"),如果只是单纯的设置编码,好是用response.setCharacterEncoding("UTF-8"),因为response.setContentType("text/html;charset=UTF-8")是针对具体的MIME类型设置对应的字符编码。需要注意的是这里设置的编码对JSP页面不一定起作用,理由是JSP页面有自己设置字符编码的方式,而且优先级更高。

  4、JSP页面的编码

  有以下三种方式,如果同时有第一种和第二种的时候只有一种会生效(如果不同的话),还有第一种和第二种会覆盖第三种

  后要注意的是在使用1)或2)声明编码类型时,如果页面中include了其他JSP,对于<%@includefile="BB.jsp"%>和<jsp:includepage="BB.jsp"/>的区别,假设在AA.jsp中使用前一种方式includeBB.jsp,那么BB.jsp中不能有重复的编码的声明,效果是AA.jsp和BB.jsp都使用AA.jsp中声明的编码方式进行编码。

  如果是使用后一种include的方式的话,AA.jsp和BB.jsp中都可以有各自编码的声明。

  1)<%@pagecontentType="text/html;charset=UTF-8"%>

  2)<%@pagepageEncoding="charset=UTF-8"%>

  3)在web.xml中添加以下设置

<jsp-config>

<jsp-property-group>
<url-pattern>*.jsp</url-pattern>

<page-encoding>UTF-8</page-encoding>
</jsp-property-group>

</jsp-config>
 
  5、web.xml和weblogic.xml中的mime的设置

  在web.xml中可以指定mime映射,同时也可以指定对应类型使用的字符编码(这里的设置也可以使用3中所说的http response.setContentType和response.setCharacterEncoding来做到),比如:

<mime-mapping>

<extension>html</extension>

<mime-type>text/html; charset=UTF-8</mime-type>

</mime-mapping>
 
  在weblogic.xml中可以设置默认的mime类型和字符编码

<container-discriptor>

<default-mime-type>text/html; charset=UTF-8</default-mime-type>

</container-discriptor>
 
  还有

<charset-params>

<input-charset>

<resource-path>/*</resource-path>

<java-charset-name>UTF-8</java-charset-name>

</input-charset>

</charset-params>
 
  总的来说,一个应用中html, http request, http response 和jsp pages中好显示地指定相同的字符编码,方便的是都设为UTF-8,所有字符都不会出错。对于mime mapping的设置好是在web.xml中设置。weblogic中的关于字符编码的设置一般不用设置(如果你把前面所说的都设置正确以后)。