JSP教程_国际本地化与中文乱码问题
JSP技术中文乱码的原因及解决方法
万方数据《电子设计工程》2011年第1期转换的规律。
3)缩程所用的软件工具的字符编码开发JSP文件时,1)iS08859一l编码通常叫做htin一1,属于单字节编码.最多能表示的字符范围是0~255.应用于英文系列。
IS08859一l编码表示的字符范围很窄,无法表示中文字符。
但是.由于是单字节编码,和计算机最基础的表示单位一致,所以很多时候,仍IH使用IS08859一l编码来表示。
而且在很多协议上.默认使用该编码。
2)GB2312/GBK编码这就是汉字的国标码,专门用来表示汉字.是双字节编码其中GBK编码能够用来同时表示繁体字和简体字,而GB2312只能表示简体字,GBK是兼容GB2312编码的。
3)Unicode编码这是最统一的编码,可以用来表示所有语言的字符,而且是定长双字节(也有四字节的)编码,包括英文字母在内。
但是它是不兼容IS08859一l编码的,也不兼容任何编码。
4)UTF一8编码UTF一8编码兼容IS08859一l编码.兼容Unicode编码。
兼容同时也可以用来表示所有语言的字符.不过。
UTF-8编码是不定长编码,每一个字符的长度从l~6个字节不等。
另外,UTF一8编码自带简单的校验功能。
一般来讲。
英文字母都是用一个字节表示,而汉字使用3个字节。
从以上的所述13I可以知道。
当网贞上仅有英文字符时。
可以选用IS08859一l编码。
网贞141上一旦有汉字时,字符的编码必须为GB2312/GBK编码.Unicode编码或UrⅡ、_8编码。
特别值得一提的是。
UTF一8编码还与其他编码兼容。
使用这种编码.就不会出现乱码。
2影响JSP文件中字符编码的外部因素在JSP动态网页开发过程中.所谓的影响JSP文件巾字符编码的外部因素,是指运行其他软件的最低层软件——操作系统。
建立JSP文件时所用的软件,以及显示JSP文件的工具对汉字编码的影响151。
具体地说就是操作系统、测览器、编程所用的软件T具。
每个软件都有自己默认支持的字符编码。
遇到jsp中文显示乱码的解决方案
不用编码就可以插入了
2.显示插入的中文:
因为存入的是latin,所以显示的时候就要GBK一下
String x=new String((rs.getString("title")).getBytes("ISO8859_1"),"GBK");
</head>
<body>
<%=request.getParameter("name")%>
</body>
</html>
如果submit.jsp提交英文字符能正确显示,如果提交中文时就会出现乱码。原因:浏览器默认使用UTF-8编码方式来发送请求,而UTF-8和GB2312编码方式表示字符时不一样,这样就出现了不能识别字符。解决办法:通过request.seCharacterEncoding("gb2312")对请求进行统一编码,就实现了中文的正常显示。修改后的process.jsp代码如下:
iso = iso.trim();
gb = new String(iso.getBytes("ISO-8859-1"),"GB2312");
return gb;
}
}
catch(Exception e)
{
System.err.print("编码转换错误:"+e.getMessage());
綠起:
JSP的request 默认为ISO8859_1,所以在处理中文的时候,要显示中文的话,必须转成GBK的,如下String str=new String(request.getParameter("name").getBytes("ISO8859-1"),"GBK"); out.println(str); 这样就可以显示中文了
JSP中文乱码处理
示例:显示不同地区的时间和 HelloWorld
• • • • • Locale lo3=new Locale("en","US"); DateFormat df3=DateFormat.getDateTimeInstance(DateFormat.LONG,DateFormat.LONG,lo3); out.println("<h3>in English</h3>"); out.println("Hello world!"); out.println(" "+df3.format(new Date())+"<hr>");
2.2Get提交乱码-1
• 用Get方式传递参数,中文字符会出现乱码
客户端通过GET提交中文编码问题简单流程:
假如:
客户端和服务器用gb2312 HTTP传输编码用ISO8859_1 则: 服务器需要指示客户端文档的编码方式
ISO8859_1 ISO8859_1 gb2312
gb2312
2.2Get乱码-2
• • • • • • • • • • • • • • • <%@ page contentType="text/html; charset=UTF-8" import="java.io.*,java.util.*,java.text.*,java.text.DateFormat" %> <html> <head><title>language</title></head> <body bgcolor="#ffffff"> <% Locale lo1=new Locale(“ko”,“”);//构建一个本地对象 DateFormat df1=DateFormat.getDateTimeInstance(DateFormat.LONG,DateFormat.LONG,lo1); out.println("<h3>in Korean</h3>"); out.println("\uc548\ud558\uc138\uc694\uc138\uacc4"); out.println(" "+df1.format(new Date())+"<hr>"); Locale lo2=new Locale("ja",""); DateFormat df2=DateFormat.getDateTimeInstance(DateFormat.LONG,DateFormat.LONG,lo2); out.println("<h3>in Japanese</h3>"); out.println("\u4eca\u65e6\u306f\u4e16\u754c"); out.println(" "+df2.format(new Date())+"<hr>");
JSP中文乱码问题(Eclipse)
JSP中⽂乱码问题(Eclipse)默认已设置以下属性为“utf-8”contentType=”text/html;charset=UTF-8”的作⽤是指定服务器响应给浏览器的编码。
pageEncoding=”UTF-8”的作⽤是设置JSP编译成Servlet时使⽤的编码。
JSP要经过两次的“编码”,第⼀阶段会⽤pageEncoding,第⼆阶段会⽤utf-8⾄utf-8,第三阶段就是由Tomcat出来的⽹页,⽤的是contentType。
第⼀阶段是jsp转译(翻译)成.Java,它会根据pageEncoding的设定读取jsp,结果是由指定的编码⽅案翻译成统⼀的UTF-8 JAVA源码(即.java),如果pageEncoding设定错了,或没有设定,出来的就是中⽂乱码。
第⼆阶段是从源码(.java)编译到字节码⽂件(.class),不论JSP编写时候⽤的是什么编码⽅案,经过这个阶段的结果全部是UTF-8的encoding的java源码。
JAVAC⽤UTF-8的encoding 读取java源码,编译成UTF-8 encoding的⼆进制码(即.class),这是JVM对常数字串在⼆进制码(java encoding)内表达的规范。
第三阶段是Tomcat(或其的application Container)载⼊和执⾏阶段⼆的来的JAVA⼆进制码,输出的结果,也就是在客户端见到的,这时隐藏在阶段⼀和阶段⼆的参数contentType就发挥了功效。
从Tomcat5.x开始,GET和POST⽅法提交的信息,Tomcat采⽤了不同的⽅式来处理编码,对于POST请求,Tomcat会仍然使⽤request.setCharacterEncoding⽅法所设置的编码来处理,如果未设置,则使⽤默认的iso-8859-1编码。
⽽GET请求则不同,Tomcat对于GET请求并不会考虑使⽤request.setCharacterEncoding⽅法设置的编码,⽽会永远使⽤iso-8859-1编码。
如何处理JSP开发容易出现的中文乱码问题
在java编程中,经常会碰到汉字的处理及显示问题,一不小心就会产生一大堆乱码或问号,这也是让许多初学者手足无措的讨厌问题。
造成这种问题的根本原因是java中默认的编码方式是Unicode,而中国人通常使用的文件和DB都是基于GB2312或者big5等编码,固会出现此问题。
对于中文问题,不同的jdk版本,不同的应用服务器,处理方法都会有一些微小的差异。
在这里,主要针对Tomcat中JSP开发容易出现的中文乱码问题进行讨论,当然,大多数解决方法是通用的。
一般有以下几种情况:1、JSP输出中文的乱码问题所谓在JSP输出中文,即直接在JSP中输出中文,或者给变量赋中文值再输出等,这种情况下的乱码问题往往是因为没有给JSP页面制定显示字符的编码方式,解决方法如下:(1)在JSP页面头部加上语句<% @ page contentType=”text/html;charset=utf-8”%>(在servlet 中使用httpServletResponse.setContentType(“text/html; charset=utf-8”)),最好同时在JSP页面的head部分加上<meta http-equiv=”Content-Type”content=”text/html;charset=utf-8”>。
(2)在每次要输出中文的地方主动转换编码方式,比如要在页面中输入“中文”二字,就可以用以下方法:<%String str = “中文”;Byte[] tmpbyte = str.getBytes(“ISO8859_1”);str = new String(tmpbyte);out.print(str);2、获取表单提交的数据时的中文乱码问题在没有加任何其他处理之前,用request.getParameter(“paramName”)获取表单提交中的数据,且表单数据中含有中文时,返回的字符串会呈现乱码。
JSP中汉字编码时出现“乱码”的情况及具体解决方案
l4 1
F。 RTu E w 。 R D 。1 。
、 一
关键 词 : J ; S 汉字编 P 码;乱码 问 ; 题 解决
、
集 是几 乎所 有的 中 文 系统和 国际 化 的软 件都 时 ,可以先用数据库 管理系统提供的管理功能 支 持的 中 文字符 集 ,这 也是 最 基本 的 中文字 检查其中的中文数据是否正确。 符集。其编码范 围是高位0 1 0 e xa xf ,低位也 四 J 服务器对中文的支持程度 SP 是 O a l xe x l_ f;汉字从 O b a _ 0 x 0 l开始,结 束于 支 持 J 的 服 务 器 有 很 多 ,这 些 服 务 器 对 SP 0 7 e; xf f 中文的支持 度 又各不相同 ,例如RE N,其 SI G BK 是 GB 3 2 0 的扩 展,是 向 兼 对中文的 支持程度相当的好,而T0MC 对 2 1 8 AT 容的。它包含了 2 9 2个汉字,其 编码范 围是 中文的支持程 度一般。所以 ,在J 编程过程 00 SP 0 8 4 - xe x 10一 f ̄,剔除高位 0 8 的字位。其所 中,要注意J P E 0 x0 S  ̄ 务器对中文的支持程度。 有字符郜 町以一对 一 映射到 Uncd .。 i e2 0 o 找 到 r乱码产生的原因 ,我们在实际编程 GBl0 0 0 0GBK2 8 3 2 0 ( K)在 GBK 的基 过 程中只要综合应用编 程方法 ,就可以解决乱 础 上进 步扩展 _ 宁 ,增加 了藏 、蒙等少数 码的 问题 。 『 汉 民族的宁形。GB 2 从根本上解决 了字位不 K K 实例分析 够 ,宁 形不足的 问题 。它并没有确定所 有的字 下面 以 ・ 个具体的例子来 分析J P S 中乱 码 也 就 足 所 峭的 圈际 化 (lN) 。 各 种 语 言信 启、 形 ,只是规定 了编码 范围 ,留待以 后扩 充。编 解 决 的 方 法 。 【8 BK 兼容 ;四 测 试 平 台 l : 被进一步规 范为 L c l 信息 。处理的底层字 码是变 的 ,其二字节部分与 G o ae ND 20 T MYS 4 QL 字节部 分是扩宽的字形 、字位 ,其编码 范围是 W I OW ¥ 0 0} OM CAT{ 符集变成 了几 包含 了所有字形的 Unc d 。 i e o x l xf 、 l I x 0 0 3 、三 字 测 酞 平 台 2 : 现在大部分具 有 国际化特征 的软件核心t= 首字 节 0 8 O e ¨字 节O 3 x 9 } 节 0 8一0 f、四字 节0 3 — x 9 x i xe x 0 0 3。 W I OW S 0 0 RE I M Y Q 4 ND 2 0 + S N+ S L 符处理都足以 Un c d 为基础的 , 软件运 i e o 所 以 在J P , 管是 从 Uni O e 中 S c d 住 测 试 台 l 无论 怎么 设 置数 据 库 的 下 行时根据 当时的 L cl/ n / o e a e设置 oae I g C d p g a t 编码还是Byt >Un C de 存在问 c c di. 以及 网页的编码 ,都无法 正常显示 e iO 都 n o Ig n 确定桐应的本地字 符编码 设置 ,井依此 处理本 >BY e io e ye { l 台2F,只要 设置M YsQL 地 宁倚 。i处理过程中需要 实现 U io e 和 题 。从Un c d 转为B t ,如果 目标代码集不 f文 ,而 测 吠、 芏 ncd x3 。这 的e od ng,就 町以正常 示中文 。如 果在 nc i 本地宁 ? =的相 互转换 ,甚或以 Un c d 为 存 存对 应的 代码 ,则得 到的 结 果是 0 f _策 1 : io e 32 下需要 示 【 文 ,那 么除 了要 设置 } 1 中f 的两个 不同本地 字?= u 】 = 1 集的相互转换 。这种 是 因为GB2 l 符号 区中的一 些符 号被映 射到 测试 平台 1 些公 共的 符 号编 码 , 由于这 些 符号 出现 任 MY QIt cd, S %n o ig,对数据 库的读写要进行转 1 1 方式 网络环境 i v 被进一 步延伸 ,任 何网络两 S 89 或其它S S BC 字符集中 ,故它们征 换 ,转换代吗如 : 端 的宁衍信息也需要 根据 字符集的设 置睾 换成 I O 8 5 l 专 Un c d 中编码比较 靠前 ,有一 些其有效 位只 /o e p bi tig u l S r Ch n e d (tig s c n a g Co eS rn t) r 可接受的内容。 c pto 位 hr w OEx e i n J v 语 占内部 是用 Un c d 表 示宁符 仃8 ,和汉 字的 编码 莺叠 ,导 致 显示 乱码 。 t o s I aa io e ye i e o ye 的 ,遵守 Unc d V . 。J v 程序无论是 从B t转 为Unc d , 如果B t标识的字符在 io e 2 0 a a rt n c em’ n w S rn (t. eBye (io ti gsrg t ts” s x fd 从 / 丈件 系 统 以 宁 符 流 读 /写 文 件 ,还 是 往 源代码集 不存 ,则得到的结果是O f f ,同 往 8 5 l ) BK” ; 89 ¨, G ) 样存在编码 问题 。 URL 连接 ITMI j I 信息 ,或从 URL 连接 实际编程中 ,J P S r l 程序得到错误 S / e ve t 读取 参数值 ,都会有字符 编码的转换 。这 样做 N d I 题斛决 ! LS ̄ J 虽然增加 r 编程的复 杂度 ,容易引起混淆 ,但 的汉中信息 ,往往是这 两个过程的叠加 ,有时 甚 至是两个过程 叠加后 反复作用的结果 。 JP s 中汉宁编码时 “ 乱码”的问题一直是 却是符合 际化的思想的 。 三 、数据库 自身编码的方式。 JP S 中编 程值得注意的 问题 ,解决的方案也 有 从理论 来说 ,这些根据宁符集设 置而进 在J 编程过 程 【 ,不可避 免要和数据库 很多 。通常需要 考虑的就是从以上三 个方 面找 P s { l 行的卞 符转换 不应 该产生太 多问题 。而事 实是 S q 对症 下药 。 J P 的中文 s 由l F 成用程竹: 的实际运行环境 不【 ,uniO 打 交道 。所 以数据库 自身的编码 方式对J P , 到乱码产 生的原 , 百 I C de 中文的显示起 着决定性 作片。如果在 中文在 写 e c dn 并没有想像中那么复杂,在编程过程 1 n o ig 和 各个本地字符集的 补充、完善 ,以及 系统 或 n 应 用程序 寅现的不规范 ,转码时 出现的问题时 入数据库过程 中 已是乱码 ,那显示的数据毫无 中只要注意卡 是问题就 町避免问题现象的出现 。 交换用的字符编码集 ,如美国的 A C I S I ,中国 的 GB 3 2 8 ,日本的 J 等 ,作 为该 家/ 2 1~ 0 I S 区域 内信启、 处理的基 础,有着统一编码 的重 要 作用。字符编码集按长 度分 为 S BCS ( 字节 字 符集 ) ,DBCS ( 字节字符集 )两 人类。 双 早期的软 什 ( 尤其是操作 系统) ,为 了解决 本 地 符 信息 的计算机处理 ,出 了各种本地 化 版奉 (JO IlN),为 了区分 ,引进 了 LANG, C d p g 等概念 。但是 山于各个本地 字符集 oea e 代码范 围圣毳 ,相 互问信息 交换 困难 ;软件 各 个本地化版本 独立维护成本较 高。因此有必 要 将 本地 化工 怍中 的共性 抽 取 出来 ,作 一 处 致 理 ,将特 州的 本地 化处理内容降低 到最少。这
JSP中文乱码的解决方案大全
如何解决JSP中文乱码的问题一、Java中文问题的由来Java的内核和class文件是基于unicode的,这使Java程序具有良好的跨平台性,但也带来了一些中文乱码问题的麻烦。
原因主要有两方面,Java和JSP 文件本身编译时产生的乱码问题和Java程序于其他媒介交互产生的乱码问题。
首先Java (包括JSP)源文件中很可能包含有中文,而Java和JSP 源文件的保存方式是基于字节流的,如果Java和JSP编译成class 文件过程中,使用的编码方式与源文件的编码不一致,就会出现乱码。
基于这种乱码,建议在Java 文件中尽量不要写中文(注释部分不参与编译写中文没关系)如果必须写的话尽量手动带参数-ecoding GBK或-ecoding gb2312编译对于JSP在文件头加上<%@ page contentType=text/html;charset=GBK%:^<%@ page contentType=text/html;charset=gb2312%>基本上就能解决这类乱码问题。
二、常见的解决方式1,最基本的乱码问题。
这个乱码问题是最简单的乱码问题。
一般新会出现。
就是页面编码不一致导致的乱码。
<%@ page language=java pageEncoding=UTF-8%><%@ page contentType=text/html;charset=iso8859-1%><head><title> 中文问题</Mtle><meta http-equiv=Content-Type content=text/html;charset=UTF-8></head></head><body>我是个好人</body></html>三个地方的编码。
第一个地方的编码格式为jsp文件的存储格式。
JSP中文乱码问题解决方案
JSP中文乱码问题解决方案中文乱码就是因为编码不符,可能出现乱码有四个地方:1 JSP编码乱码2 HTML编码乱码3 request获取数据乱码4 response输出信息乱码5 Cookie导致的编码问题下面将会对上面几种情况进行介绍:1 JSP乱码这种是最常见的,设置编码的位置位于JSP的第一行,如果在Eclipse中新建一个JSP默认是下面这种:<%@ page language="java"contentType="text/html; charset=ISO-8859-1"pageE ncoding="ISO-8859-1"%>可以看到它默认的页面编码和传输编码都是ISO-8859-1,这是用于欧洲国家的编码。
可以通过设置Eclipse中JSP的编码格式,来修改默认生成的编码格式。
如果想要支持中文,可以使用UTF-8、GB2312、GBK等,其中UTF-8是国际化的,哪个国家的都支持,所以推荐使用这个。
再来说说上面涉及到编码的两个地方:charset 和pageEncodingcharset是指服务器发往客户端展现时的编码;pageEncoding用于设置JSP页面本身的编码。
JSP在部署后提供给用户使用,会经过三个阶段:(1)JSP生成java文件:这个阶段会使用pageEncoding所定义的编码格式进行转换(2)java文件生成class文件:这个阶段由服务器tomcat自动使用utf -8编码把java文件转换成字节码class文件(3)通过读取class文件展现给用户:这个阶段由tomcat服务器获取字节码内容,通过使用contentType所定义的编码格式展现给用户。
大致过程如下图:这样设置好JSP中的第一行代码,就可以保证基本的JSP展现没有乱码了!<%@ page language="java"contentType="text/html; charset=UTF-8"pageEncodi ng="UTF-8"%>2 HTML乱码因为JSP中也包含html的内容,HTML本身也是有编码格式的。
JSP的中文乱码问题
JSP中文乱码问题有如下几个方面:页面乱码、参数乱码、表单乱码、源文件乱码。
下面来逐一解决其中的乱码问题。
一、JSP页面中文乱码在JSP页面中,中文显示乱码有两种情况:一种是HTML中的中文乱码,另一种是在JSP中动态输出的中文乱码。
先看一个JSP程序:[java]view plaincopyprint?1.<%@ page language="java"import="java.util.*" %>2.<html>3. <head>4. <title>中文显示示例</title>5.6. </head>7. <body>8.这是一个中文显示示例:9. <%10. String str = "中文";11. out.print(str);12. %>13. </body>14.</html>上面这个JSP程序看起来好像是在页面显示几句中文而且标题也是中文。
运行后在浏览器中显示如图所示原因在于没有在JSP中指定页面显示的编码,消除乱码的解决方案很简单上面代1.<%@ page language="java"import="java.util.*" contentType="text/html;charset=GB2312" %>再次运行乱码消失,原理就是向页面指定编码为GB2312,那么页面就会按照此编码来显示,于是乱码消失。
二、URL传递参数中文乱码一般情况下在使用get方法提交表单的时候传递的参数如果是中文的话很可能会出现乱码。
下面是一个示例程序[java]view plaincopyprint?1.<%@ page language="java"import="java.util.*" contentType="text/html; charset=gb2312"%>2.<html>3. <head>4. <title>URL传递参数中文处理示例</title>5. </head>6. <%7. String param = request.getParameter("param");8. %>9. <body>10. <a href="URLCharset.jsp?param='中文'">请点击这个链接</a><br>11.你提交的参数为:<%=param%>12. </body>13.</html>上面这个JSP程序的功能就是通过一个URL链接向自身传递一个参数,这个参数是中文字符串,这个程序的运行效果如下图对于URL传递中文参数乱码这个问题,其处理方法比较特殊,仅仅转换这个中文字符串或者设置JSP页面显示编码都是不能解决问题的,需要修改Tomcat服务器的配置文件才能解决问题。
jsp页面显示中文乱码解决
jsp页面显示中文乱码:jsp页面的编码方式有两个地方需要设置:<%@ page language="java" import="java.util.*" pageEncoding="utf-8"%><%@ page contentType="text/html;charset=utf-8"%>其中:pageEncoding 指的是jsp文件本身在本地保存时的编码方式。
contentType的charset 是指服务器发送网页内容给客户端时所使用的编码。
从第一次访问一个jsp页面开始,到这个页面被发送到客户端,这个Jsp页面要经过三次编码转换:第一阶段是jsp编译成.java,它会根据pageEncoding的设定读取jsp,结果是由指定的编码方案翻译成统一的UTF-8 JAVA源码(即.java),如果pageEncoding设定错了,或没有设定,出来的就是中文乱码。
第二阶段是由JAVAC的JAVA源码至java byteCode的编译,不论JSP编写时候用的是什么编码方案,经过这个阶段的结果全部是UTF-8的encoding的java源码。
JAVAC用UTF-8的encoding读取java源码,编译成UTF-8 encoding的二进制码(即.class),这是JVM对常数字串在二进制码(java encoding)内表达的规范。
第三阶段是Tomcat(或其的application container)载入和执行阶段二的来的JAVA二进制码,输出的结果,也就是在客户端见到的,这时隐藏在阶段一和阶段二的参数contentType就发挥了功效所以最终的解决方法为:在jsp页面设置pageEncoding或者contentType的其中一个为支持中文的编码格式(如utf-8,gbk,gb2312)。
JSP中文乱码处理
然后我们在info.jsp中来调这个函数,具体代码如下: <%@ page contentType="text/html; charset=GBK" %> <%@ include file="tocn.jsp" %> <h3>测试中文信息</h3> 传递的中文信息: <% String test = tocn(request.getParameter("test")); out.println(test); %>
接下来再次测试程序,发现问题得到了解决,中文信息正 确显示出来了。如图所示:
注意:这种解决方式只对POST提交方式有效,如果客户 端是以GET方式或者URL重写的方式提交的中文信息,可 能它就无用武之地了。
参数传递乱码问题
在Web应用中,客户端提交请求信息时,在某些情况下需要用到GET 提交方式。 有时,在以URL重写方式传递信息时,也会传递中文信息。 这两种方式如果用方案二是无法解决中文乱码问题的。我们先来看一 个测试,还是需要两个JSP页面。如下: refer.jsp <%@ page contentType="text/html; charset=GBK" %> <form action="info.jsp" method="GET"> 输入中文进行测试<br> <input type="text" name="test"/> <input type="submit" value="ok"/> </form> <a href='info.jsp?test=我爱我家'>下一页</a>
JSP中汉字乱码现象分析与解决
3 结语
JSP 中出现汉字乱码现象的场景各种各样,解决的 方法不尽相同, 然而很多 JSP 教材并没有对此进行充 分的介绍以及提出相应的解决方法。 毋容置疑,汉字乱 码问题并不是 JSP 教学中的一个主要知识点, 但也是 一个无法回避的问题。 教师应该适时为学生介绍解决 汉字乱码的正确方法, 避免因该问题影响对其他主要 知识点的教学, 甚至影响学生的学习兴趣和学习积极 性。
Java 核心 API 中的 包有一个 URLEncoder 类[3],其 中 的 encode 方 法 可 以 基 于 某 种 字 符 编 码 方 式 将 一 个 字 符 串 转 换 成 application/x-www -form-urlencoded 格式。 在超链接标记中设置请求参数时,可以利 用该方法事先将包含汉字的参数数据进行格式转换, 这样可以避免汉字乱码的出现,例如:
和响应的编码方式都被默认为是西欧的 ISO-8859-1。 Web 容器对 JSP 文件的处理会经历转换和执行两
个阶段[1]。 在转换阶段,Web 容器会依据指定的文件编 码 方 式 读 入 JSP 文 件 、将 其 转 换 成 实 现 类 (Servlet 类 ) 并进行编译产生.class 文件; 在执行阶段,Web 容器会 创建并初始化实现类的实例、 执行实例的服务方法 (_jspService 方法),然后将输出内容按照指定的响应编 码方式编码产生响应。
pageEncoding 和 contentType 属性用于指定相关内容的 字符编码方式,例如:
NetBeans IDE 环境下创建 JSP 文件时, 一般不会发生 这类错误, 因为工具总是按照指定的编码方式保存文 件, 即 JSP 文件实际采用的编码方式与指定的编码方 式总是一致的。
精选JSP中文乱码的产生原因及解决方案
精选JSP中文乱码的产生原因及解决方案JSP中文乱码的产生原因及解决方案在JSP的开发过程中,经常出现中文乱码的问题,可能一直困扰着大家,现在把JSP开发中遇到的中文乱码的问题及解决办法写出来供大家参考。
首先需要了解一下Java中文问题的由来:Java的内核和class文件是基于unicode的,这使Java程序具有良好的跨平台性,但也带来了一些中文乱码问题的麻烦。
原因主要有两方面,Java和JSP文件本身编译时产生的乱码问题和Java程序于其它媒介交互产生的乱码问题。
首先Java(包括JSP)源文件中很可能包含有中文,而Java和JSP源文件的保存方式是基于字节流的,如果Java和JSP编译成class文件过程中,使用的编码方式与源文件的编码不一致,就会出现乱码。
基于这种乱码,建议在Java文件中尽量不要写中文(注释部分不参与编译,写中文没关系),如果必须写的话,尽量手动带参数-ecoding GBK或-ecoding gb2312或-ecoding UTF-8编译;对于JSP,在文件头加上<%@ page contentType="text/html;charset=GBK"%>或<%@ page contentType="text/html;charset=gb2312"%>基本上就能解决这类乱码问题。
下面是一些常见中文乱码问题的解决方法(下面例子中ecoding 采用的是gb2312,也可设为ecoding GBK或ecoding UTF-8):一、JSP页面乱码这种乱码问题比较简单,一般是页面编码不一致导致的乱码,一般新手容易出现这样的问题,具体分以下两种情况:➢未指定使用字符集编码下面的显示页面(display.jsp)就出现乱码:<html><head><title>JSP的中文处理</title><meta http-equiv="Content-Type" content="text/html charset=gb2312"></head><body><%out.print("JSP的中文处理");%></body></html>这种乱码的原因是没有在页面里指定使用的字符集编码,JSP页面中出现了中文字符,而默认的ISO-8859-1字符集中无中文字符,解决方法:只要在页面开始地方用下面代码指定字符集编码即可,在JSP页面中指定编码方式(gb2312),和浏览器解码方式设置相同,即在页面的第一行加上:<%@ page contentType="text/html; charset=gb2312"%>,就能够消除乱码了。
JSP技术中文乱码的原因及解决方法
JSP 技术中文乱码的原因及解决方法杨金花(西安铁路职业技术学院陕西西安710014)摘要:JSP 技术广泛应用于动态网页制作,但在应用中文字符时常常出现乱码。
以前有关JSP 技术中文乱码的研究,只是侧重于对常见的几种中文乱码情况分析,并从网页代码方面进行研究,然后给出相应的代码,缺少对造成中文乱码原因的研究。
本文从造成乱码的根本原因入手进行分析,以JSP 技术工作过程为线索,提出新的研究思路:从开发Java 程序时所涉及的开发环境以及使用的开发工具着手,研究字符的存储与编码的关系,将影响Java 中字符编码的原因分为内因和外因。
研究结果表明,在使用JSP 技术的过程中,中文字符的编码不仅在JSP 工作过程中,会发生编码的转换,而且会因开发环境以及使用开发工具不同,使存储在内存的编码形式发生转换,每种编码之间的转换没有规律。
本文系统地分析了Java 中字符编码的转换,最后针对JSP 中常见的中文乱码情况,给出了相应的解决方法。
关键词:字符编码;中文乱码;JSP 技术;Servlet 中图分类号:TP311文献标识码:A文章编号:1674-6236(2011)01-0025-03The reason and solution of Chinese garbled code in JSP technologyYANG Jin -hua(Xi ’an Railway Vocational Technical College ,Xi ’an 710014,China )Abstract:JSP technology is widely used in the production of dynamic web pages ,but the chinese characters in its application often garbled.Chinese garbled before the JSP technology research ,is focused on several common chinese garbled on the situation analysis ,and researches aspects of the code from the page ,and then gives the corresponding code ,the lack of research into the reasons causes the chinese garbled.This paper analyses from the real causes of the underlying cause garbled.JSP technology researches to the work process for the clues ,puts forward new research ideas :the development of Java programs involved in the development environment and start using the development tools ,storage and encoding of character relationships ,affecting the character encoding in Java is divided into internal and external reasons.The results show that use of JSP technology in the process ,the chinese character code in the JSP course of their work not only will happen coding of the convert ,but also because of development environment ,and use the development tools ,the code stored in memory in different forms.Between each code conversion is not the law.This paper systematically analysed the Java character encoding conversion ,in the end for the JSP common situation in the chinese garbled ,the corresponding solution was given.Key words:character encoding ;chinese garbled ;JSP technology ;ServletJSP ,也就是Java Server Page (Java 服务器网页),是目前市场上主流的分布式应用程序开发平台。
JSP中文乱码问题完全解决方案
request.setCharacterEncoding(this.encodingName);
}
chain.doFilter(request, response);
}
public void destroy() {
} else {
this.enable = false;
}
}
public void doFilter(ServletRequest request, ServletResponse response,FilterChain chain) throws IOException, ServletException {
四. 数据库操作中文乱码
在建立数据库的时候,应该选择支持中文的编码格式,最好能和JSP页面的编码格式保持一致,这样就可以尽可能减少数据库操作的中文乱码问题。同时在JDBC连接数据库的时候可以使用类似下面这种形式的URL。jdbc:microsoft:sqlserver://localhost:1433;DatabaseName=pubs;useUnicode=true;characterEncoding=gb2312
import javax.servlet.UnavailableException;
public class SetCharacterEncodingFilter implements Filter {
protected FilterConfig filterConfig;
protected String encodingName;
}
}
在web.xml中添加过滤器的配置如下:
<filter>
解决JSP中文乱码问题
解决JSP中文乱码问题中文乱码示例程序见文件code.java1.乱码如何产生?本质上都是由于字符串原本的编码格式与读取时解析用的编码格式不一致导致的。
例如:String s = "你好哦!";System.out.println( new String(s.getBytes(),"UTF-8")); //错误,因为getBytes()默认使用GBK编码,而解析时使用UTF-8编码,肯定出错。
其中getBytes() 是将unicode 转换为操作系统默认的格式的字节数组,即"你好哦"的GBK 格式,new String (bytes, Charset) 中的charset 是指定读取bytes 的方式,这里指定为UTF-8,即把bytes的内容当做UTF-8 格式对待。
如下两种方式都会有正确的结果,因为他们的源内容编码和解析用的编码是一致的。
System.out.println( new String(s.getBytes(),"GBK"));System.out.println( new String(s.getBytes("UTF-8"),"UTF-8"));2.编码基本知识Unicode、UTF-8 和ISO8859-1到底有什么区别将以"中文"两个字为例,经查表可以知道其GB2312编码是"d6d0 cec4",Unicode编码为"4e2d 6587",UTF编码就是"e4b8ad e69687"。
注意,这两个字没有iso8859-1编码,但可以用iso8859-1编码来"表示"。
最早的编码是iso8859-1,和ascii编码相似。
但为了方便表示各种各样的语言,逐渐出现了很多标准编码,重要的有如下几个。
JSP中文乱码的产生原因及解决方案
JSP中文乱码的产生原因及解决方案在JSP的开发过程中,经常出现中文乱码的问题,可能一直困扰着大家,现在把JSP 开发中遇到的中文乱码的问题及解决办法写出来供大家参考。
首先需要了解一下Java中文问题的由来:Java的内核和class文件是基于unicode的,这使Java程序具有良好的跨平台性,但也带来了一些中文乱码问题的麻烦。
原因主要有两方面,Java和JSP文件本身编译时产生的乱码问题和Java程序于其他媒介交互产生的乱码问题。
首先Java(包括JSP)源文件中很可能包含有中文,而Java和JSP源文件的保存方式是基于字节流的,如果Java和JSP编译成class文件过程中,使用的编码方式与源文件的编码不一致,就会出现乱码。
基于这种乱码,建议在Java文件中尽量不要写中文(注释部分不参与编译,写中文没关系),如果必须写的话,尽量手动带参数-ecoding GBK或-ecoding gb2312或-ecoding UTF-8编译;对于JSP,在文件头加上<%@ page contentType="text/html;charset=GBK"%>或<%@ page contentType="text/html;charset=gb2312"%>基本上就能解决这类乱码问题。
下面是一些常见中文乱码问题的解决方法(下面例子中ecoding采用的是gb2312,也可设为ecoding GBK或ecoding UTF-8):一、JSP页面乱码这种乱码问题比较简单,一般是页面编码不一致导致的乱码,一般新手容易出现这样的问题,具体分以下两种情况:➢未指定使用字符集编码下面的显示页面(display.jsp)就出现乱码:<html><head><title>JSP的中文处理</title><meta http-equiv="Content-Type" content="text/html charset=gb2312"> </head><body><%out.print("JSP的中文处理");%></body>这种乱码的原因是没有在页面里指定使用的字符集编码,JSP页面中出现了中文字符,而默认的ISO-8859-1字符集中无中文字符,解决方法:只要在页面开始地方用下面代码指定字符集编码即可,在JSP页面中指定编码方式(gb2312),和浏览器解码方式设置相同,即在页面的第一行加上:<%@ page contentType="text/html; charset=gb2312"%>,就可以消除乱码了。
中文乱码解决方案
在进行struts开发的过程中,总也是出现很多的乱码问题,但归根到底,也只是以下三种情况:㈠页面显示中文乱码㈡传递参数中文乱码㈢国际化资源文件乱码下面就这三中情况介绍怎么在具体项目中处理这些乱码问题。
而对于整体的处理思想,是要统一编码为: UTF-8.(以myeclipse6支持的struts1.3为准)㈠页面显示中文乱码对于在页面中显示出现乱码,这个问题比较简单,便是检查你的JSP文件里是不是出现了中文要处理,因为JSP默认的编码格式为“ISO-8859-1”,当JSP中出现要处理的中文时,其显示就出现乱码了,这种情况一般出现在手写JSP,或修改时。
因为在myeclipse6.0中,如果出现了编码错误时,程序不会让你保存,而是会提示你注意编码,这点很好。
具体的修改办法是把Html代码1.<%.@ page language="java"import="java.util."pageEncoding="ISO-8859-1">改成:Html代码<%.@ page language="java"import="java.util."pageEncoding="UTF-8">㈡传递参数中文乱码传递参数出现的乱码,参数的内容为中文。
比如在struts应用中,简单的一个登录界面中,需要传递的登录名为中文时,你没经处理之前,是会出现乱码传递的,为了让我们能看到显示的乱码,我们在对应的Action类的子类里,修改一下,用System.out把接受到的参数输出,代码如下:Java代码1.public ActionForward execute(ActionMapping mapping, ActionFormform, HttpServletRequest request,2. HttpServletResponse response) ...{3. DynaActionForm loginForm = (DynaActionForm) form;4.5. String username = (String) loginForm.get("username");6. String password = (String) loginForm.get("password");7. System.out.println("username:"+username);8. System.out.println("password:"+password);9. if (username.equals("ivorytower") && password.equals("123456")) ...{10. return mapping.findForward("success");11. }12. return mapping.findForward("fail");13. }那么当你提交了中文输入后就会出现乱码了。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
package .resource; import java.util.ListResourceBundle; public class Res_en_US extends ListResourceBundle{
//创建对应的英文文本信息 static final Object[][] contents = new String[][]{
{"version","This is Engilish Version"},{"title"ex","index"},{"news","news"}, {"life","life"},{"sports","sports"},{"entertainment","entertainment"} }; protected Object[][] getContents() { // TODO Auto-generated method stub return null; } }
在开始讲解这一小节内容之前,首先了解以下两个常用的术语: i18n:它表示的是 internationalization(国际化)单词,由于 i 和 n 单词之间间隔 18 个字符,所
以就简称为 i18n。“国际化”是为了使开发的应用程序能够适应不同的语言环境,而不需要做 任何的程序修改所采取的设计措施。 l10n:它表示的是 localization(本地化)单词。由于 l 和 n 字母之间间隔 10 个字符,所以简称 为 l10n。“本地化”是为了应用程序能够在一个特定的语言环境下进行使用,从而加入本地特 殊化格式以及调用本地语言文本的一个过程,本地化是一个过程。 经过以上介绍之后,读者应该认识到要想开发出一个能够适应全球不同国家和地区用户的软件产 品,就需要经过以上介绍的国际化和本地化两个阶段。下面主要介绍日期和多国语言的两个国际化和本 地化实例,通过该实例加深读者对这两个概念的了解。当然,有关国际化和本地化的内容还很多,但是 方法和思想都一样,读者可以根据这两点触类旁通。
接下来将使用 ResourceBundle 抽象类的一个 ListResourceBundle 之类来实现一个多国语言版本的 JSP 应用程序。该实例需要创建的文件如下:
selectLanguage.jsp:选择所要显示的语言。 multiLanguage.jsp:显示不同语言信息的主页面。 Res_zh_CN.java:中文资源类,包名为 .resource。 Res_en_US.java:英文资源类,包名为 .resource。 当需要支持更多国家语言时,可以创建更多相应的资源类。
<%@ page contentType="text/html;charset=gb2312" %> <%@ page import="java.text.DateFormat,java.util.Locale,java.util.Date" %> <%
Date date = new Date(); DateFormat localeDate = DateFormat.getDateInstance(DateFormat.LONG); DateFormat usDate = DateFormat.getDateInstance(DateFormat.LONG,); DateFormat germanDate = DateFormat.getDateInstance(DateFormat.LONG,Locale.GERMAN); DateFormat italyDate = DateFormat.getDateInstance(DateFormat.LONG,Locale.ITALY); DateFormat frenchDate = DateFormat.getDateInstance(DateFormat.LONG,Locale.FRENCH); %> <html> <head><title>日期的国际化</title></head> <body> 本地日期:<%=localeDate.format(date)%><br> 美国日期:<%=usDate.format(date)%><br> 德国日期:<%=germanDate.format(date)%><br> 意大利日期:<%=italyDate.format(date)%><br> 法国日期:<%=frenchDate.format(date)%><br> </body> </html>
代码说明:该代码首先必须要继承 ListResourceBundle 之类,并定义 contents 数组变量来存放某一 语言的所有信息(由一个关键字来标识)。另外,还需要定义一个 getContents()方法来返回 contents 变 量值。
第 18 章 常用插件扩展点
·211·
15.1.2.2.英文资源类 Res_en_US.java
本小节介绍日期的国际化问题,不同国家或者地区,它们的日期显示方式是不一样的。为了解决这
第 18 章 常用插件扩展点
·209·
个问题,Java 提供了一个 java.text.DateFormat 类来实现日期的国际化。具体看下面的一个实例代码,该 实例使用 DateFormat 类来格式化不同地区的日期显示方式:
DateFormat usDate = DateFormat.getDateInstance(DateFormat.LONG,);
然后再使用 usDate 实例来显示当前的日期:
美国日期:<%=usDate.format(date)%><br>
其中 Locale 类中已经定义很多静态常量,例如 US 就代表“en_US”、CHINA 就表示“zh_CN”。 (4)DateFormat.getDateInstance()方法的第二参数就是使用 Locale 类中的地区常量来实现日期显示 格式的本地化。当第二个参数不设置时,程序将使用浏览器默认的本地化设置。 打开浏览器,运行以上编写的 JSP 程序,运行效果如图 15.1 所示。
15.1.1 日期的国际化
Java 已经提供了对软件国际化和本地化的支持。在 JDK 包含了一些实现国际化和本地化的类,开 发者可以直接使用这些类快速、方便地开发过出国际化和本地化的软件产品。其中用于本地化的基类为 Local 类,它的一个实例化对象代表一个特定地理区域。而其他类则使用这个类的实例对象来格式化日 期、数字、本地化字符串和应用程序中的其他对象。
15.1.2.3.语言选择页面 selectLanguage.jsp
程序说明: (1)该页面代码第一行设置 page 指令中的 contentType 属性,其中指定文档输出格式为 text/html, 使用的字符编码为 gb2312。第二行通过 import 属性引入该页面将使用到的各类文件。引入方式可以通 过一个 import 指定一个类文件,也可以通过一个 import 属性来指定多个类文件,这些类文件之间使用 逗号隔开。 (2)Locale 类:所有提供本地化支持的 Java 类都使用一个叫做 java.util.Locale 的类。该类的一个 实例表示一个特定的地理、政治或文化上的区域。该区域是由一个国家代码和一个语言代码的组合指定 的。根据用户的语言和当地风俗的不同由 Locale 实例来决定执行不同任务(通过指定参数值)。构造 Locale 实例的构造函数一-国际代码和语言代码作为参数,HTTP 也使用这两个标准来定义语言和国家 代码。例如,java.util.Locale useLocale = new Locale(“en”,”US”),就是一个本地化了的 Locale 实例,它 表示的是英语语言以及美国地区的语言环境。 (3)从代码中可以看出使用 java.text.DateFormat 类国际化日期是相当简单的,首先调用 DateFormat 类中的 getDateInstance()方法,并且向方法中传递日期显示格式以及地区参数,从而获得一个 DateFormat 实例,例如:
·210·
Eclipse 从入门到精通
图 15.1 日期的国际化
15.1.2 实现多国语言版本的JSP实例
要 使 一 个 软 件 产 品 具 有 多 国 语 言 版 本 ( 即 支 持 多 国 语 言 ) , Java 提 供 了 一 个 资 源 类 java.util.ResourceBundle 来实现。其实 ResourceBundle 只是一个抽象类,它有两个子类:ListResourceBundle 和 PropertyResourceBundel。前一个子类是需要将编写的不同国家语言信息放置在对象类中,下面将实例 演示;后一个子类是需要编写不同国家语言的文件(后缀为.properties)来存放语言信息,这部分内容读 者可以在讲解国际化标签以及 Struts 时了解到。例如,存放中文的 Res_zh_CN.properties 和存放英文的 Res_en_US.properties 资源文件。
15.1.2.1 中文资源类 Res_zh_CN.java
该创建的资源类必须要继承 ListResourceBundle 类,其中详细代码如下:
package .resource; import java.util.ListResourceBundle; public class Res_zh_CN extends ListResourceBundle{