JSP中文乱码处理
JSP 处理汉字乱码
JSP 处理汉字乱码
当request对象获取客户提交的汉字字符时,会出现乱马问题,必须进行特殊处理。
即从浏览器中向服务器发送数据,可以使用request.setCharacterEncoding( )方法来处理乱码。
文件名:Jspform.jsp
在上述代码中,主要通过一个form表单将“姓名”和“住址”信息,传递到requestBm.jsp页面中。
在上述的代码中,在通过request 对象接收form 表单传递的参数之前,选择通过request.setCharacterEncoding( )方法,将该对象的编码格式设置为“UTF-8”。
然后,通过接收并显示内容,此时不会产生乱码。
例如,浏览Jspform.jsp 页面,在“用户注册信息”表单中,分别输入“姓名”和“住址”信息,如图4-4
所示。
然后,单击【提交】按钮,即可转到requestBm.jsp 页面,并显示从文本框中获取的文本内容,如图4-5所示。
图4-4 输入汉字内容 图4-5 显示汉字信息
在通过request.setCharacterEncoding( )方法设置request 对象编码时,用
户需要注意提交的form 表单页面的编码格式,如Jspform.jsp 页面为
“UTF-8”格式,即在requestBm.jsp 页面中设置request 对象编码格式
为“UTF-8”。
Jsp乱码问题的解决
Jsp乱码问题的解决✓出处:站长百科✓原文地址:/wiki/Jsp乱码问题的解决✓本电子书整理自站长百科Jsp乱码问题的解决词条,查看内容请访问网站。
目录Jsp乱码问题的解决 (1)最基本的乱码问题 (2)表单使用Post方式提交后接收到的乱码问题 (3)表单get提交方式的乱码处理方式 (4)上传文件时的乱码解决 (5)Java代码关于url请求,接受参数的乱码 (5)脚本代码关于url请求,接受到的参数乱码 (6)关于jsp在MyEclipse中打开的乱码问题 (6)关于html页面在eclipse中打开出现乱码情况 (7)更多电子书 (7)HostEase拥有中文网站()的美国主机商中国访问最快的美国主机中文网站轻松选购支付宝付款购买快捷中文客户服务沟通更方便,轻松省钱请看优惠码/top/hostease/✓出处:站长百科✓原文地址:/wiki/Jsp乱码问题的解决推荐内容:WordPress免费主题| WordPress免费插件最基本的乱码问题这个乱码问题是最简单的乱码问题。
一般新会出现。
就是页面编码不一致导致的乱码。
<%@ page language="java" pageEncoding="UTF-8"%><%@ page contentType="text/html;charset=iso8859-1"%><html><head><title>中文问题</title><meta http-equiv="Content-Type" content="text/html;charset=UTF-8"></head></head><body>我是个好人</body></html>三个地方的编码。
Jsp页面中的字符编码方式与乱码解决方法(3)
Jsp页面中的字符编码方式与乱码解决方法(3)Jsp页面中的字符编码方式与乱码解决方法pageencoding="utf-8"contenttype="text/html;charset=utf-8"request.setcharacterencoding("utf-8")response.setcharacterencoding("utf-8")其中前两个只能用于jsp中,而后两个可以用于jsp和servlet中。
1、pageencoding="utf-8"的作用是设置jsp编译成servlet原代码文件时所使用的编码。
jsp在服务器上是要先被编译成servlet的类文件的。
pageencoding="utf-8"的作用就是告诉jsp编译器在将jsp文件编译成servlet为文件时使用的编码。
通常,在jsp内部定义(指在 <%%>块内定义的)的字符串或直接作为html输出(指直接在jsp文件中输写的html中文内容)的字符串出现乱码时,很多都是由于该参数设置错误引起的。
例如,你的jsp文件是以utf-8为编码保存的(在eclipse 选中jsp文件,右键点属性就可以更改保存该jsp的编码方式),而在jsp中却指定pageencoding="gbk"(或不指定时使用操作系统默认的编码方式,即也为gbk),就会引起jsp内部定义的字符串为乱码,这时当我们用文本编辑打开tomcat生成的jsp所对应的servlet类文件时,我们发现就是乱码。
另外,该参数还有一个功能,就是在jsp中不指定contenttype属性,也不使用response.setcharacterencoding方法指定编码方式时,服务器响应的编码方式以及浏览器的编程方式(ie中可以通过菜单“查看-->编码”来看查浏览目前的编码方式)就是此时pageencoding指定的编码方式。
jsp页面传值中文乱码 网页乱码 jsp过滤器过滤乱码等乱码处理办法
一、jsp页面间传值中文乱码问题解决办法<%@ page language="java" import="java.util.*" pageEncoding="GB2312"%> <form action="b.jsp">name:<input type=text name=name><input type=submit></form>b.jsp页面内容:<%@ page language="java" import="java.util.*" pageEncoding="GB2312"%> <%String name=request.getParameter("name");%><body><%=name%></body>现象:中文乱码,比如“??????”解决方法如下:方法一:1. 在b.jsp中把pageEncoding="GB2312"改为pageEncoding="ISO885Array-1"虽然这样b.jsp页面显示的内容还是乱码,但是不是那种“??????”的乱码,而是一些特殊字符2. 然后在浏览器中查看菜单中修改成GB2312的编码,这时乱码就显示中文了。
3. 但是这种方法是不可行的。
方法二:( 已经验证可行)1. 在b.jsp中把String name=request.getParameter("name");修改为String name=new String(request.getParameter("name").getBytes("ISO-885 Array-1"),"GB2312");2. 这时再在页面上显示,则就是中文了。
JSP中文乱码问题及解决方法
中文 乱 码 问题 。原 因主 要有 两点 .第 一是 J P文件 和 文 变成 乱码 。 决方 法如 下 : S 解 在数 据库 连接 字符 串 中插 入 数 据 时 加 入 编码 字 符 集 Sr gU l " b : le e: tn r j c qsr r/ i = d s v / Jv aa本身 编译 时产 生的乱 码 问题 。第 二是 Jv aa程序 与
<fl r / t > i e
< itr ma p n > fl - p i g e
< h r a > i f e-n me
< r—p t r > * u l p t m> u l a t n / < r- a t e / e
文乱 码 的问题 。 能一 直 困扰 着 大家 。 可 那是 什 么原 因会
程 中 。 用 的编码 方式 与源 文件 的编码 方式 不 相 同 . 使 就 会 出现 中文 乱码
rso s. to t tye” x hr ; astG K” ep ne eC ne T p (t t tl hre= B ) s n e / ac ;
"B ) G K”;
3 . 数据库 中读取 的数 据是乱码 4从 3 常见 中文 问题及 其解 决方 法 、 当从 数 据 库 里 的 表 读 取 数 据 时 发 现 读 到 的 是 乱 J P动 态 网站开 发 中 。 S 出现 中文乱 码 主要 可 以分为 码 . 是 因为 数据 类 型是 vrh r和 t t 型造 成 中文 那 aca e 类 x 以下 4种 情 况 :S J P页面 显示 的 乱码 . 单 提 交 的 中文 乱码 . 到这种 问题 可 以用 如下 方法 解决 : 果是 v r 表 遇 如 a- 是 乱码 , 据库 连接 出现乱 码 。 数 从数 据 库 中读 取 的数据 ca 类 型 可把 它 设 为 bnr hr iay属 性 就 可 以解 决 中文 问 是 乱码 。 题 。 果是 t t 型 就要 用个 编码 转换 类来 处 理 , 如 e 类 x 方法 31 S . J P页 面里 的中文 内容显 示乱码 如下所 示 : 当 J P页 面 里 输 出 的 中 文 内 容 为 乱 码 。 原 因是 S p bi casC n etA o B I ul l ovr tB c s A
中文乱码问题
</filter-mapping>
3)完成.
2 get方式的解决办法
1) 打开tomcat的server.xml文件,找到区块,加入如下一行:
URIEncoding=”GBK”
完整的应如下:
<init-param>
<param-name>encoding</param-name>
<param-value>GBK</param-value>
</init-param>
</filter>
<filter-mapping>
<filter-name>Set Character Encoding</filter-name>
xmlHttp.open("POST",url,true);
xmlHttp.setRequestHeader( " Content-Type " , " application/x-www-form-urlencoded);
xmlHttp.send(urlmsg);
}
后台java中获得的reportId是乱码,不知道该怎么转,主要是不知道xmlHttp.send(urlmsg);以后是什么编码?在后面用java来转,试了几种,都没有成功,其中有:
以下是引用片段:
代码
public static String UTF_8ToGBK(String str) {
try {
JSP中汉字编码时出现“乱码”的情况及具体解决方案
l4 1
F。 RTu E w 。 R D 。1 。
、 一
关键 词 : J ; S 汉字编 P 码;乱码 问 ; 题 解决
、
集 是几 乎所 有的 中 文 系统和 国际 化 的软 件都 时 ,可以先用数据库 管理系统提供的管理功能 支 持的 中 文字符 集 ,这 也是 最 基本 的 中文字 检查其中的中文数据是否正确。 符集。其编码范 围是高位0 1 0 e xa xf ,低位也 四 J 服务器对中文的支持程度 SP 是 O a l xe x l_ f;汉字从 O b a _ 0 x 0 l开始,结 束于 支 持 J 的 服 务 器 有 很 多 ,这 些 服 务 器 对 SP 0 7 e; xf f 中文的支持 度 又各不相同 ,例如RE N,其 SI G BK 是 GB 3 2 0 的扩 展,是 向 兼 对中文的 支持程度相当的好,而T0MC 对 2 1 8 AT 容的。它包含了 2 9 2个汉字,其 编码范 围是 中文的支持程 度一般。所以 ,在J 编程过程 00 SP 0 8 4 - xe x 10一 f ̄,剔除高位 0 8 的字位。其所 中,要注意J P E 0 x0 S  ̄ 务器对中文的支持程度。 有字符郜 町以一对 一 映射到 Uncd .。 i e2 0 o 找 到 r乱码产生的原因 ,我们在实际编程 GBl0 0 0 0GBK2 8 3 2 0 ( K)在 GBK 的基 过 程中只要综合应用编 程方法 ,就可以解决乱 础 上进 步扩展 _ 宁 ,增加 了藏 、蒙等少数 码的 问题 。 『 汉 民族的宁形。GB 2 从根本上解决 了字位不 K K 实例分析 够 ,宁 形不足的 问题 。它并没有确定所 有的字 下面 以 ・ 个具体的例子来 分析J P S 中乱 码 也 就 足 所 峭的 圈际 化 (lN) 。 各 种 语 言信 启、 形 ,只是规定 了编码 范围 ,留待以 后扩 充。编 解 决 的 方 法 。 【8 BK 兼容 ;四 测 试 平 台 l : 被进一步规 范为 L c l 信息 。处理的底层字 码是变 的 ,其二字节部分与 G o ae ND 20 T MYS 4 QL 字节部 分是扩宽的字形 、字位 ,其编码 范围是 W I OW ¥ 0 0} OM CAT{ 符集变成 了几 包含 了所有字形的 Unc d 。 i e o x l xf 、 l I x 0 0 3 、三 字 测 酞 平 台 2 : 现在大部分具 有 国际化特征 的软件核心t= 首字 节 0 8 O e ¨字 节O 3 x 9 } 节 0 8一0 f、四字 节0 3 — x 9 x i xe x 0 0 3。 W I OW S 0 0 RE I M Y Q 4 ND 2 0 + S N+ S L 符处理都足以 Un c d 为基础的 , 软件运 i e o 所 以 在J P , 管是 从 Uni O e 中 S c d 住 测 试 台 l 无论 怎么 设 置数 据 库 的 下 行时根据 当时的 L cl/ n / o e a e设置 oae I g C d p g a t 编码还是Byt >Un C de 存在问 c c di. 以及 网页的编码 ,都无法 正常显示 e iO 都 n o Ig n 确定桐应的本地字 符编码 设置 ,井依此 处理本 >BY e io e ye { l 台2F,只要 设置M YsQL 地 宁倚 。i处理过程中需要 实现 U io e 和 题 。从Un c d 转为B t ,如果 目标代码集不 f文 ,而 测 吠、 芏 ncd x3 。这 的e od ng,就 町以正常 示中文 。如 果在 nc i 本地宁 ? =的相 互转换 ,甚或以 Un c d 为 存 存对 应的 代码 ,则得 到的 结 果是 0 f _策 1 : io e 32 下需要 示 【 文 ,那 么除 了要 设置 } 1 中f 的两个 不同本地 字?= u 】 = 1 集的相互转换 。这种 是 因为GB2 l 符号 区中的一 些符 号被映 射到 测试 平台 1 些公 共的 符 号编 码 , 由于这 些 符号 出现 任 MY QIt cd, S %n o ig,对数据 库的读写要进行转 1 1 方式 网络环境 i v 被进一 步延伸 ,任 何网络两 S 89 或其它S S BC 字符集中 ,故它们征 换 ,转换代吗如 : 端 的宁衍信息也需要 根据 字符集的设 置睾 换成 I O 8 5 l 专 Un c d 中编码比较 靠前 ,有一 些其有效 位只 /o e p bi tig u l S r Ch n e d (tig s c n a g Co eS rn t) r 可接受的内容。 c pto 位 hr w OEx e i n J v 语 占内部 是用 Un c d 表 示宁符 仃8 ,和汉 字的 编码 莺叠 ,导 致 显示 乱码 。 t o s I aa io e ye i e o ye 的 ,遵守 Unc d V . 。J v 程序无论是 从B t转 为Unc d , 如果B t标识的字符在 io e 2 0 a a rt n c em’ n w S rn (t. eBye (io ti gsrg t ts” s x fd 从 / 丈件 系 统 以 宁 符 流 读 /写 文 件 ,还 是 往 源代码集 不存 ,则得到的结果是O f f ,同 往 8 5 l ) BK” ; 89 ¨, G ) 样存在编码 问题 。 URL 连接 ITMI j I 信息 ,或从 URL 连接 实际编程中 ,J P S r l 程序得到错误 S / e ve t 读取 参数值 ,都会有字符 编码的转换 。这 样做 N d I 题斛决 ! LS ̄ J 虽然增加 r 编程的复 杂度 ,容易引起混淆 ,但 的汉中信息 ,往往是这 两个过程的叠加 ,有时 甚 至是两个过程 叠加后 反复作用的结果 。 JP s 中汉宁编码时 “ 乱码”的问题一直是 却是符合 际化的思想的 。 三 、数据库 自身编码的方式。 JP S 中编 程值得注意的 问题 ,解决的方案也 有 从理论 来说 ,这些根据宁符集设 置而进 在J 编程过 程 【 ,不可避 免要和数据库 很多 。通常需要 考虑的就是从以上三 个方 面找 P s { l 行的卞 符转换 不应 该产生太 多问题 。而事 实是 S q 对症 下药 。 J P 的中文 s 由l F 成用程竹: 的实际运行环境 不【 ,uniO 打 交道 。所 以数据库 自身的编码 方式对J P , 到乱码产 生的原 , 百 I C de 中文的显示起 着决定性 作片。如果在 中文在 写 e c dn 并没有想像中那么复杂,在编程过程 1 n o ig 和 各个本地字符集的 补充、完善 ,以及 系统 或 n 应 用程序 寅现的不规范 ,转码时 出现的问题时 入数据库过程 中 已是乱码 ,那显示的数据毫无 中只要注意卡 是问题就 町避免问题现象的出现 。 交换用的字符编码集 ,如美国的 A C I S I ,中国 的 GB 3 2 8 ,日本的 J 等 ,作 为该 家/ 2 1~ 0 I S 区域 内信启、 处理的基 础,有着统一编码 的重 要 作用。字符编码集按长 度分 为 S BCS ( 字节 字 符集 ) ,DBCS ( 字节字符集 )两 人类。 双 早期的软 什 ( 尤其是操作 系统) ,为 了解决 本 地 符 信息 的计算机处理 ,出 了各种本地 化 版奉 (JO IlN),为 了区分 ,引进 了 LANG, C d p g 等概念 。但是 山于各个本地 字符集 oea e 代码范 围圣毳 ,相 互问信息 交换 困难 ;软件 各 个本地化版本 独立维护成本较 高。因此有必 要 将 本地 化工 怍中 的共性 抽 取 出来 ,作 一 处 致 理 ,将特 州的 本地 化处理内容降低 到最少。这
jsp页面传值中文乱码问题解决
JSP中文乱码种类
1.JSP文件中文内容显示乱码
2.调用Servlet显示乱码
3.Post表单乱码
4.Get参数乱码
5.存取数据库乱码
1
•通过浏览器调用JSP页面,在客户端浏览器中所有的中文内容出现乱码
•解决方案:替换ISO-8859-1,修改页面编码为UTF-8
调用Servlet显示乱码
•通过浏览器调用Servlet,Servlet在浏览器中显示内容出现乱码
调用Servlet显示乱码
•解决方案:在Servlet使用response在输出内容之前,先执行response.setContentType("text/html;charset=UTF-8")设定输出内容的编码为UTF-8
Post表单乱码
•提交页面表单元素给对应的JSP页面或者Servelt后,接收方出现表单数据中文值乱码
Post表单乱码
•解决方案:在接收POST提交的参数之前,使用request.setCharacterEncoding(“UTF-8")设定接收参数的内容使用UTF-8编码
Get查询字符串乱码
•用Get方式传递参数,中文字符会出现乱码
ISO8859_1ISO8859_1gb2312gb2312
客户端通过GET 提交中文编码问题简单流程:
假如:
客户端和服务器用gb2312
HTTP 传输编码用ISO8859_1
则:
服务器需要指示客户端文档的编码方式
Get查询字符串乱码
•解决方案:Get提交默认是以ISO88591传递,如果容器没有做配置修改,程序则需要手工进行编码转换
存取数据库乱码
•解决方案:在数据库连接参数中设置编码值。
如何解决乱码问题总结
</filter-mapping>
3.URL中的中文问题
对于直接通过在URL中传递中文参数,如“http://localhost/a.jsp?str=中文”这样的get请求,在服务端用request.getParameter("name")时返回的往往是乱码。按以上的做法设置Filter没有用,用request.setCharacterEncoding("gbk")的方式,仍然不管用。
httpServletResponse.setContentType("text/html;charset=gbk")),最好同时在JSP页面的head部分加上<meta http-equiv="Content-Type" content="text/html;charset=gbk">
·在每次要输出中文的地方主动转换编码方式,比如要在页面中输入“中文”二字,就可以用以下方式:
<%
String str="中文";
byte[] tmpbyte=str.getBtyes("ISO-8859-1");
str=new String(tmpbyte);
out.print(str);
%>
2.获取表单提交的数据时的中文乱码问题
%>
<html>
<head>
<title>中文Test</title>
<meta http-equiv="Content-Type" content="text/html;charset=gbk">
JSP中文乱码问题解决办法
JSP中文乱码问题解决办法当用request对象获取客户提交的汉字字符时,会出现乱码问题,所以对含有汉字字符的信息必须进行特殊处理。
常见的几种字符集编码:⏹ASCII码:不支持中文⏹ISO-8859-1:不支持中文⏹GB2313、GBK:支持中文⏹Unicode:支持中文⏹UTF-8:支持中文在解决JSP中文乱码问题前,弄清以下几点:(1) windows平台采用的默认字符集编码是:GBK(2) IE浏览器默认采用UTF-8字符集编码方式发送Http请求。
(3) Tomcat在处理Get请求时,永远采用ISO-8859-1编码;Tomcat在处理Post请求时,默认采用ISO-8859-1编码;如果进行了如下设置request.setCharacterEncoding(“GBK”),则采用GBK编码。
可以使用如下几种方式解决JSP中文乱码问题。
1、方法一:调用自定义的转换函数<%@page contentType="text/html;charset=GB2312"%><%!public String getStr(String s) {String str = s;try {byte[] b = str.getBytes("ISO-8859-1");str = new String(b);return str;} catch (Exception e) {return str;}}%>使用内置对象request将获取的数据,使用ISO-8859-1进行重新编码,并保存到一个字节数组中,然后调用new String()方法,以GBK方式将这个字节数组构造出一个新的字符串,这个新的字符串就是我们想要的结果。
适用于以下三种情况:(1) 以Get方式提交表单,提交的数据中包含汉字字符。
(2) 以Post方式提交表单,提交的数据中包含汉字字符。
jsp中文编码乱码的分析与解决
jsp中文编码乱码的分析与解决摘要 jsp技术目前普遍应用于网络编程,java在中文处理方面经常出现乱码现象。
本文从分析各种常见的jsp页面中文乱码产生的原因入手,并给出该乱码的解决方案。
经过多次实践,基本可以解决常见jsp页面常见的中文乱码问题,有着很好的广泛性。
关键词网络编程;中文乱码;jsp页面编码中图分类号tp39 文献标识码a 文章编号1674-6708(2011)57-0183-020引言jsp(java server pages)是由sun公司倡导、许多公司参与一起建立的一种动态网页技术标准,jsp技术采用java作为开发脚本语言,java本身有着很好的跨平台性,但是jsp在结合页面技术后,最使人头疼的一个问题就是不能很好的处理中文乱码问题,在开发过程中带来诸多不便,本文从剖析中文乱码产生的各种原因入手,并给出相应的解决方案。
1中文乱码的根源1)中文的编码很多,在不同的情况下可能有多种不同的二进制值;2)在某些应用中传递数据时,可能把中文转换成其它形式;3)在一个应用系统中,编码之间存在各种各样的转换;4)在转换过程中需要制定编码方式;5)在具体实践过程中,可能忽略或忘记设置编码;6)不同的软件环境其编码设置方式不同也容易导致中文乱码;7)编码工具的多样性以及对编码的模糊认识不清。
2常见的jsp页面中文乱码网上常出现的 jsp/servlet encoding 问题一般都表现在browser 或应用程序端,如:浏览器中看到的 jsp/servlet 页面中的汉字怎么都成了‘?’;浏览器中看到的 servlet 页面中的汉字怎么都成了乱码;java 应用程序界面中的汉字怎么都成了方块;jsp/servlet 页面无法显示gbk 汉字;jsp/servlet 不能接收 form 提交的汉字;jsp/servlet 数据库读写无法获得正确的内容。
3 中文乱码产生原因分析1)在jsp中如果指定了,那么在该jsp中所有用到的数据,如果沒有指定编码,那么这些数据的编码方式为a。
解决中文乱码的几种解决方法(推荐)
解决中⽂乱码的⼏种解决⽅法(推荐)⾸先说明我的特殊情况:1. 前台jsp中,我使⽤的是 form post 请求,设置了 enctype="multipart/form-data" ,页⾯编码格式都是utf-82. 后台中,我使⽤的是commons-fileUpload组件,ServletFileUpload 解析form表单和⽂件,3. 设置 request.setCharacterEncoding("UTF-8");4. 设置了ServletFileUpload .setHeaderEncoding("UTF-8");5.Tomcat 的配置下⾯ server.xml 也已经设置了 URIEncoding="UTF-8";⾄此,按道理所有的格式都匹配上了,前后对应,解析出来的肯定是utf-8,但是经过formfield解析出来后任然是ISO-8859-1格式的编码,enctype="multipart/form-data" 会将数据以2进制的编码格式传递,因此我断定是 ServletFileUpload 解析时出了问题,多番查找,我的问题缺少了⼀步String formFieldValue = fileItem.getString("UTF-8");JSP和Servlet的六种中⽂乱码处理⽅法⼀、表单提交时出现乱码:在进⾏表单提交的时候,经常提交⼀些中⽂,⾃然就避免不了出现中⽂乱码的情况,对于表单来说有两种提交⽅式:get和post提交⽅式。
所以请求的时候便有get请求和post请求。
每种⽅式都有着不同的解决⽅法,之所以出现乱码,原因就在于get 请求时,其传递给服务器的数据是附加在URL地址之后的;⽽post的请求时,其传递给服务器的数据是作为请求体的⼀部分传递给服务器。
JSP出现中文乱码问题解决方法详解
JSP出现中⽂乱码问题解决⽅法详解在介绍⽅法之前我们⾸先应该清楚具体的问题有哪些,笔者在本博客当中论述的JSP中⽂乱码问题有如下⼏个⽅⾯:页⾯乱码、参数乱码、表单乱码、源⽂件乱码。
下⾯来逐⼀解决其中的乱码问题。
⼀、JSP页⾯中⽂乱码在JSP页⾯中,中⽂显⽰乱码有两种情况:⼀种是HTML中的中⽂乱码,另⼀种是在JSP中动态输出的中⽂乱码。
先看⼀个JSP程序:<%@ page language="java" import="java.util.*" %><html><head><title>中⽂显⽰⽰例</title></head><body>这是⼀个中⽂显⽰⽰例:<%String str = "中⽂";out.print(str);%></body></html>上⾯这个JSP程序看起来好像是在页⾯显⽰⼏句中⽂⽽且标题也是中⽂。
运⾏后在浏览器中显⽰如图所⽰原因在于没有在JSP中指定页⾯显⽰的编码,消除乱码的解决⽅案很简单上⾯代码中page命令修改成如下所⽰即可<%@ page language="java" import="java.util.*" contentType="text/html; charset=GB2312" %><html><head><title>中⽂显⽰⽰例</title></head><body>这是⼀个中⽂显⽰⽰例:<%String str = "中⽂";out.print(str);%></body></html>再次运⾏乱码消失,原理就是向页⾯指定编码为GB2312,那么页⾯就会按照此编码来显⽰,于是乱码消失。
jsp url中中文参数的乱码解决
form有2中方法把数据提交给服务器,get和post,分别说下吧。
(一)get提交1.首先说下客户端(浏览器)的form表单用get方法是如何将数据编码后提交给服务器端的吧。
对于get方法来说,都是把数据串联在请求的url后面作为参数,如:http://localhost:8080/servlet?msg=abc(很常见的一个乱码问题就要出现了,如果url中出现中文或其它特殊字符的话,如:http://localhost:8080/servlet?msg=杭州,服务器端容易得到乱码),url拼接完成后,浏览器会对url进行URL encode,然后发送给服务器,URL encode的过程就是把部分url做为字符,按照某种编码方式(如:utf-8,gbk等)编码成二进制的字节码,然后每个字节用一个包含3个字符的字符串"%xy" 表示,其中xy为该字节的两位十六进制表示形式。
我这里说的可能不清楚,具体介绍可以看下.URLEncoder类的介绍在这里。
了解了URL encode的过程,我们能看到2个很重要的问题,第一:需要URL encode的字符一般都是非ASCII的字符(笼统的讲),再通俗的讲就是除了英文字母以外的文字(如:中文,日文等)都要进行URL encode,所以对于我们来说,都是英文字母的url不会出现服务器得到乱码问题,出现乱码都是url里面带了中文或特殊字符造成的;第二:URL encode到底按照那种编码方式对字符编码?这里就是浏览器的事情了,而且不同的浏览器有不同的做法,中文版的浏览器一般会默认的使用GBK,通过设置浏览器也可以使用UTF-8,可能不同的用户就有不同的浏览器设置,也就造成不同的编码方式,所以很多网站的做法都是先把url里面的中文或特殊字符用javascript做URL encode,然后再拼接url提交数据,也就是替浏览器做了URL encode,好处就是网站可以统一get方法提交数据的编码方式。
JSP技术中文乱码的原因及解决方法
JSP 技术中文乱码的原因及解决方法杨金花(西安铁路职业技术学院陕西西安710014)摘要:JSP 技术广泛应用于动态网页制作,但在应用中文字符时常常出现乱码。
以前有关JSP 技术中文乱码的研究,只是侧重于对常见的几种中文乱码情况分析,并从网页代码方面进行研究,然后给出相应的代码,缺少对造成中文乱码原因的研究。
本文从造成乱码的根本原因入手进行分析,以JSP 技术工作过程为线索,提出新的研究思路:从开发Java 程序时所涉及的开发环境以及使用的开发工具着手,研究字符的存储与编码的关系,将影响Java 中字符编码的原因分为内因和外因。
研究结果表明,在使用JSP 技术的过程中,中文字符的编码不仅在JSP 工作过程中,会发生编码的转换,而且会因开发环境以及使用开发工具不同,使存储在内存的编码形式发生转换,每种编码之间的转换没有规律。
本文系统地分析了Java 中字符编码的转换,最后针对JSP 中常见的中文乱码情况,给出了相应的解决方法。
关键词:字符编码;中文乱码;JSP 技术;Servlet 中图分类号:TP311文献标识码:A文章编号:1674-6236(2011)01-0025-03The reason and solution of Chinese garbled code in JSP technologyYANG Jin -hua(Xi ’an Railway Vocational Technical College ,Xi ’an 710014,China )Abstract:JSP technology is widely used in the production of dynamic web pages ,but the chinese characters in its application often garbled.Chinese garbled before the JSP technology research ,is focused on several common chinese garbled on the situation analysis ,and researches aspects of the code from the page ,and then gives the corresponding code ,the lack of research into the reasons causes the chinese garbled.This paper analyses from the real causes of the underlying cause garbled.JSP technology researches to the work process for the clues ,puts forward new research ideas :the development of Java programs involved in the development environment and start using the development tools ,storage and encoding of character relationships ,affecting the character encoding in Java is divided into internal and external reasons.The results show that use of JSP technology in the process ,the chinese character code in the JSP course of their work not only will happen coding of the convert ,but also because of development environment ,and use the development tools ,the code stored in memory in different forms.Between each code conversion is not the law.This paper systematically analysed the Java character encoding conversion ,in the end for the JSP common situation in the chinese garbled ,the corresponding solution was given.Key words:character encoding ;chinese garbled ;JSP technology ;ServletJSP ,也就是Java Server Page (Java 服务器网页),是目前市场上主流的分布式应用程序开发平台。
JSP中文乱码问题完全解决方案
request.setCharacterEncoding(this.encodingName);
}
chain.doFilter(request, response);
}
public void destroy() {
} else {
this.enable = false;
}
}
public void doFilter(ServletRequest request, ServletResponse response,FilterChain chain) throws IOException, ServletException {
四. 数据库操作中文乱码
在建立数据库的时候,应该选择支持中文的编码格式,最好能和JSP页面的编码格式保持一致,这样就可以尽可能减少数据库操作的中文乱码问题。同时在JDBC连接数据库的时候可以使用类似下面这种形式的URL。jdbc:microsoft:sqlserver://localhost:1433;DatabaseName=pubs;useUnicode=true;characterEncoding=gb2312
import javax.servlet.UnavailableException;
public class SetCharacterEncodingFilter implements Filter {
protected FilterConfig filterConfig;
protected String encodingName;
}
}
在web.xml中添加过滤器的配置如下:
<filter>
中文乱码问题解决方法
在Jsp文件问题时,中文乱码现象经常遇到,现将处理方法总结一下,供大家参考:(在各种编码方案中,UTF-8、GBK、GB2312都是支持中文显示的。
只是GBK比GB2312支持跟多的字符)一、JSP页面显示乱码Jsp文件页面显示乱码,这种情况比较好处理,在页面的Page指令加上如下一项就OK了:<%@ page contentType="text/html; charset=gb2312"%>注:如果是HTML页面显示乱码,则加上:<meta http-equiv="Content-Type" content="text/html; charset=gb2312"> 二、URL传递参数中文乱码当我们把一段中文字符作为参数传递个另一页面时,也会出现乱码情况,解决方法一如下:在参数传递时对参数编码,比如RearshRes.jsp?keywords=" + .URLEncoder.encode(keywords) 然后在接收参数页面使用如下语句接收keywords=newString(request.getParameter("keywords").getBytes("ISO-8859-1"),"UTF-8") ;解决方法二:修改tomcat的server.xml文件中URIEncoding。
<Connectordebug="0"acceptCount="100"connectionTimeout="20000"disableUploadTimeout="true"port="80"redirectPort="8443"enableLookups="false"minSpareThreads="25"maxSpareThreads="75"maxThreads="150"maxPostSize="0"URIEncoding="GBK"></Connector>这个方法主要针对从url中获取字符串的问题。
JSP中文乱码的产生原因及解决方案
JSP中文乱码的产生原因及解决方案在JSP的开发过程中,经常出现中文乱码的问题,可能一直困扰着大家,现在把JSP 开发中遇到的中文乱码的问题及解决办法写出来供大家参考。
首先需要了解一下Java中文问题的由来:Java的内核和class文件是基于unicode的,这使Java程序具有良好的跨平台性,但也带来了一些中文乱码问题的麻烦。
原因主要有两方面,Java和JSP文件本身编译时产生的乱码问题和Java程序于其他媒介交互产生的乱码问题。
首先Java(包括JSP)源文件中很可能包含有中文,而Java和JSP源文件的保存方式是基于字节流的,如果Java和JSP编译成class文件过程中,使用的编码方式与源文件的编码不一致,就会出现乱码。
基于这种乱码,建议在Java文件中尽量不要写中文(注释部分不参与编译,写中文没关系),如果必须写的话,尽量手动带参数-ecoding GBK或-ecoding gb2312或-ecoding UTF-8编译;对于JSP,在文件头加上<%@ page contentType="text/html;charset=GBK"%>或<%@ page contentType="text/html;charset=gb2312"%>基本上就能解决这类乱码问题。
下面是一些常见中文乱码问题的解决方法(下面例子中ecoding采用的是gb2312,也可设为ecoding GBK或ecoding UTF-8):一、JSP页面乱码这种乱码问题比较简单,一般是页面编码不一致导致的乱码,一般新手容易出现这样的问题,具体分以下两种情况:➢未指定使用字符集编码下面的显示页面(display.jsp)就出现乱码:<html><head><title>JSP的中文处理</title><meta http-equiv="Content-Type" content="text/html charset=gb2312"> </head><body><%out.print("JSP的中文处理");%></body>这种乱码的原因是没有在页面里指定使用的字符集编码,JSP页面中出现了中文字符,而默认的ISO-8859-1字符集中无中文字符,解决方法:只要在页面开始地方用下面代码指定字符集编码即可,在JSP页面中指定编码方式(gb2312),和浏览器解码方式设置相同,即在页面的第一行加上:<%@ page contentType="text/html; charset=gb2312"%>,就可以消除乱码了。
jsp中文传参乱码问题
String title= request.getParameter("title");
title= new String( title.getBytes("iso-8859-1"), "UTF-8");
System.out.println(title);
}
二、为编码为UTF-8的JSP页面传参,对于中文乱码的解决分为两种情况:
1.通过GET方式传参,通过new String(request.getParameter("").getBytes("ISO-8859-1"),"UTF-8"); 的方式转换为需要的编码,如UTF-8等。
一、在请求页面的请求参数需要用encodeURI进行转码,然后在接收请求的页面需要进行字符集转换。
本例中的请求和接收页面的字符集都是UTF-8:
1.请求的JSP页面用JavaScript的encodeURI()方法将参数转码:
function toView(param){
var encodeparam = encodeURI(param) ;
window.location.href="/naias/advAna_form.do?method=showDetail&title="+encodepara进行字符集转换:
public ActionForward excute(ActionMapping mapping, ActionForm form, HttpServletRequest request, HttpServletResponse response){
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
然后我们在info.jsp中来调这个函数,具体代码如下: <%@ page contentType="text/html; charset=GBK" %> <%@ include file="tocn.jsp" %> <h3>测试中文信息</h3> 传递的中文信息: <% String test = tocn(request.getParameter("test")); out.println(test); %>
接下来再次测试程序,发现问题得到了解决,中文信息正 确显示出来了。如图所示:
注意:这种解决方式只对POST提交方式有效,如果客户 端是以GET方式或者URL重写的方式提交的中文信息,可 能它就无用武之地了。
参数传递乱码问题
在Web应用中,客户端提交请求信息时,在某些情况下需要用到GET 提交方式。 有时,在以URL重写方式传递信息时,也会传递中文信息。 这两种方式如果用方案二是无法解决中文乱码问题的。我们先来看一 个测试,还是需要两个JSP页面。如下: refer.jsp <%@ page contentType="text/html; charset=GBK" %> <form action="info.jsp" method="GET"> 输入中文进行测试<br> <input type="text" name="test"/> <input type="submit" value="ok"/> </form> <a href='info.jsp?test=我爱我家'>下一页</a>
乱码的原因
我们都知道,西欧语系都用一个字节来存储字符,而东方 以汉语为主的语系都是用两个字节来存储字符。 在Web应用中,当客户端向服务器提交请求的时候,提交 的信息一般用本地字符集进行编码,如中文采用GB2312 或GBK字符集(GBK是GB2312的扩展),英文或西欧文 字采用ISO-8859-1字符集。 由于Java程序中一律采用Unicode处理字符串,当JSP文 件转成Java文件时,大部分服务器默认使用ISO-8859-1 字符集来进行编码,所以出现乱码问题也是在所难免的 (这一点,我们可以通过查看Jasper所生成的Java中间文 件来确认)。于是,就要求我们在编写程序的时候,进行 编码转换。
下面我们来做一个测试,编写两个简单的JSP页 面,第一个JSP页面以POST方式向第二个页面提 交信息,第二个页面得到信息之t.jsp: <%@ page contentType="text/html; charset=GBK" %> <form action="getinfo.jsp" method="post"> 输入中文进行测试<br> <input type="text" name="test"/> <input type="submit" value="ok"/> </form> getinfo.jsp: <%@ page contentType="text/html; charset=GBK" %> <h3>测试表单的提交信息</h3> 客户端提交的信息: <% out.println(request.getParameter("test")); %> 然后就可以启动服务器测试程序了,在test.jsp页面的文本框中输入 “中华人民共和国”,如图所示:
解决输入乱码问题
浏览器在将表单的内容以POST方式提交到服务 器时,却没有包含charset字符集,而且将中文信 息以%xx的形式(xx是十六进制数)进行编码。
例如汉字“中”的GB2312内码为0xD6D0,在HTTP请 求中就变成了%D6%D0,根据RFC2616的规定,如果 在HTTP请求中未指明字符集,就使用ISO-8859-1编码, 这样“中”字在处理时变成了两个字符,分别为 “u00D6”和“u00D0”,而返回到客户端时变成了两个 不可显示的字符,浏览器一般显示成“??”。
info.jsp <%@ page contentType="text/html; charset=GBK" %> <h3>测试中文信息</h3> 传递的中文信息: <% request.setCharacterEncoding("GB2312"); out.println(request.getParameter("test")); %> 在refer.jsp中分别用GET方式和URL重写方式向info.jsp 提交中文字符串“我爱我家”,我们发现,当使用GET方式提交时, URL变成了如下所示: http://localhost:8080/Web/info.jsp?test=%CE%D2%B0%AE%C E%D2%BC%D2 而用URL重写方式传递参数时,URL是: http://localhost:8080/Web/info.jsp?test=我爱我家
Servlet JSP Servlet javaBean Action Bean Action Bean
DAO/JDBC JDBC DAO/JDBC DAO/JDBC DAO/JDBC PO/hibernate
Spring/DAO Spring hibernate
什么是国际化
网站实现国际化,主要是为了将资源进行全球共享。 首先,要我们来了解一下,网站是如何实现全球资源共享 的。我们在浏览器地址栏中输入“中央电视台”的中文网 址:“http:”。 我们发现,在网页的头栏中,可以选择“繁体”或其它语 种阅读网站内容,如图中白色方框所框起部分。
解决显示乱码问题
只需要在程序第一行加上以下代码就可以处理中文乱码问 题了。
<%@ page contentType="text/html; charset=GBK"%>
再次运行程序,效果如图所示:
方案一
方案:
在上个例子中,我们采取的是使用伪指令来指明输出 页面所使用的字符集,JSP引擎会将<%@ page contentType=“text/html; charset=GBK”%>伪指令转 换为HTTP应答的头部: contentType=“text/html;charset=GBK”。 这样,浏览器就会输出GBK编码的中文页面。采取这 个方案可以解决页面普通的中文输出。在现实开发中, 有时需要同时写入下面两行代码。 <%@ page contentType="text/html; charset=GBK" language="java" %> <meta http-equiv="Content-Type" content="text/html; charset=GBK">
response.setContentsType("text/html;charset= GB2312");
下面我们就对getinfo.jsp稍加修改,指定客户端请求以 “GB2312”类型对信息进行编码,如下:
<% request.setCharacterEncoding("GB2312"); out.println(request.getParameter("test")); %>
什么是国际化
国际化又称为I18N,它的由来是因为它的英文是 Internationalization,以I开头,N结尾,总共有18个字母 (本地化的英文是Localization,所以称为L10N)。国际 化问题主要包含下列四种内容:
日期格式、时间格式
数字
货币 其它一些特殊字符
HTML字符实体与Unicode字符标准
为什么会出现乱码
其实,大部分Java应用服务器都是在使用英语的 国家中开发出来的,由于缺乏某些字符集(中文、 日文、韩文等)的应用环境,这些应用服务器在 处理HTTP请求时就存在一些中文处理的问题,于 是这就成为了困扰JSP和Servlet开发者的难题。 最直观的解决方法就是在浏览器的菜单栏中依次 选择“查看”“编码”“简体中文 (GB2312)”,如图所示,然后浏览器就会正 确的显示出中文来。具体操作如图所示:
HTML字符实体定义了用特定的字符序列显示单字符的功能。
它由三部分构成:以“&”开头,中间是实体名称(或#和实体编号), 以“;”结尾。譬如我们要在页面上输出一个小于号,就需要这样 写:“<”或者“<”。要注意的是,实体对大小写是敏感的。
Unicode字符标准由Unicode协会定制,它是一个字符编码 系统,支持相互转换、处理和显示全球不同语言的文本内 容。
虽然在info.jsp中用到了request.setCharacterEncoding("GB2312");, 可浏览器显示出来的还是一堆乱码,两种情况下,都把“我爱我家” 显示成了“??°?????”,如图所示:
方案三
只要是经过URL传递参数的,系统会默认采用“ISO-8859-1” 的编码方式对信息进行编码 request.setCharacterEncoding(“GB2312”) 只能对按照变量 和值相对应的传递方式进行中文处理。 只需要在输出中文信息之前,再对指定信息进行编码就能解 决问题,代码如下: