HTML5 Charset能用吗?
前一段某项目中页面在IE6突然出现了乱码,当时做了各种排查,最终推测是使用了HTML5的DOCTYPE和Charset以及中文注释的问题,于是临时采用旧的Charset方法来修复了下,后面乱码再没出现。
其实一直不太确定HTML5的Charset能否被IE6识别,于是做了一些测试。
先说下两种Charset声明方法,其实大家应该都很熟悉的:
1 | <meta charset="UTF-8"><!--HTML5方法--> |
1 | <meta http-equiv="content-type" content="text/html; charset=UTF-8"> <!--HTML4及XHTML方法--> |
后面我们简称第一种方法为HTML5方法,第二种方法为HTML4方法。
测试环境:
Windows XP Sp2,中文版+英文版两个版本的IE6,及Windows 7 下IE9及其各种兼容模式和Chrome、Firefox等的当前Stable版本;
因为我们用到的HTML文件都是UTF8编码的,所以这里测试用例的HTML文件也都是UTF8(无BOM)格式,项目用gbk或者gb2312编码的类似。
测试用了两种方法:
meta方法:包括HTML5和HTML4两种方法及其混搭
服务器端方法:服务器端设置charset,这里使用nginx,charset=utf-8
测试个用例在各浏览器中表现一致;
UTF-8的方案中,全部正常显示;
charset声明为gb2312,由于和文档的UTF-8编码不符,所以全部乱码;
1,6用HTML5 charset分别定义了UTF8和gb2312,1正常显示没有乱码,6乱码——在中文版IE6和英文版IE6均如此,说明IE6能识别HTML5的charset;
1,2用例和6,7用例,分别用单独用HTML5和HTML4方法定义charset,效果一样;
值得注意的是,第三个用例先用HTML5的方法设定UTF-8编码,再用HTML4的编码设定为gb2312,但页面显示正常,而第八个用例反之,结果页面显示乱码,所以可以推测,第二个meta标签并没有生效;
4、5用例并没有乱码,说明单纯的HTML注释并不一定会导致乱码,这里没有测试这两个位置加载不同编码的js等外部文件时可能发生的情况;
服务器方法中,用例1并没有用meta设置charset,页面显示正常,而用例2中用meta设置charset=gb2312,与服务器版本不同,但依然没有乱码,说明服务器端返回的charset优先级更高;
要在HEAD标签中;
在任何其它内容之前,也就是要在HEAD中的最前面;
包括空格和DOCTYPE声明在内,要在前512个字节之内;
HTML5和HTML4两种写法效果一样,用其中之一即可;
测试用例——Meta方法:
测试用例——服务器方法:
上面各用例均可直接访问
测试结果:
结论:
其实关于charset的规范,Google的开发文档中也有解释:
上面的测试也证明,第4条是正确的,两种写法均可。
另外,服务器端设置charset也是很不错的做法,charset声明直接在HTTP response中获得,效率更高,而且更方便。Google目前在用这种方法。
所以只要页面写的规范,并不会出现乱码的问题。所以可以大胆的使用HTML5的DOCTYPE和Charset声明。但是请尽量按照上面说的Google文档中的规范来,头部不要放太多东西,js等外部资源更要放到后面去。
测试中难免会有遗漏,如果有不正确的地方,欢迎指正并一起讨论~~
扫一扫订阅我的微信号:IT技术博客大学习
- 作者:神飞 来源: 前端观察
- 标签: Charset
- 发布时间:2012-12-21 13:25:13
- [56] IOS安全–浅谈关于IOS加固的几种方法
- [55] 图书馆的世界纪录
- [55] 如何拿下简短的域名
- [55] android 开发入门
- [53] Oracle MTS模式下 进程地址与会话信
- [53] Go Reflect 性能
- [50] 【社会化设计】自我(self)部分――欢迎区
- [49] 读书笔记-壹百度:百度十年千倍的29条法则
- [41] 程序员技术练级攻略
- [35] 视觉调整-设计师 vs. 逻辑