技术头条 - 一个快速在微博传播文章的方式     搜索本站
您现在的位置首页 --> 其他 --> NCR与HTML Entities

NCR与HTML Entities

浏览:950次  出处信息

Character Entities References(HTML Entities)和Numeric Character Reference(NCR)都是让你可以在页面中显示特殊的字符的编码方式, 俩者之间有什么异同呢?

一个Numeric Character Reference编码是由一个与号(&)跟着一个井号(#), 然后跟着这个字符的Unicode编码值, 最后跟着一个分号组成的, 如:

  1. &#nnnn;
  2. 或者

其中, nnnn是字符编码的十进制表示, 而hhhh是字符的16进制表示.

另外要注意的是x在xml中必须是小写的.而hhhh可以大小写混用, 另外nnnn和hhhh也可以有前导零.

与NCR不同, HTML Entites是使用一个与号(&),跟着这个字符的名字, 然后以分号(;)结尾来表示一个字符, 这个字符的名字必须是在HTML中已经定义的,比如:

  1. & //&

或者对于XML来说是在DTD中定义过的, 类似:

  1. <!ENTITY nbsp CDATA "&#160;" -- no-break space = non-breaking space,
  2.                                   U+00A0 ISOnum -->
  3. <!ENTITY iexcl CDATA "&#161;" -- inverted exclamation mark, U+00A1 ISOnum -->
  4. <!ENTITY cent CDATA "&#162;" -- cent sign, U+00A2 ISOnum -->
  5. <!ENTITY pound CDATA "&#163;" -- pound sign, U+00A3 ISOnum -->
  6. <!ENTITY curren CDATA "&#164;" -- currency sign, U+00A4 ISOnum -->
  7. <!ENTITY yen CDATA "&#165;" -- yen sign = yuan sign, U+00A5 ISOnum -->
  8. <!ENTITY brvbar CDATA "&#166;" -- broken bar = broken vertical bar,

其中, 名字是大小写敏感的. 比如:

  1. &Aring; // Å
  2. 而:

最后, 在PHP中, 可以通过htmlentites或者mb_convert_encoding($str, “HTML-ENTITIES”, from encoding)来获得一个字符的HTML entities,

也可以通过mb_encode_numericentity(), 或者手动获取unicode值添加&#***, 来获得一个字符的NCR编码.

QQ技术交流群:445447336,欢迎加入!
扫一扫订阅我的微信号:IT技术博客大学习
© 2009 - 2024 by blogread.cn 微博:@IT技术博客大学习

京ICP备15002552号-1