搜索

2011年1月4日星期二

当世界需要沟通时,请用统一码!

W3C 有一份官方文档《国际化实务:在 HTML/XHTML 中设置语言》,其中有一章的目录结构是这样的:
  1. 设置语言标签
    1. 应用 BCP 47
    2. 选择恰当的语言标签长度
    3. 使用 Hans / Hant 语言标签
整篇文档是英文的,并没有特定于某种语言叙事,唯独在这篇英文文档中出现了这样的篇幅:
Where possible, use the codes zh-Hans and zh-Hant to refer to Simplified and Traditional Chinese, respectively.
如果可能请使用 zh-Hans / zh-Hant 来表示简体中文和繁体中文,还举了这样的例子:
Example 21: Simplified Chinese:

当世界需要沟通时,请用统一码!
Example 22: Traditional Chinese:

當世界需要溝通時,請用統一碼!
我在想中文网页的滥用标签情况得多严重,W3C 才会专章用中文特别说明啊。

总结:
  • 如果可能请用 Unicode 放弃 GB 系编码,以保持兼容性,推荐 UTF-8
  • 简体中文不是 zh-CN,而是 zh-Hans —— zh 是“中”的拼音开头,Han = 汉,s = simplified 首字母
  • 繁体中文不是 zh-TW,而是 zh-Hant —— t 是 traditional 的首字母
CN、TW、HK 之类的地区/国家编码只能表示方言习惯等地域区别。

更多参见:RFC 5646

没有评论:

发表评论