标签的语言粒度
一年零六个月前,我写了篇使用标签是迟早的事来反驳“就博客而言,标签没有太大意义”的观点。最近又看到在分享里有篇文章提到tags在中文网站用不好的原因之一是语言的粒度问题,因为“英文的粒度是单词,中文的粒度是字。”并且举了个“猫”的例子,英文tags多半是cat,而中文tags可能是猫、猫猫、猫咪、咪咪、小猫咪等等。
我认为这个结论还是不够准确,问题任何语言都存在,只是各有各的表现特征。在某种程度上,中文可能表现的很麻烦,但英文也简单不到哪里去,比如英文的复数。《锦绣蓝图》中有个关于英文正餐之前开胃菜说法的例子,可以叫starter, first course, appetizer, Hors d’oeuvres, Anamuse-gueule,另外西餐馆可能叫grazing,运动主题酒吧可能叫warmups。
可见,问题的关键是计算机不能像人一样主动思考。并且现实生活中,因为语言、文化、习惯、专业等等因素,很容易造成词汇混乱。在信息架构专业领域里,有个方法叫“创建受控词汇表”。顾名思义,就是统一“约定俗成的表意词”,用人工的关系组织来让计算机明白N种说法其实都一样。
文章提到第二个用户习惯的原因,我认为确实客观存在。但这个不是“中文”的问题,用户也可以再教育,比如很多做的好的英文产品上,也能看到中文用户提供并维护很好的tags体系。当然,说到网民容易把话题扯很大,反正现实是目前绝大多数中文网民上网的首要任务还不是“任务导向”。
综上所述,我认为问题的根本不在tag本身,而是设计层面做的不够。在实际的处理方案中,我认为tags不一定需要用户来提供,因为确实价值有限。但如果是团队内部用tags来组织信息,肯定会收到事半功倍的效果。只不过中英文的处理上,应该需要注意中文本地化问题。
还是关于“语言粒度”的例子,英文tags的input录入控件里,约定成俗的习惯基本都用英文逗号“,”做分隔符,而很多中文网站也延续了这个规范。我认为并不合适,因为英文的粒度是单词,有可能用多个单词加空格来做描述;而中文的粒度是文字,所有词描述都由N个字组成。另外,中英文切换也不方便,所以中文tags的input录入控件用“空格”做分隔符最合适。
建议继续学习:
- 标签?ID?还是CLASS? (阅读:4498)
- 给微博打上标签 (阅读:4045)
- 推荐系统的问题 (阅读:3772)
- 互联网里的分类和标签 (阅读:2614)
- PHP正则匹配字符串中的标签 (阅读:2630)
- 可选闭合标签 (阅读:2336)
- Flash在某些多标签浏览器中的“伪沙箱”问题 (阅读:2048)
- 如何创建CSS的对象?获取合适的粒度! (阅读:2033)
- 搜索引擎中的粒度问题 (阅读:1752)
- 标签在web2.0中的适用范围 (阅读:1762)
扫一扫订阅我的微信号:IT技术博客大学习
- 作者:千鸟 来源: 千
- 标签: 标签 粒度
- 发布时间:2010-04-22 18:21:20
-
[85] memory prefetch浅析
-
[56] 基本排序算法的PHP实现
-
[50] 深入浅出cassandra 4 数据一致性问
-
[42] 转载:cassandra读写性能原理分析
-
[40] javascript插入样式
-
[39] MySQL半同步存在的问题
-
[38] Inline Form Labels
-
[37] JS中如何判断字符串类型的数字
-
[36] 字符引用和空白字符
-
[34] 获取Dom元素的X/Y坐标