IT技术博客大学习 共学习 共进步

标签在web2.0中的适用范围

沈二铺子 2010-04-29 23:29:01 浏览 2,484 次

前几天看到千鸟的一篇博客《标签的语言粒度》,颇有收获,不禁来谈谈自己对标签的一些看法。

标签和关键词的异同

不得不承认,不管标签(Tag)多么时尚,关键词(Keyword)多么老土,这两者之间的基本意义都是一致的,都是用来描述一个事物的多重属性。以至于,如果有用户问我标签是什么东西的时候,我仍然会告诉他:“就是以前常说的‘关键词’,换一种时髦的叫法而已”。

当然,我这么说只是方便普通用户容易理解,两者之间仍然有重要差异。

标签,是一种分类的工具,标签的出现是为了解决浏览时的难题。在浏览网站的时候,如果内容太多太杂,我们可以使用标签来对内容进行过滤,只看自己想看的标签。用标签浏览时,通常会按照发表的时间新旧顺序排列。

而关键词,是用来辅助搜索的工具,关键词是用来描述一个东西和自己想要找的东西匹配程度的高低。用关键词搜索时,搜索引擎会根据网页和查询关键词的匹配度来提供搜索结果。排在最前的,是最准确的,而不是最新的。

所以,flickr会给每一个关键词都提供一个RSS源允许用户订阅某个tag,而google不会给关键词提供RSS,因为没人会每天都去搜同一个词,看看有什么新网页(SEO专家除外)。

标签的适用范围

标签是web2.0的时髦特征之一。老外写的web2.0书里,总是喜欢拿出flickr的tag的例子来吹嘘一番,说tag如何如何解决问题。好像只要用了tag,分类问题就迎刃而解了。可惜,tag的初衷虽然美好,但实际情况要复杂得多。

不论是中文还是英文,都会有大量的同义词、近义词、单复数等等,语义相近,但表达方式不同的情况。这种语言的随意性,大大影响了标签的使用效果,局限了标签系统的适用范围。

我整理了一下,标签系统在下面三种情况下是比较合适的:

1.标签数量有限,事先设定
我们每天使用的gmail就把标签运用得恰到好处。gmail一方面把收件箱、垃圾邮件等概念,全部用特殊标签来处理。另一方面,gmail的标签并不是让用户在邮件后面随意输入的,而是需要预先创建,然后在常用标签列表中选择。标签的数量非常有限,每个标签具有不同的颜色,便于整理归类。由于标签都是事先创建的,就避免了设置标签时的随意性。
2.个人使用
如果一个分类系统有很多人在使用,可能每个人都会有一套自己的常用词汇表,必然导致同一语义的表达方式差异。又要举gmail的例子,由于邮箱服务是针对单个用户的。一个人对各种语义的表达通常比较稳定,因此不容易出现多重表达方式的情况。
除此个人应用之外,如果是人数不多的多人应用,或者是有彪悍管理员的多人应用,也能基本控制住标签的随意性。
3.海量内容,且对精确度要求不高
与个人应用相对的,在另一个极端,海量数据的情况下,tag也能发挥作用。比如豆瓣的标签分类系统,虽然在设置标签的时候缺乏约束力。但是由于用户极多,标签极多,总有人加了合适的标签。再加上用户在搜索一个标签的时候,或者是豆瓣根据标签给用户推荐内容的时候,对精确度的要求都不高,因此标签仍然很好用。

总之,要么想方设法约束标签的随意性,要么就是有海量的数据,可供挖掘整理,否则标签的威力会因为标签的随意性而大打折扣,相同语义的不同表达方式,会让用户产生更多的困惑。在内容数量不多的情况下,标签往往不如分类系统来得有效。

建议继续学习

  1. 标签?ID?还是CLASS? (阅读 5,066)
  2. 给微博打上标签 (阅读 4,763)
  3. 推荐系统的问题 (阅读 4,644)
  4. PHP正则匹配字符串中的标签 (阅读 3,386)
  5. 互联网里的分类和标签 (阅读 3,286)
  6. 可选闭合标签 (阅读 3,084)
  7. Flash在某些多标签浏览器中的“伪沙箱”问题 (阅读 2,863)
  8. 标签的语言粒度 (阅读 2,843)
  9. 让人又爱又恨的标签们 (阅读 2,622)
  10. 标签明晰、有效 (阅读 2,263)