技术头条 - 一个快速在微博传播文章的方式     搜索本站
您现在的位置首页 --> 用户研究 --> Tag与Tagging

Tag与Tagging

浏览:1615次  出处信息

    注:该文发表于《程序员》第10期,有删节。

    Tag,直译标签,是一种由用户自定义的、用于描述信息 [1]的关键词。Tagging是用户为信息赋予Tag的行为。Delicious,Flikr等Web2.0网站的发展促进了它的流行,使之成为社会化书签、相册服务、博客等网站的常见功能。但Tagging对用户来说是一种脑力负担不轻的行为:要将信息分类尚属不易,勿论描述信息。对一条信息而言,应该Tag类目还是属性?范畴应该更宽还是更窄?Tag越多越好、还是控制在一定数量内?尤其困难的是,由于并非事前规划,无法很好预计被Tag内容的发展,入门、维护并不轻松。但从目前网络发展形势而言――个人自生成内容(博文、图片、视频等)迅速增加各类信息海量涌来――Tag可谓信息管理的强大利器。此文以文献整理回顾的方式,分别论述:1. Tagging的利与弊;2.Tagging系统及其UI设计

    1. Tagging的利与弊

    1-1. TagTagging

     Tag作为元数据(metadata):元数据是所谓描述数据/信息的数据,Tag则是一种用户自创的元数据,特点是无层次结构、自定义

     Tagging构成分众分类法(folksonomy):分众分类法,指大众自发利用Tag对信息进行描述、分类,构成与信息架构中传统分类法(taxonomy)相对的信息组织。二者的区别见下表1:

    2009-10-14_175620

表1:taxonomy VS. Folksonomy

    1-2. Tagging的利

    结合表1的对比,可归纳出Tagging的以下好处:

    ・ 使信息组织更经济、高效、灵活。

    如《未来是湿的》作者所言,“只有所有人能把所有信息都分类”。当信息越多,传统分类法的劣势越明显――开发、维护成本只升不降;基于Tagging、运用群众力量的分众分类法则相反。尤其当前的趋势是个人自生成信息越来越多,系统的分类、描述能力和效率可说远不如内容创造者本身。

    对信息的索引、描述更丰富。

    (1)Tag固然不如传统分类法中的控制词表(thesaurus)那么严谨标准,但由于信息可被无穷多人赋予无穷多Tag,故茫茫网海中只要有一个人跟你想到的描述一样,搜索就更有机会有所获。而要恰好用上专家词表内的专业化语词,难度可能更高。对于图像、视频、音频此类系统标注成本极高、效率极低的信息而言,Tagging的价值会更明显。

    (2)用于描述某信息的所有Tag往往是公开共享的,其分布往往呈图1所示长尾状收敛(Shirky, C. 2005)。各Tag及其频率,既可反映大众对于该信息本质广泛一致的定义,又不至于让小众意见(minority opinion)完全被淹没。

    2009-10-14_175918

图1:两条deli.cio.us书签的Tag频率分布

    更人性化的信息检索

    上述两利,最终优化的是搜索:由于对一组系统信息(如个人的博文、Flikr的所有相片、Youtube的所有video)的接入点更多了,用户在信息海洋中找到与之需求匹配的信息的机会也更高。即利用大众的智慧,使搜索在机器化的基础上,更语义化、人性化、社会化。

    以上三点是Tagging社会性优势。Golder et al(2006)提出Tag大致在描述信息的7方面:它关于什么(主题、分类、属性等),它是什么(标题、类型等),谁拥有它(作者、协作者),修饰Tag的Tag,它的品质(有趣、雷人等),自我参考(我买过的、我的书等),任务管理(待读、找工作等)。该分类并非绝对,但从后三种可看出Tag在标引信息时的一大特点在于自我性。这带来的好处有:

    辅助个人信息管理。对个人信息管理而言,Tag可以发挥更大的作用。因其高度自定义性,使信息可被个性化地描述,使个人使用情景(context)成为信息描述的一部分。“很喜欢”、“我想要”、“妈妈生日”这类Tag,是系统较难为用户索引的。

    身份识别。如从某博客的标签云/列表,能看出博主的兴趣、甚至职业等个人信息。

    2009-10-14_175939

图2:某博客的Tag云

    Marlow et al (2006)与Ames & Naaman(2007)曾探讨用户Tagging的动机(表2),表现出社会性自我性的结合。

    2009-10-14_175954

表2:Tagging的动机

    这又带来另一种优势:社会化网络的构建。Tag聚物(信息),亦聚人。一方面,它昭示一个人的兴趣爱好,从而帮助个体寻找同好。另一方面,它能聚合兴趣团体。例如Flikr上一个语法错误、表意模糊的Tag,sometaithurts(so meta it hurts,如此“元级别”,如此痛),却聚集了来自各色用户的各色相片。给照片Tag上sometaithurts的个体,由Tag聚集在一起,彼此间因此有了进一步社交化的机会,并将为这个Tag聚集更多的物。

    1-3. Tagging的弊

    Tagging最为人所诟病的特性有:缺乏一致性、歧义、语法错误。这是由于与专家相比:

    大众是“懒惰”的:Tagging可能停留在粗浅的表层,而不做深入思考或精准描述。尤其当Tag与系统固有分类维度重合的时候,就会失去价值。例如为豆瓣上的电影打上“电影”这个Tag的意义是零。

    大众是“虚伪”的:有人会为了让自己出现在搜索结果更前面等目的而乱Tag;

    大众很“笨”

拼写问题。除了拼错字词,英文里词组的分隔、大小写、单复数等就会造成大量混乱的Tag; 没记性。表现为个人在同一系统中使用不一致的Tag(如字面相异,意义相同等)来标注同一或相似内容。

    这导致大量污染性的垃圾Tag,即所谓搜索结果中的噪音出现,从而降低检索效率。但这并非Tagging的致命伤,通过设计的引导是可以改善这些问题的。第三部分将展开讨论。

    2.Tagging系统,及其UI交互设计

    2-1. Tagging系统

    网站在添加Tagging功能前,需要考虑若干维度,才能让Tag对网站的信息管理、检索发挥真正的作用,否则只是潮而不实的装饰。

    Marlow et al (2006)提出一个Tagging系统模型,包括资源、Tag、用户三部分,它们的关系如图3。

    2009-10-14_180021

图3:Tagging系统包括资源(信息)、Tag、用户三部分

    笔者认为该系统忽略了另一部分:传统的系统分类。并不应该丢弃或将专家的智慧斥之于外,就如亚马逊既有商品的树状分类,以有用户提供的Tag。

    与模型一并提出的是该系统应考虑的7个维度(表3)。

维度

种类

对设计的启示

Tagging权限 o 只能自Tag(Technorati)

    o 权限性Tag(Flikr)

    o 随意Tag(豆瓣)

决定了资源被描述的丰富度、准确度;

    影响用户个人管理Tag的复杂程度

Tagging支持 o 半盲Tag,输入后给与提示(Flikr);

    o 输入前展示自己、他人常用Tag(豆瓣)

影响Tag的质量;

    用户Tagging时的思维负担

聚合方式 o 囊括式:同一资源可被赋予任何Tag,

    并计算重复频率(豆瓣)

    o 组式:同一资源不重复Tag,无累计(Flikr)

囊括式反映大众意见;

    组式反映平均

资源类型 网页、图片、视频、音乐等 标示资源的难易程度会影响用户所需的Tagging支持
资源来源 o 用户贡献(Flikr);

    o 系统提供(Amazon);

    o 抓取(豆瓣)

Tagging权限的设置
联通性 o 通过链接;

    o 通过群组;

决定用户间的互动程度、资源的可发现性
表3:Tagging系统的维度及设计启示

    笔者以为,还需补充的一个维度是,Tagging清理。 对于系统而言,是任由Tag无限泛滥不做任何事情?还是结合传统的机器索引、专家人工干预,适当过滤、聚合,以实现收敛?Gruber (2006)提出通过Tag内在的规范名?anonical Name)对字面各异、实质相同的Tag进行清理。如通过算法将User Experience, UX, user_experience在系统内部统一为规范名User Experience。无论用户输入的是哪个形式的Tag,系统都将返回所有的结果。

    Tagging支持维度还需要虑的一个问题是:系统是否该教育、引导用户打某些维度的Tag?上文提及,当Tag与系统固有分类维度重合的时候,就会失去价值、没有发挥其作用。

    不考虑这两点的话,随着Tag几何级数增长时,噪音也会越来越多。对于系统、对于面对这么多“原始”Tag的用户,都很糟糕。

    2-2. Tagging系统的UI设计

    UI作为Tagging系统与用户的交互层,肩负适当引导用户Tagging行为的重任,是决定Tag质量的关键。

    添加Tag

    要引导用户创造更优质的Tag,输入时刻的辅助至为重要。

    (1)提供参考

    如罗列个人常用Tag,他人常用高频Tag,可有效减少拼写相异语义重复的Tag,提高Tag之间关联性,并可减轻用户思考负担。

    在Delicious上收藏URL时,每输入一个Tag都有Tag池中同首字母的罗列。下方列有个人常用Tag,且优先放置与该资源可能相关的Tag。并有他人常用Tag的罗列。

    2009-10-14_180046

图4:在delicious上收藏一条URL

    (2)批量添加。对于所Tag资源是用户自发贡献时(典型如相片),批量添加Tag的功能能提高效率以及减少二义性。

    2009-10-14_180059

图5:在Flikr上传时

    编辑Tag

    目前常见的编辑操作包括:

    (1)删除。

    (2)重命名。除了基础的重命名,此功能可延伸为Tag的合并与分拆。合并指,若改为与现有另一Tag重名的Tag,自动将二者下的信息合并。分拆指,将当前Tag进行概念细化成新的若干概念。

    2009-10-14_180111

图6:在Delicious重命名一个Tag

    (3)Tag Tag.较为高级的操作,包括用一个Tag 囊括若干Tag(Tag bundle),对Tag增加描述等。

    浏览Tag

    目前Tag的展现方式主要有列表与云图两种。列表无重点,云图则降低了较小字号Tag被发现的效率。但无论采取哪种视图,由于标签的增长性较强,数量的增 加相应提高寻找成本。从算法的角度,可考虑Montero et al(2006)所提出的语义聚类:根据不同Tags同现的频率将其聚合、相邻放置。从交互的角度,应提供一种或以上排序(按字母、热度)。

    2009-10-14_180133

图7:Delicious的Tag云页面

    总结:

     Tag以及Tagging的社会性、自我性,能帮助实现个人化、社会化、情景化搜索,但前提是:

    有更成熟的Tagging系统构建。底层技术上,目前对于垃圾Tag的收敛、清理,做得不够,也尚未良好地结合传统分类与大众分类。UI上,尚未实现有效引导用户去Tag系统已有维度之外、更具附加值的维度。如在豆瓣上打“友情”这个Tag是有价值的,但打“电影”就无甚价值了。)

    对大部分人来讲,Tagging的门槛――无论是操作上还是脑力负荷上――仍然较高。如果结合SNS著名设计师Joshua Porter的使用周期论以及产品接纳三阶段来看, 一个Tagger的发展可用下图来表示:

    2009-10-14_180158

图8:Tagger的进阶

    目前大部分人仍处于第一阶段之外,但也许随着Tag的好处被更好地表现,Tagging的易用程度增加,更多的人会进入这个周期。当系统完善了,人更能轻松发挥力量去补足系统了,语义网的实现就将更有可能。

    参考文献

    o Ames, M., and Naaman, M. (2007). Why We Tag: Motivations for Annotation in Mobile and Online Media. Proceedings of the SIGCHI conference on Human factors in computing systems

    o Golder, S., and Huberman, B. (2006). Usage patterns of collaborative Tagging systems. Journal of Information Science, 32(2), 198-208.

    o Gruber, T. (2005). Ontology of folksonomy: A mash-up of apples and oranges. 1st On-Line Conference on Metadata and Semantics Research (MTSR ‘05).

    o Marlow, C., Naaman, M., Boyd, D., and Davis, M. (2006). HT06, Tagging Paper, Taxonomy, Flickr, Academic Article, ToRead. Proceedings of Hypertext 2006, New York: ACM Press,2006

    o Mathes, A. (2004). Folksonomies ― Cooperative classification and communication through shared metadata,” Computer

建议继续学习:

  1. 商品评论的Tag模式    (阅读:1643)
QQ技术交流群:445447336,欢迎加入!
扫一扫订阅我的微信号:IT技术博客大学习
© 2009 - 2024 by blogread.cn 微博:@IT技术博客大学习

京ICP备15002552号-1