您现在的位置:首页 --> 查看专题: 粒度
一.前言传统的搜索引擎的定义,是指一种对于指定的查询(Query),能够返回与之相关的文档集合(Documents)的系统。而百度将这个定义更加丰富化,即搜索引擎能够帮助人们更方便的找到所求。这里的“所求”,比“文档”更加宽泛和丰富,比如一个关于天气的查询,直接返回一个天气预报的窗口,而非一篇关于天气的文档;再如一个关于小游戏的查询,直接返回这个小游戏的Flash页面而非简单的介绍性的文字。百度对Query深刻的理解,源于自然语言处理技术在其中发挥的巨大作用。对搜索引擎而言,文本切分是最基础也是最重要的自然语言问题之一。今天,我们就来谈谈文本切分粒度与搜索引擎的关系。本文后续章节组织如下:第二节介绍什么是文本的粒度,第三节讲述搜索引擎的基本原理与文本切分粒度的关系,第四节深入探讨粒度的属性与检索相关性计算,第五节小结。 二.文本粒度什么是文本的粒度?我们用什么来衡量文本粒度?在回
强硬的把CSS和HTML塞到PHP里面可以防止代码太枯燥(DRY)并最终导致代码臃肿,因为的CSS和HTML需要比PHP更细致的对象结构。事实上,PHP的模板不是天生合适的,因为每个模板包含了许多不同的HTML,以及以不同的方式相结合的CSS对象。
我认为问题的根本不在tag本身,而是设计层面做的不够。在实际的处理方案中,我认为tags不一定需要用户来提供,因为确实价值有限。但如果是团队内部用tags来组织信息,肯定会收到事半功倍的效果。只不过中英文的处理上,应该需要注意中文本地化问题。
[ 共3篇文章 ][ 第1页/共1页 ][ 1 ]
近3天十大热文
- [190] WEB系统需要关注的一些点
- [13] InnoDB insert性能拐点测试
- [12] 深入剖析 redis replication
- [12] 一次神奇的MySQL优化
- [12] Spark性能优化——和shuffle搏斗
- [12] 我的git笔记
- [11] 浏览器的工作原理:新式网络浏览器幕后揭秘
- [11] Python 代码规范小结
- [10] Android设计中的.9.png
- [9] Python程序的执行原理
赞助商广告