技术头条 - 一个快速在微博传播文章的方式     搜索本站
您现在的位置首页 --> 查看专题: xapian
    Xapian::QueryParser的语法本文档介绍了Xapian::QueryParser类支持的查询语法.这套语法设计得跟其他基于Web的搜索引擎的语法类似,这样用户就会很熟悉,不用从头学习一个全新的语法。操作符 AND Expression AND expression 匹配两个条件都符合的文档. OR Expression AND expression 匹配符合两个条件中任何一个的文档. NOT expression NOT expression 匹配那些只匹配第一个条...
    术语表本术语表定义了在使用xapian时可能遇到的一些专业术语.其中一些是信息检索领域的标准概念,而另一些则在xapian中有特别的意义. BM25 xapian默认使用的加权方法。BM25是原来的概率加权算法的,而最近的TREC测试表明,BM25是已知的相关性衡量体系中最好的。有时它也被称为“Okapi BM25”,因为它是最先是在一个叫Okapi的学术性的IR系统中实现的。布尔检索检索跟一个布尔查询...
    

    Xapian API是相当复杂的,而且在索引和搜索时,QueryParser,Term,document values 经常困惑着人们.要特别指出的是,Xapian本身并无一个”field”的概念,field这东西是flax的组件做的更高层次的抽象和封装.Xapian只是有Document ,包含一个整数标识ID,document包含:

    Terms (通常是词或短语,可以带位置信息,带位置信息的叫POST),

    VAlue (通常是一个简短的字符串,也可能是包含的二进制数据),以及

    data (可以是任何数据,但往往是一些适合显示的文本)。

    大约从07年起,本博客就不转载了; 这篇算是以译文发的,原文在:http://www.contentwithstyle.co.uk/content/searching-with-xapian-and-php ========邪恶的分割线============ 有的时候呢,嗯 ,mysql 就是不够快;尤其是在做全文检索的时候.各个字段都得正确地检索才行,而当我们的各个字段带有不同的权重时,事情就马上变得特别复杂了,这时你就需要xapian来救急了. Xapian是什么东东 xapian是一个全文检索库,就和lucene和sphinx一样;它...
[ 共4篇文章 ][ 第1页/共1页 ][ 1 ]
© 2009 - 2024 by blogread.cn 微博:@IT技术博客大学习

京ICP备15002552号-1