IT技术博客大学习 共学习 共进步

用Sphinx快速搭建站内搜索功能

五四陈科学院-坚信科学,分享技术 2010-06-23 12:59:33 浏览 5,563 次

Sphinx[英] [sfɪŋks] [美] [sfɪŋks]

出自俄罗斯的开源全文搜索引擎软件Sphinx,单一索引最大可包含1亿条记录,在1千万条记录情况下的查询速度为0.x秒(毫秒级)。Sphinx创建索引的速度为:创建100万条记录的索引只需3~4分钟,创建1000万条记录的索引可以在50分钟内完成,而只包含最新10万条记录的增量索引,重建一次只需几十秒。

Sphinx 是一个基于 GPL 2 协议颁发的免费开源的全文搜索引擎.它是专门为更好的整合脚本语言和SQL数据库而设计的.当前内置的数据源支持直接从连接到的 MySQL 或 PostgreSQL 获取数据, 或者你可以使用 XML 通道结构(XML pipe mechanism , 一种基于 Sphinx 可识别的特殊xml格式的索引通道)

下面发出操作记录:

10106 wget http://www.coreseek.cn/uploads/csft/3.2/csft-3.2.12.tar.gz
10107 wget http://www.coreseek.cn/uploads/csft/3.2/mmseg-3.2.12.tar.gz

10109 tar -zxvf mmseg-3.2.12.tar.gz
10110 tar -zxvf csft-3.2.12.tar.gz

10111 cd mmseg-3.2.12
10112 yum -y install glibc-common libtool autoconf automake mysql-devel expat-devel
10113 aclocal
10114 libtoolize -force
10115 automake -add-missing
10116 autoconf
10117 autoheader
10118 ./configure -prefix=/usr/local/mmseg3
10119 make
10120 make install
10121 cp -f src/*/*.h /usr/local/mmseg3/include/mmseg/

10122 cd ..
10123 ls
10124 cd csft-3.2.12
10125 aclocal
10126 libtoolize -force
10127 automake -add-missing
10128 autoconf
10129 autoheader
10130 perl -pi -e ’s/lpthread/lpthread -liconv/g’ src/Makefile*
10131 ./configure -prefix=/usr/local/coreseek -enable-id64 -without-python -with-mysql -with-mmseg -with-mmseg-includes=/usr/local/mmseg3/include/mmseg/ -with-mmseg-libs=/usr/local/mmseg3/lib/
10132 make

make后出现iconv错误,所以修改configure文件,查找到#define USE_LIBICONV 把1改为0
重新执行configure和make

10157 make install
10158 cd /usr/local/coreseek/etc/
10164 cp sphinx.conf.dist csft.conf
10165 vim csft.conf
10169 mysql -uroot test

10173 touch /data/exceptions.txt
10174 bin/indexer -all
10177 bin/search test

建议继续学习

  1. 怎样用好Google进行搜索 (阅读 15,662)
  2. 淘宝搜索:定向抓取网页技术漫谈 (阅读 9,361)
  3. 简析搜索引擎中网络爬虫的搜索策略 (阅读 7,280)
  4. 几种常见的基于Lucene的开源搜索解决方案对比 (阅读 5,980)
  5. 基于用户行为分析的搜索引擎自动性能评价 (阅读 5,601)
  6. 百度搜索URL参数解析 (阅读 5,581)
  7. Xapian搜索体系结构 (阅读 5,160)
  8. 附近地点搜索初探 (阅读 5,140)
  9. 互联网网站的反爬虫策略浅析 (阅读 5,041)
  10. 整合搜索,阿拉丁,云计算,以及框计算 (阅读 4,741)