用Sphinx快速搭建站内搜索功能
Sphinx[英] [sfɪŋks]
[美] [sfɪŋks] 
出自俄罗斯的开源全文搜索引擎软件Sphinx,单一索引最大可包含1亿条记录,在1千万条记录情况下的查询速度为0.x秒(毫秒级)。Sphinx创建索引的速度为:创建100万条记录的索引只需3~4分钟,创建1000万条记录的索引可以在50分钟内完成,而只包含最新10万条记录的增量索引,重建一次只需几十秒。
Sphinx 是一个基于 GPL 2 协议颁发的免费开源的全文搜索引擎.它是专门为更好的整合脚本语言和SQL数据库而设计的.当前内置的数据源支持直接从连接到的 MySQL 或 PostgreSQL 获取数据, 或者你可以使用 XML 通道结构(XML pipe mechanism , 一种基于 Sphinx 可识别的特殊xml格式的索引通道)
下面发出操作记录:
10106 wget http://www.coreseek.cn/uploads/csft/3.2/csft-3.2.12.tar.gz
10107 wget http://www.coreseek.cn/uploads/csft/3.2/mmseg-3.2.12.tar.gz10109 tar -zxvf mmseg-3.2.12.tar.gz
10110 tar -zxvf csft-3.2.12.tar.gz10111 cd mmseg-3.2.12
10112 yum -y install glibc-common libtool autoconf automake mysql-devel expat-devel
10113 aclocal
10114 libtoolize -force
10115 automake -add-missing
10116 autoconf
10117 autoheader
10118 ./configure -prefix=/usr/local/mmseg3
10119 make
10120 make install
10121 cp -f src/*/*.h /usr/local/mmseg3/include/mmseg/10122 cd ..
10123 ls
10124 cd csft-3.2.12
10125 aclocal
10126 libtoolize -force
10127 automake -add-missing
10128 autoconf
10129 autoheader
10130 perl -pi -e ’s/lpthread/lpthread -liconv/g’ src/Makefile*
10131 ./configure -prefix=/usr/local/coreseek -enable-id64 -without-python -with-mysql -with-mmseg -with-mmseg-includes=/usr/local/mmseg3/include/mmseg/ -with-mmseg-libs=/usr/local/mmseg3/lib/
10132 make
make后出现iconv错误,所以修改configure文件,查找到#define USE_LIBICONV 把1改为0
重新执行configure和make
10157 make install
10158 cd /usr/local/coreseek/etc/
10164 cp sphinx.conf.dist csft.conf
10165 vim csft.conf
10169 mysql -uroot test10173 touch /data/exceptions.txt
10174 bin/indexer -all
10177 bin/search test
建议继续学习:
- 怎样用好Google进行搜索 (阅读:15318)
- 淘宝搜索:定向抓取网页技术漫谈 (阅读:8941)
- 简析搜索引擎中网络爬虫的搜索策略 (阅读:6811)
- 几种常见的基于Lucene的开源搜索解决方案对比 (阅读:5531)
- 基于用户行为分析的搜索引擎自动性能评价 (阅读:5206)
- 百度搜索URL参数解析 (阅读:5165)
- 附近地点搜索初探 (阅读:4786)
- 互联网网站的反爬虫策略浅析 (阅读:4727)
- Xapian搜索体系结构 (阅读:4786)
- 整合搜索,阿拉丁,云计算,以及框计算 (阅读:4326)
扫一扫订阅我的微信号:IT技术博客大学习
- 作者:54chen 来源: 五四陈科学院-坚信科学,分享技术
- 标签: Sphinx 搜索
- 发布时间:2010-06-23 12:59:33
-
[884] WordPress插件开发 -- 在插件使用 -
[136] 解决 nginx 反向代理网页首尾出现神秘字 -
[57] 整理了一份招PHP高级工程师的面试题 -
[54] Innodb分表太多或者表分区太多,会导致内 -
[54] 如何保证一个程序在单台服务器上只有唯一实例( -
[54] 分享一个JQUERY颜色选择插件 -
[53] jQuery性能优化指南 -
[52] 用 Jquery 模拟 select -
[52] CloudSMS:免费匿名的云短信 -
[51] 全站换域名时利用nginx和javascri
