IT技术博客大学习 共学习 共进步
全部 移动开发 后端 数据库 AI 算法 安全 DevOps 前端 设计 开发者

用Sphinx快速搭建站内搜索功能

五四陈科学院-坚信科学,分享技术 2010-06-23 12:59:33 累计浏览 5,706 次
本机暂存

Sphinx[英] [sfɪŋks] 原图已失效 [美] [sfɪŋks] 原图已失效

出自俄罗斯的开源全文搜索引擎软件Sphinx,单一索引最大可包含1亿条记录,在1千万条记录情况下的查询速度为0.x秒(毫秒级)。Sphinx创建索引的速度为:创建100万条记录的索引只需3~4分钟,创建1000万条记录的索引可以在50分钟内完成,而只包含最新10万条记录的增量索引,重建一次只需几十秒。

Sphinx 是一个基于 GPL 2 协议颁发的免费开源的全文搜索引擎.它是专门为更好的整合脚本语言和SQL数据库而设计的.当前内置的数据源支持直接从连接到的 MySQL 或 PostgreSQL 获取数据, 或者你可以使用 XML 通道结构(XML pipe mechanism , 一种基于 Sphinx 可识别的特殊xml格式的索引通道)

下面发出操作记录:

10106 wget http://www.coreseek.cn/uploads/csft/3.2/csft-3.2.12.tar.gz
10107 wget http://www.coreseek.cn/uploads/csft/3.2/mmseg-3.2.12.tar.gz

10109 tar -zxvf mmseg-3.2.12.tar.gz
10110 tar -zxvf csft-3.2.12.tar.gz

10111 cd mmseg-3.2.12
10112 yum -y install glibc-common libtool autoconf automake mysql-devel expat-devel
10113 aclocal
10114 libtoolize -force
10115 automake -add-missing
10116 autoconf
10117 autoheader
10118 ./configure -prefix=/usr/local/mmseg3
10119 make
10120 make install
10121 cp -f src/*/*.h /usr/local/mmseg3/include/mmseg/

10122 cd ..
10123 ls
10124 cd csft-3.2.12
10125 aclocal
10126 libtoolize -force
10127 automake -add-missing
10128 autoconf
10129 autoheader
10130 perl -pi -e ’s/lpthread/lpthread -liconv/g’ src/Makefile*
10131 ./configure -prefix=/usr/local/coreseek -enable-id64 -without-python -with-mysql -with-mmseg -with-mmseg-includes=/usr/local/mmseg3/include/mmseg/ -with-mmseg-libs=/usr/local/mmseg3/lib/
10132 make

make后出现iconv错误,所以修改configure文件,查找到#define USE_LIBICONV 把1改为0
重新执行configure和make

10157 make install
10158 cd /usr/local/coreseek/etc/
10164 cp sphinx.conf.dist csft.conf
10165 vim csft.conf
10169 mysql -uroot test

10173 touch /data/exceptions.txt
10174 bin/indexer -all
10177 bin/search test

同分类推荐文章

  1. 等了十年的 Go 链式管道,终于来了:seq 让你像写 Scala 一样写 Go (2026-06-25 18:38:18)
  2. Go 实验特性详解 (2026-06-21 10:05:27)
  3. amd64 微架构级别对 Go 程序性能提升多少? (2026-06-21 09:38:49)

查看更多 后端 文章 →

建议继续学习

  1. 由浅入深探究mysql索引结构原理、性能分析与优化 (累计阅读 16,523)
  2. 浅谈MySQL索引背后的数据结构及算法 (累计阅读 11,909)
  3. 为什么数组标号是从0开始的? (累计阅读 6,313)
  4. MySQL中like语句及相关优化器tips (累计阅读 6,282)
  5. Innodb 表和索引结构 (累计阅读 6,226)
  6. mysql sql 百万级数据库优化方案 (累计阅读 6,127)
  7. 一次神奇的MySQL优化 (累计阅读 6,082)
  8. MySQL索引背后的数据结构及算法原理 (累计阅读 5,759)
  9. mysql索引浅析 (累计阅读 5,336)
  10. 如何建立索引 (累计阅读 4,693)