您现在的位置:首页 --> 查看专题: elasticsearch
一直以来,为了优化本博客站内搜索效果和速度,我使用 bing 的 site: 站内搜索做为数据源,在服务端获取、解析、处理并缓存搜索结果,直接输出 HTML。这个方案唯一的问题是时效性难以保证,尽管我可以在发布和修改文章时主动告诉 bing,但它什么时候更新索引则完全不受我控制。
本着不折腾就浑身不自在的原则,我最终还是使用 Elasticsearch 搭建了自己的搜索服务。Elasticsearch 是一个基于 Lucene 构建的开源、分布式、RESTful 搜索引擎,很多大公司都在用,程序员的好伙伴 Github 的搜索也用的是它。本文记录我使用 Elasticsearch 搭建站内搜索的过程,目前支持中文分词、同义词、标题匹配优先、近期文章优先等常见策略。
我们非常高兴用 Elasticsearch 来保存我们的事件,也得到了试用新 API 和新控制面板中新日志页面的客户们非常积极的反馈。任意字段的可搜索对日志挖掘绝对是一种显著的改善,而 Elasticsearch 正提供了这种高效无痛的改进。当然,Logstash,Elasticsearch 和 Kibana 这整条工具链也非常适合内部应用日志处理。
[ 共2篇文章 ][ 第1页/共1页 ][ 1 ]
近3天十大热文
- [347] 招聘技巧一二
- [14] linux内核研究笔记(一)内存管理 – p
- [13] 个人开公司的流程,以后用得着
- [10] 关于大学学习,说说我的一些体会
- [10] 我的程序员之路
- [10] DBA最缺的不是技术
- [10] ps - 按进程消耗内存多少排序
- [10] DBA有什么个人前途?
- [9] 我对技术方向的一些反思
- [9] 30分钟3300%性能提升――python+
赞助商广告