看完这篇还不会 Elasticsearch,我跪搓衣板! (mp.weixin.qq.com)

【简介】

搜索引擎是对数据的检索,所以我们先从生活中的数据说起。我们生活中的数据总体分为两种:

结构化数据

非结构化数据



结构化数据:也称作行数据,是由二维表结构来逻辑表达和实现的数据,严格地遵循数据格式与长度规范,主要通过关系型数据库进行存储和管理。指具有固定格式或有限长度的数据,如数据库,元数据等。

点击查看全文 >>

@zhisheng_tian 2019-07-25 09:49分享 / 0个评论
赞过的人: 技术头条 zhisheng_tian
要不要再学学下面的文章?
设计模式总是学不会?是时候换个姿势了 (mp.weixin.qq.com)
对话形式的通熟易懂设计模式指南,让你重拾学习设计模式的兴趣。
by @码个蛋 2019-06-27 10:06 分享 查看详情
重磅 | Elasticsearch7.X学习路线图 (mp.weixin.qq.com)
在关注Elastic 中文社区、QQ群、星球群的过程中,多多少少都会有一些基础问题冒出。而这些问题不复杂,多半都在官方文档中都有提及,稍稍复杂的在官方英文社区、中文社区都有过类似问题的讨论。

基本上通过Google、bing都能直接或间接搜索到答案。

那么问题是:为什么好多初学的朋友,找不到答案呢。

观察和思考了很久。我认为最主要的问题在于,没有建立基础知识全貌的认知。
by @zhisheng_tian 2019-06-18 20:39 分享 查看详情
Elasticsearch 7.0 已经发布,盘他! (mp.weixin.qq.com)
Elastic{ON}北京分享了Elasticsearch7.0在Speed,Scale,Relevance等方面的很多新特性。

比快更快,有传说中的那么牛逼吗?盘他!

通过本文,你能了解到:

Elasticsearch&Kibana 7.部署体验

Elasticsearch7 革命性更新

Elasticsearch 7升级注意事项

Elasticsearch 版本更新太快了,学不动了,肿么办?
by @zhisheng_tian 2019-04-21 09:39 分享 查看详情
从诗词大会到图解 ElasticSearch 原理解析 (mp.weixin.qq.com)
小史学完了elasticsearch,在笔记本上写下了如下记录:

1、反向索引又叫倒排索引,是根据文章内容中的关键字建立索引

2、搜索引擎原理就是建立反向索引

3、elasticsearch在lucene的基础上进行封装,实现了分布式搜索引擎

4、elasticsearch中的索引、类型和文档的概念比较重要,类似于mysql中的数据库、表和行

5、elasticsearch也是master-slave架构,也实现了数据的分片和备份

6、elasticsearch一个典型应用就是elk日志分析系统
by @zhisheng_tian 2019-04-11 14:16 分享 查看详情
实战 | canal 实现Mysql到Elasticsearch实时增量同步 (mp.weixin.qq.com)
题记
关系型数据库Mysql/Oracle增量同步Elasticsearch是持续关注的问题,也是社区、QQ群等讨论最多的问题之一。 问题包含但不限于: 1、Mysql如何同步到Elasticsearch? 2、Logstash、kafka_connector、canal选型有什么不同,如何取舍? 3、能实现同步增删改查吗? ..... 本文给出答案。
by @zhisheng_tian 2019-04-01 21:57 分享 查看详情
干货 | Elasticsearch 6个不明显但很重要的注意事项 (mp.weixin.qq.com)
Elasticsearch是被Netflix,微软,eBay,Facebook等Top N 顶级公司使用的搜索引擎。它很容易使用,但从长远来看相对难掌握。在本文中,我们分享了在系统中使用Elasticsearch六个不太明显但非常值得了解的注意事项。
by @zhisheng_tian 2019-03-19 13:30 分享 查看详情
干货 | Elasticsearch方案选型必须了解的10件事! (mp.weixin.qq.com)
Elasticsearch 目前被广泛使用,也越来越受到欢迎。一些传统的行业甚至婚庆公司都已经在使用Elasticsearch。
人们喜欢Elasticsearch,不单单因为它的典型特征:
by @zhisheng_tian 2019-03-11 22:06 分享 查看详情
《从0到1学习Flink》—— Flink 写入数据到 ElasticSearch (www.54tianzhisheng.cn)
前言
前面 FLink 的文章中我们已经介绍了说 Flink 已经有很多自带的 Connector。

1、《从0到1学习Flink》—— Data Source 介绍

2、《从0到1学习Flink》—— Data Sink 介绍

其中包括了 Source 和 Sink 的,后面我也讲了下如何自定义自己的 Source 和 Sink。

那么今天要做的事情是啥呢?就是介绍一下 Flink 自带的 ElasticSearch Connector,我们今天就用他来做 Sink,将 Kafka 中的数据经过 Flink 处理后然后存储到 ElasticSearch。

准备
安装 ElasticSearch,这里就忽略,自己找我以前的文章,建议安装 ElasticSearch 6.0 版本以上的,毕竟要跟上时代的节奏。

下面就讲解一下生产环境中如何使用 Elasticsearch Sink 以及一些注意点,及其内部实现机制。
by @zhisheng_tian 2019-01-11 00:10 分享 查看详情
Elasticsearch 最佳性能优化 (mp.weixin.qq.com)
在 CRUD 章节,我们已经知道 ES 的数据写入是如何操作的了。喜欢自己动手的读者可能已经迫不及待的自己写了程序开始往 ES 里写数据做测试。这时候大家会发现:程序的运行速度非常一般,即使 ES 服务运行在本机,一秒钟大概也就能写入几百条数据。

这种速度显然不是 ES 的极限。事实上,每条数据经过一次完整的 HTTP POST 请求和 ES indexing 是一种极大的性能浪费,为此,ES 设计了批量提交方式。在数据读取方面,叫 mget 接口,在数据变更方面,叫 bulk 接口。mget 一般常用于搜索时 ES 节点之间批量获取中间结果集,对于 Elastic Stack 用户,更常见到的是 bulk 接口。
by @zhisheng_tian 2019-01-06 22:11 分享 查看详情
ElasticSearch 官方调优指南翻译 (mp.weixin.qq.com)
ES 发布时带有的默认值,可为 ES 的开箱即用带来很好的体验。全文搜索、高亮、聚合、索引文档 等功能无需用户修改即可使用,当你更清楚的知道你想如何使用 ES 后,你可以作很多的优化以提高你的用例的性能,下面的内容告诉你 你应该/不应该 修改哪些配置。
by @zhisheng_tian 2019-01-06 22:10 分享 查看详情