数据结构论坛

注册

 

发新话题 回复该主题

ElasticSearch初体验 [复制链接]

1#

需要明白的问题

什么是倒排索引?它的组成是什么?常见的相关性算分方法有哪些?为什么查询语句没有返回预期的文档?常用的数据类型有哪些?Text和Keyword的区别是什么?集群是如何搭建起来的?是如何实现故障转移的?Shard具体是由什么组成的?ElasticStack

构建在开源基础之上,ElasticStack让您能够安全可靠地获取任何来源、任何格式的数据,并且能够实时地对数据进行搜索、分析和可视化

Elasticsearch是基于JSON的分布式搜索和分析引擎,专为实现水平扩展、高可用和管理便捷性而设计。

Kibana能够以图表的形式呈现数据,并且具有可扩展的用户界面,供您全方位配置和管理ElasticStack。

Logstash是动态数据收集管道,拥有可扩展的插件生态系统,能够与Elasticsearch产生强大的协同作用。

Beats是轻量型采集器的平台,从边缘机器向Logstash和Elasticsearch发送数据。

基础概念

文档Document:用户存储在ES中的数据文档索引Index:由具有一些相同字段的文档的集合类型Type:允许将不同类型的文档存储在同一索引中,6.0开始官方不允许在一个index下建立多个type,统一type名称:doc节点Node:一个Elasticsearch的运行实例,是集群的构成单元,存储部分或全部数据,并参与集群的索引和搜索功能集群Cluster:由一个或多个节点组成的集合,共同保存所有的数据,对外提供服务(包括跨所有节点的联合索引和搜索功能等)分片Shards:分片是为了解决存储大规模数据的问题,将数据切分分别存储到不同的分片中副本Replicas:副本可以在分片或节点发生故障时提高可用性,而且由于可以在所有副本上进行并行搜索,所以也可以提高集群的吞吐量近实时NearRealtime(NRT):从索引文档到可搜索文档的时间有一点延迟(通常为一秒)note:在创建索引的时候如果没有配置索引Mapping,一个索引默认有5个shard和1个副本,一个索引总共有10个shard(算上副本shard)Elasticsearch的shard实际上是一个Lucene索引,截止Lucene-,一个Lucene索引限制的最大文档数为2,,,(=Integer.MAX_VALUE-)

安装ElasticsearchKibana

ES和Kibana的安装很简单,前提需要先安装好Java8,然后执行以下命令即可

elasticsearch单节点最简安装

#在Ubuntu16.04上安装,方式有很多种,选择二进制压缩包的方式安装#1.在普通用户家目录下,下载压缩包curl-L-O

分享 转发
TOP
发新话题 回复该主题