ElasticSearch探究（二）—

整体架构

分片

一个索引默认被分为5个主分片以及分别对应的1个副本分片。主分片合起来就是整个索引的数据。

分析器Analyzer

Standard Analyzer - 默认分词器，按词切分，小写处理。不兼容对中文的分词。
Simple Analyzer - 按照非字母切分（符号被过滤），小写处理
Stop Analyzer - 小写处理，停用词过滤（the ，a，is）
Whitespace Analyzer - 按照空格切分，不转小写
Keyword Analyzer - 不分词，直接将输入当做输出
Pattern Analyzer - 正则表达式，默认 \W+
Language - 提供了 30 多种常见语言的分词器
Customer Analyzer - 自定义分词器；ik中文分词器

集群

数据节点：负责存储数据，并对数据进行CRUD操作协调节点：一个角色概念，不显示通过配置项指定，指的是：一个节点接收用户查询请求并将查询字句分发给其他节点，最后接收合并其他节点的响应结果返回给用户（map-reduce）。主节点：主要创建、修改索引等操作集群的工作客户端负载均衡节点：不充当数据节点、主节点，主要用于处理路由请求，预处理节点：将文档插入索引前，对文档数据进行预处理。任何节点都可以设置，也可以专门设置。