• 14-GuliMall ElasticSearch安装与入门


    1.简介

    在这里插入图片描述

    全文搜索属于最常见的需求,开源的 Elasticsearch 是目前全文搜索引擎的首选。 它可以快速地储存、搜索和分析海量数据。维基百科、Stack Overflow、Github 都采用它.

    Elastic 的底层是开源库 Lucene。但是,你没法直接用 Lucene,必须自己写代码去调用它的 接口。Elastic 是 Lucene 的封装,提供了 REST API 的操作接口,开箱即用。

    官方文档:https://www.elastic.co/guide/en/elasticsearch/reference/current/index.html
    官方中文:https://www.elastic.co/guide/cn/elasticsearch/guide/current/foreword_id.html
    社区中文:
    https://es.xiaoleilu.com/index.html
    http://doc.codingdict.com/elasticsearch/0/

    1.基本概念

    在这里插入图片描述

    1、Index(索引)
    动词,相当于 MySQL 中的 insert;
    名词,相当于 MySQL 中的 Database

    2、Type(类型)
    在 Index(索引)中,可以定义一个或多个类型。
    类似于 MySQL 中的 Table;每一种类型的数据放在一起;

    3、Document(文档)
    保存在某个索引(Index)下,某种类型(Type)的一个数据(Document),文档是 JSON 格 式的,Document 就像是 MySQL 中的某个 Table 里面的内容;

    4、倒排索引机制

    分词:将整句分拆为单词

    保存的记录:
    1-红海行动
    2-探索红海行动
    3-红海特别行动
    4-红海记录篇
    5-特工红海特别探索
    在这里插入图片描述
    检索:
    1)、红海特工行动?
    2)、红海行动?
    相关性得分:

    匹配记录\得分红海特工行动红海行动
    红海行动2/32/2
    探索红海行动2/32/2
    红海特别行动2/32/2
    红海记录篇1/31/2
    特工红海特别探索2/31/2

    然后按照得分由高到低返回搜索结果

    2.ElasticSearch7-去掉type概念

    • 关系型数据库中两个数据表示是独立的,即使他们里面有相同名称的列也不影响使用,但ES 中不是这样的。elasticsearch是基于Lucene开发的搜索引擎,而ES中不同type下名称相同 的filed最终在Lucene中的处理方式是一样的。

    • 两个不同type下的两个user_name,在ES同一个索引下其实被认为是同一个filed,你必须在两个不同的type中定义相同的filed映射。否则,不同type中的相同字段名称就会在处理中出现冲突的情况,导致Lucene处理效率下降。

    • 去掉type就是为了提高ES处理数据的效率。

    • Elasticsearch 7.x
    URL中的type参数为可选。
    比如,索引一个文档不再要求提供文档类型。

    • Elasticsearch 8.x • 不再支持URL中的type参数。

    • 解决:将索引从多类型迁移到单类型,每种类型文档一个独立索引

    简单说就是我们使用索引index来隔离同名的属性, 类型type就不要再建立了, 因为没什么用, 不同类型type下的相同名称属性是会当作同一字段来进行检索的,起不到隔离的作用

    2.Docker 安装 ES

    1.下载镜像

    下载ES镜像
    docker pull elasticsearch:7.4.2
    
    下载ES可视化界面kibana(不是必需的,可以选择不装)
    docker pull kibana:7.4.2 
    
    • 1
    • 2
    • 3
    • 4
    • 5

    下载完成
    在这里插入图片描述

    2.创建挂载文件夹

    mkdir -p /mydata/elasticsearch/config 
    mkdir -p /mydata/elasticsearch/data
    
    • 1
    • 2

    在这里插入图片描述

    3.创建一个配置文件

    echo "http.host: 0.0.0.0" >> /mydata/elasticsearch/config/elasticsearch.yml
    
    • 1

    cat看一眼文件内容, 内容存在表示文件创建成功
    在这里插入图片描述

    4.保证权限, 使所有用户或组都有读写该文件夹的权限

    chmod -R 777 /mydata/elasticsearch/
    
    • 1

    5.无法挂载文件解决

    当我们设置文件挂载后, 发现容器总是无法正常启动, 这是因为CentOS7中的安全模块selinux把权限禁掉了,无法使用-v命令进行挂载
    解决方法:添加selinux规则,将要挂载的目录添加到白名单

    chcon -Rt svirt_sandbox_file_t /mydata/elasticsearch/config/elasticsearch.yml
    chcon -Rt svirt_sandbox_file_t /mydata/elasticsearch/data
    chcon -Rt svirt_sandbox_file_t /mydata/elasticsearch/plugins
    
    • 1
    • 2
    • 3

    在这里插入图片描述

    6.运行elasticsearch, 并设置挂载目录

    docker run --name elasticsearch -p 9200:9200 -p 9300:9300 \
    -e "discovery.type=single-node" \
    -e ES_JAVA_OPTS="-Xms64m -Xmx512m" \
    --volume /mydata/elasticsearch/config/elasticsearch.yml:/usr/share/elasticsearch/config/elasticsearch.yml \
    --volume /mydata/elasticsearch/data:/usr/share/elasticsearch/data \
    --volume /mydata/elasticsearch/plugins:/usr/share/elasticsearch/plugins \
    --restart=always \
    -d elasticsearch:7.4.2
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8

    在这里插入图片描述
    冒号" : " 前是linux的目录或文件, 其后是docker的目录或文件, 一定要注意空格数, 不然就识别不了命令, 参数命令比如如-e后面只有一个空格, 斜杠" \ "前只有一个空格, 其后面没有空格.

    特别注意: -e ES_JAVA_OPTS=“-Xms64m -Xmx256m” \ 测试环境下,设置 ES 的初始内存和最大内存,否则导 致过大启动不了 ES

    启动成功
    在这里插入图片描述

    7.访问es

    我们访问es, 虚拟机ip+端口号9200

    http://192.168.56.103:9200/
    
    • 1

    在这里插入图片描述
    这样就表示es安装成功了

    8.启动可视化界面Kibana

    docker run --name kibana -e ELASTICSEARCH_HOSTS=http://192.168.56.103:9200 \
    -p 5601:5601 \
    --restart=always \
    -d kibana:7.4.2
    
    • 1
    • 2
    • 3
    • 4

    注意: http://192.168.56.103:9200 一定要改为自己虚拟机的地址

    启动成功
    在这里插入图片描述
    浏览器访问

    http://192.168.56.103:5601/app/kibana
    
    • 1

    在这里插入图片描述
    这就表示安装成功了

    3.初步检索

    1._cat

    GET /_cat/nodes:查看所有节点
    GET /_cat/health:查看 es 健康状况
    GET /_cat/master:查看主节点
    GET /_cat/indices:查看所有索引

    使用postman执行命令
    在这里插入图片描述
    使用我们的可视化界面Kibana执行命令会更方便, 后面我们都用其来执行命令进行测试
    在这里插入图片描述

    2.索引(保存)一个文档

    保存一个数据
    保存在哪个索引的哪个类型下,指定用哪个唯一标识 PUT customer/external/1;

    在 customer 索引下的 external 类型下保存 1 号数据

    PUT customer/external/1
    { 
    	"name": "John Doe" 
    }
    
    • 1
    • 2
    • 3
    • 4

    在这里插入图片描述

    PUTPOST 都可以, 
    POST 新增。如果不指定 id,会自动生成 id。指定 id 就会修改这个数据,并新增版本号 
    PUT 可以新增可以修改。PUT 必须指定 id;
    由于 PUT 需要指定 id,我们一般都用来做修改操作,不指定 id 会报错。
    
    • 1
    • 2
    • 3
    • 4

    POSt新增文档

    POST customer/external
    { 
    	"name": "andy",
    	"age": 15
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5

    返回结果

    {
      "_index" : "customer",
      "_type" : "external",
      "_id" : "gbnKUoIBaq-_pNmSxZ3r",
      "_version" : 1,
      "result" : "created",
      "_shards" : {
        "total" : 2,
        "successful" : 1,
        "failed" : 0
      },
      "_seq_no" : 1,
      "_primary_term" : 1
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14

    3.查询文档

    查询id为1的文档

    GET customer/external/1
    
    • 1

    返回结果

    {
      "_index" : "customer",
      "_type" : "external",
      "_id" : "1",
      "_version" : 1,
      "_seq_no" : 0,
      "_primary_term" : 1,
      "found" : true,
      "_source" : {
        "name" : "John Doe"
      }
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12

    4.更新文档

    POST customer/external/1/_update
    { 
    	"doc":
    	{
    		"name": "John Doe666"
    	} 
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7

    或者

    POST customer/external/1
    { 
    	"name": "John Doe666"
    }
    
    • 1
    • 2
    • 3
    • 4

    或者

    PUT customer/external/1
    {
    	"name": "John Doe666"
    }
    
    • 1
    • 2
    • 3
    • 4
    不同:
    POST 操作会对比源文档数据,如果相同不会有什么操作,文档 version 不增加 
    PUT 操作总会将数据重新保存并增加 version 版本; 
    带_update 对比元数据如果一样就不进行任何操作。 
    
    看场景:
    对于大并发更新,不带 update; 
    对于大并发查询偶尔更新,带 update;对比更新,重新计算分配规则。
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8

    更新同时增加属性

    POST customer/external/1
    { 
    	"name": "John Doe666",
    	"age": 20
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5

    注意若执行下面命令, name字段是会被删除的

    POST customer/external/1
    { 
    	"age": 20
    }
    
    • 1
    • 2
    • 3
    • 4

    5.删除文档&索引

    DELETE customer/external/1 
    DELETE customer
    
    • 1
    • 2

    6.bulk 批量 API

    语法格式: 
    POST index/type/_bulk
    { action: { metadata }}
    { request body }
    { action: { metadata }}
    { request body }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6

    例子:

    POST customer/external/_bulk
    {"index":{"_id":"1"}} 
    {"name": "John" } 
    {"index":{"_id":"2"}} 
    {"name": "Andy" }
    
    • 1
    • 2
    • 3
    • 4
    • 5

    复杂实例:

    POST /_bulk 
    { "delete": { "_index": "customer", "_type": "external", "_id": "1" }} 
    { "create": { "_index": "customer", "_type": "external", "_id": "3" }}
    { "title": "My first blog post" } 
    { "index": { "_index": "customer", "_type": "external" }} 
    { "title": "My second blog post" } 
    { "update": { "_index": "customer", "_type": "external", "_id": "3"} } 
    { "doc" : {"title" : "My updated blog post"} }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8

    现在来看看id为3的那个文档

    GET customer/external/3
    
    • 1

    返回结果

    {
      "_index" : "customer",
      "_type" : "external",
      "_id" : "3",
      "_version" : 2,
      "_seq_no" : 10,
      "_primary_term" : 1,
      "found" : true,
      "_source" : {
        "title" : "My updated blog post"
      }
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
  • 相关阅读:
    VScode 中 CRLF 和 LF 兼容问题,报错原因及解决方案
    Apache Atlas 2.2版本安装
    华为ipsec vpn配置案例
    【Elasticsearch】es脚本编程使用详解
    一键实现冒泡排序算法,代码质量有保障!
    告警:线上慎用 BigDecimal ,坑的差点被开了
    LeNet-5
    在RabbitMQ中 WorkQueue 工作队列 和发布(publish)/订阅(Subscribe) 有什么区别?
    什么是持续部署
    多体验DeFi项目,做个真正的DeFi玩家 2021-04-23
  • 原文地址:https://blog.csdn.net/qq_41865229/article/details/126070725