• SpringCloud 微服务全栈体系(十三)


    第十一章 分布式搜索引擎 elasticsearch

    二、索引库操作

    • 索引库就类似数据库表,mapping 映射就类似表的结构。

    • 我们要向 es 中存储数据,必须先创建“库”和“表”。

    1. mapping 映射属性

    • mapping 是对索引库中文档的约束,常见的 mapping 属性包括:

      • type:字段数据类型,常见的简单类型有:
        • 字符串:text(可分词的文本)、keyword(精确值,例如:品牌、国家、ip 地址)
        • 数值:long、integer、short、byte、double、float
        • 布尔:boolean
        • 日期:date
        • 对象:object
      • index:是否创建索引,默认为 true
      • analyzer:使用哪种分词器
      • properties:该字段的子字段
    • 例如下面的 json 文档:

    {
        "age": 21,
        "weight": 52.1,
        "isMarried": false,
        "info": "小帽课堂学习Java",
        "email": "alex@gmail.com",
        "score": [99.1, 99.5, 98.9],
        "name": {
            "firstName": "云",
            "lastName": "赵"
        }
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 对应的每个字段映射(mapping):

      • age:类型为 integer;参与搜索,因此需要 index 为 true;无需分词器
      • weight:类型为 float;参与搜索,因此需要 index 为 true;无需分词器
      • isMarried:类型为 boolean;参与搜索,因此需要 index 为 true;无需分词器
      • info:类型为字符串,需要分词,因此是 text;参与搜索,因此需要 index 为 true;分词器可以用 ik_smart
      • email:类型为字符串,但是不需要分词,因此是 keyword;不参与搜索,因此需要 index 为 false;无需分词器
      • score:虽然是数组,但是我们只看元素的类型,类型为 float;参与搜索,因此需要 index 为 true;无需分词器
      • name:类型为 object,需要定义多个子属性
        • name.firstName;类型为字符串,但是不需要分词,因此是 keyword;参与搜索,因此需要 index 为 true;无需分词器
        • name.lastName;类型为字符串,但是不需要分词,因此是 keyword;参与搜索,因此需要 index 为 true;无需分词器

    2. 索引库的 CRUD

    • 这里统一使用 Kibana 编写 DSL 的方式来演示。
    2.1 创建索引库和映射
    2.1.1 基本语法
    • 请求方式:PUT
    • 请求路径:/索引库名,可以自定义
    • 请求参数:mapping 映射
    2.1.2 格式
    PUT /索引库名称
    {
      "mappings": {
        "properties": {
          "字段名":{
            "type": "text",
            "analyzer": "ik_smart"
          },
          "字段名2":{
            "type": "keyword",
            "index": "false"
          },
          "字段名3":{
            "properties": {
              "子字段": {
                "type": "keyword"
              }
            }
          },
          // ...略
        }
      }
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    2.1.3 示例
    PUT /alex
    {
      "mappings": {
        "properties": {
          "info":{
            "type": "text",
            "analyzer": "ik_smart"
          },
          "email":{
            "type": "keyword",
            "index": "false"
          },
          "name":{
            "properties": {
              "firstName": {
                "type": "keyword"
              }
            }
          },
          // ... 略
        }
      }
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    2.2 查询索引库
    2.2.1 基本语法
    2.2.2 格式
    GET /索引库名
    
    • 1
    2.2.3 示例

    在这里插入图片描述

    2.3 修改索引库
    • 倒排索引结构虽然不复杂,但是一旦数据结构改变(比如改变了分词器),就需要重新创建倒排索引,这简直是灾难。因此索引库一旦创建,无法修改 mapping

    • 虽然无法修改 mapping 中已有的字段,但是却允许添加新的字段到 mapping 中,因为不会对倒排索引产生影响。

    2.3.1 语法说明
    PUT /索引库名/_mapping
    {
      "properties": {
        "新字段名":{
          "type": "integer"
        }
      }
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    2.3.2 示例

    在这里插入图片描述

    2.4 删除索引库
    2.4.1 语法
    • 请求方式:DELETE

    • 请求路径:/索引库名

    • 请求参数:无

    2.4.2 格式
    DELETE /索引库名
    
    • 1
    • 在 kibana 中测试:

    在这里插入图片描述

    2.5 总结
    • 索引库操作有哪些?

      • 创建索引库:PUT /索引库名
      • 查询索引库:GET /索引库名
      • 删除索引库:DELETE /索引库名
      • 添加字段:PUT /索引库名/_mapping

    三、文档操作

    1. 新增文档

    1.1 语法
    POST /索引库名/_doc/文档id
    {
        "字段1": "值1",
        "字段2": "值2",
        "字段3": {
            "子属性1": "值3",
            "子属性2": "值4"
        },
        // ...
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    1.2 示例
    POST /alex/_doc/1
    {
        "info": "小帽课堂学习Java",
        "email": "alex@gmail.com",
        "name": {
            "firstName": "云",
            "lastName": "赵"
        }
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    1.3 响应

    在这里插入图片描述

    2. 查询文档

    • 根据 rest 风格,新增是 post,查询应该是 get,不过查询一般都需要条件,这里我们把文档 id 带上。
    2.1 语法
    GET /{索引库名称}/_doc/{id}
    
    • 1
    2.2 通过 kibana 查看数据
    GET /alex/_doc/1
    
    • 1
    2.3 查看结果

    在这里插入图片描述

    3. 删除文档

    • 删除使用 DELETE 请求,同样,需要根据 id 进行删除:
    3.1 语法
    DELETE /{索引库名}/_doc/id值
    
    • 1
    3.2 示例
    # 根据id删除数据
    DELETE /alex/_doc/1
    
    • 1
    • 2

    4. 修改文档

    • 修改有两种方式:

      • 全量修改:直接覆盖原来的文档
      • 增量修改:修改文档中的部分字段
    4.1 全量修改
    • 全量修改是覆盖原来的文档,其本质是:

      • 根据指定的 id 删除文档
      • 新增一个相同 id 的文档
    • 注意:如果根据 id 删除时,id 不存在,第二步的新增也会执行,也就从修改变成了新增操作了。

    4.1.1 语法
    PUT /{索引库名}/_doc/文档id
    {
        "字段1": "值1",
        "字段2": "值2",
        // ... 略
    }
    
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    4.1.2 示例
    PUT /alex/_doc/1
    {
        "info": "小帽课堂学习高级Java",
        "email": "alex@gmail.com",
        "name": {
            "firstName": "云",
            "lastName": "赵"
        }
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    4.2 增量修改
    • 增量修改是只修改指定 id 匹配的文档中的部分字段。
    4.2.1 语法
    POST /{索引库名}/_update/文档id
    {
        "doc": {
             "字段名": "新的值",
        }
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    4.2.2 示例
    POST /alex/_update/1
    {
      "doc": {
        "email": "ZhaoYun@gmail.com"
      }
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6

    5. 总结

    • 文档操作有哪些?

      • 创建文档:POST /{索引库名}/_doc/文档 id { json 文档 }
      • 查询文档:GET /{索引库名}/_doc/文档 id
      • 删除文档:DELETE /{索引库名}/_doc/文档 id
      • 修改文档:
        • 全量修改:PUT /{索引库名}/_doc/文档 id { json 文档 }
        • 增量修改:POST /{索引库名}/_update/文档 id { “doc”: {字段}}
  • 相关阅读:
    注意力屏蔽(Attention Masking)在Transformer中的作用 【gpt学习记录】
    天堂2游戏出错如何解决
    【GNN报告】蒙特利尔大学朱兆成:基于图神经网络的知识图谱推理
    蓝桥杯 字符串和日期
    tornado无验证demo
    02 一些Keil ARM汇编伪指令
    mmc子系统分析(二)
    高压功率放大器在超声驻波声场的听声器中的应用
    立创 EDA #学习笔记10# | 常用连接器元器件识别 和 无源蜂鸣器驱动电路
    web前端-css中最直观的反馈-伪类及伪元素选择器的使用
  • 原文地址:https://blog.csdn.net/sgsgkxkx/article/details/134258558