• SOLR分组聚合的相关技巧


    0. 前言

    1. 使用SOLR的时候我是抗拒的,又应为项目只能用SOLR实现需要,没有办法只能硬着头皮来做,如果实现没办法可以看看下文。
    2. 在做的过程中,SOLR这个技术栈可能用的少,国内的文字写的都是基本应用,facet query都很少使用,我的需求也无法满足,只能自己找两本去读,来研究SOLR,也把成果记录下来,分享给大家。

    1. 分组

    1. 我们经常在MySQL中使用group实现分组,虽然SOLR中也提供了Group参数,实现分组,但是只能实现一级分组。
    2. 当然SOLR也可以实现二级分组或多级,有两种方案
      1. 通过facet.pivot实现,优点是结构清晰,SolrQuery实现容易,缺点是获取的分组结果只有总和数量(获取不到具体的数据内容),如果想要加入统计函数,就必须通过Solr的stats工具实现。

        1. 实现分组
        2. facet.pivot=key1,key2

        3. 实现分组加查询
        4. ?q=:&facet query={!tag=zt1 key=”level1”}ZT:1&facet=true&facet.pivot={!query=zt1}key1,key2&rows=0

        5. 实现分组加统计
        6. ?q=:&stats=true&stats.field={!tag=piv1}TS&facet=true&facet.pivot={!stats=piv1}key1,key2&rows=0

      2. 通过json.facet实现,优点是基于分组,对内容进行处理,缺点就是查询结构必须是JSON格式,不容易调试,功能很强大。

        1. 参考
        2. json.facet={key1:{type:terms,limit:-1,field:key1,facet:{key2:{type:terms,limit:-1,field:key2}}}}

        3. 在JSON基础上添加聚合函数
        4. json.facet={key1:{type:terms,limit:-1,field:key1,facet:{key2:{type:terms,limit:-1,field:key2,facet:{max:‘max(ms(NOW,RQ))’,avg:‘avg(ms(NOW,RQ))’}}}}}

    2. 注意点

    1. 先看SOLR版本,低版本不支持这两种方案

    2. 通过facet查询的时候,如果数据高于100条,需要设置FacetLimit,不然只会显示100条数据

      query.setFacetLimit(-1);

    3. 使用json.facet的时候,也需要在内部添加limit:-1

    4. 如果SOLR是高版本,报错不支持聚合函数,那就可能是函数接受的这个字段是不支持的类型,改下字段类型就可以了。

    3. 参考书籍

    1. SOLR权威指南下卷
  • 相关阅读:
    vue+element项目创建步骤
    【frp实现内网穿透踩坑到成功篇】
    Apple developer证书、标识符和描述文件
    【跟小嘉学 Rust 编程】二十八、Rust中的日期与时间(DateTime)
    [Matlab]基于LSTM+NSGA2的风光火力发电策略优化
    SQL多表连接
    【ROS】服务通信、话题通信的应用
    C# 面向对象之多态
    项目串讲(后端)要讲哪些东西?
    【网络协议】Http-上
  • 原文地址:https://blog.csdn.net/apache_z/article/details/132755810