• 腾讯mini项目-【指标监控服务重构】2023-08-20


    今日已办

    PPT制作

    答辩流程

    1. 概述:对项目背景、架构进行介绍(体现我们分组的区别和需求)
    2. 人员:小组成员进行简短的自我介绍和在项目中的定位,分工
    3. 进展:对项目进展介绍,其中a、b两组的区别和工作中遇到的重难点由相应组员进行展开分析
    4. 展示:分组用视频或者图片进行短期成果展示
    5. 展望:项目后续的规划和期望的最终成果

    分工及负责任务

    1. 作为b组小组的组长
      1. 负责整体项目进度的把控
      2. 项目需求的落地和小组成员的分工安排
      3. 定期与导师开展线上会议汇报项目进度和问题,同样也与另一个小组的组长协作沟通交流问题
    2. 同样在组内负责部分开发的任务
      1. 【SLI】包括 SLI 的设计和修改
      2. 【接入otel-sdk】部署 SigNoz-Collector 集成到项目的 compose 中
      3. 【接入otel-sdk】在 profile 模块中接入 otel-sdk 完成 trace 和 metric 的上报
      4. 使用 watermill-pubsub 框架替换为原有框架 baserunner

    重难点

    • SLI

      • SRE(Site Reliability Engineering),边缘可靠性工程,监控性能、高可用性、可扩展性和安全性

      • SLI标准-百分比(cpu利用率)、SLO目标(延时200ms)、SLA协议

    • otel-trace

      • 【已完成】分布式跨进程跨服务的调用的 span 的上下文传播
      • span references
    • otel-metric

      • cpu、memory的方案
        • 程序主动上报 - 程序性能瓶颈无法去主动上报就无法收集到目标指标
        • docker stats receiver 来收集 docker container 的指标
        • hostmetric receiver 可指定进程
        • 云原生,后续整个服务以 k8s 的形式部署故放弃 docker stats 的方案,SigNoz有提供k8s下收集pod指标的官方方式【仍需后续调研】
    • watermill-pubsub

      1. 【已完成】publisher没有提供回调函数-修改源码嵌入 otel-trace&log 的逻辑
      2. 【尚未完成】watermill-kafka 底层依赖 sarama,需要自定义实现pub/sub替换为底层依赖 kafka-go

    效果展示

    Trace

    image-20230820193902266

    image-20230820194048316

    image-20230820193250076

    image-20230820194158875

    Metric

    image-20230820193747776

    image-20230820193649219

    Log

    外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

    image-20230820193429533

    明日待办

    1. PPT 汇报
    2. 与导师开会
  • 相关阅读:
    目标检测网络系列——Faster-RCNN(实验部分)
    学习Android的第十三天
    Java 8中的map和flatMap方法的区别
    【码蹄集新手村600题】判断一个数字是否为完全平方数
    SpringBoot学习目录
    计算图片中两个任意形状多边形相交部分的大小
    java内嵌浏览器CEF-JAVA、jcef、java chrome
    教培行业迎来重大变局,三大方向或成新机遇
    JVM学习07——GC垃圾回收
    【redis实现自增流水并设置过期时间】
  • 原文地址:https://blog.csdn.net/xzx18822942899/article/details/132913929