码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 【Spark 实战系列】sparkstreaming 任务出现堆积如何优化?(流量突然大增资源不够怎么办?)


    sparkstreaming 任务出现堆积如何优化?(流量突然大增资源不够怎么办?)

    前言

    在日常的生产中,什么情况下会出现数据堆积呢?大概有两种情况:

    1. 由于要修改业务逻辑,streaming 任务暂停,但是这个时候上游 kafka 里面的数据在不断的生产,等你修改完代码,重新启动任务的时候,kafka 里面就会堆积了很多的数据,在一个 interval 时间内处理不完,就造成了堆积。
    2. 平时正常运行的任务,在业务高峰期,有高于正常情况几倍甚至几十倍的数据打到 kafka 里,这个时候因为资源是固定的,就会出现处理不过来的情况,任务就会堆积,你总不能等到高峰期来的时候把任务停掉,增加资源后再启动吧?或者可以提前把资源给多一点,但是这样会造成资源的浪费,因为平时是用不了那么多资源的,只有在业务高峰的时候才会用到。

    数据堆积有什么影响呢?

    在出现堆积的时候,本应该 12 点整调度起来的任务,延迟了 5 分,在 12 点 5 分调度起来,后面的任务都会延迟,堆积的 job 就会越来越多,可能会达到几万个,最后出现的情况就是数据处理延迟变大,甚至会出现 application 挂掉的情况。

    数据堆积的时候有什么表现呢?

    看下面的图,就是发生了任务的堆积(当然,这个是我本地测试的,真实情况会堆积上万的)。

  • 相关阅读:
    Window11中Scala环境搭建(内含Scala安装包百度网盘下载地址)
    TypeScript之常用类型
    linux 服务器ip修改
    Java手写归并排序和案例拓展
    HTML旅游网页设计制作 DW旅游网站官网滚动网页 DIV旅游风景介绍网页设计与实现
    ios-关联对象
    Python之进程,线程锁,Queue相关
    【FPGA帧差】基于VmodCAM摄像头的帧差法目标跟踪FPGA实现
    Dockerfile编写实践篇
    @Autowire、@Recourse用啥?
  • 原文地址:https://blog.csdn.net/xianpanjia4616/article/details/127923915
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号