码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • dantax参数调优


    dantax参数调优

    1.speed调优

    在这里插入图片描述
    可能会导致数据倾斜
    处理的速度不同,可能会导致job非常慢

    举例子,比如总限速是每秒100条record,其中第一个channel速度是每秒99条record,第二个channel是每秒1条record,加起来是每条100条record,假设每个channel需要处理的数据都是1万条数据,那么第一个channel很早就处理完了,第二个channel会消耗比较长的时候,类似hadoop中的数据倾斜,为了避免这个问题,我们需要配置单个channel的限速
    在这里插入图片描述
    在这里插入图片描述

    内存优化

    当提升Datax Job内Channel并发数时,内存的占用会显著增加,因为datax作为数据交换通道,在内存中会缓存较多的数据。例如Channel中会有一个Buffer,作为临时的数据交换的缓冲区,而在部分Reader和Writer中,也会存在一些Buffer,为了防止OOM等错误,需要调大JVM的堆内存

    1. 建议将内存设置为4G或者8G
    2. 建议在启动的时候,加上对应的参数:python datax/bin/datax.py --jvm=“-Xms8G -Xmx8G” /path/to/your/job.json
  • 相关阅读:
    【前端面试知识题】- 4.2 JavaScript
    在树莓派上安装编译的vim——开启python3支持
    linux(nginx安装配置,tomcat服务命令操作)
    SOME/IP 支持两种序列化方式:TLV 和 TV
    【机器学习】红酒数据集和加利福尼亚的房价数据的随机森林算法详解
    zemax优化功能
    美团秋招高频面试问题汇总!(内附答案!)
    jquery的隐藏和显示
    【结构体类型——详细讲解】
    Matlab----程序流程控制
  • 原文地址:https://blog.csdn.net/m0_37759590/article/details/132710141
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号