码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 为什么做数据质量


    为什么做数据质量

    结合以往的工作经历,一般是运营操作运营系统,突然发现某个数据异常或者延迟,这时候就需要数据开发部门来核对, 数据部门人员在核对的时候无法快速定位到问题,排查了很长时间,,, 届时面临两个问题:
    1、被业务方投诉!
    2、故障出现之后导致上下游的任务都受影响,修复成本极高!
    数据质量问题的根源
    1、业务系统变更:包括表结构变更,源系统环境的变更,数据格式异常等。
    2、数据开发的bug,数据任务变更导致数据异常。
    3、基础设施不稳定,高可能节点的失效导致数据的读写功能失效导致数据异常。
    4、数据迁移中的异常。
    5、等等等,,,

    因此,我们要对数据数据质量要早发现,早恢复!

    数据质量具体措施:

    1、添加稽核质检任务,来发现问题,确保数据的完整性,一致性,准确性等等。
    2、建立全链路的监控:可以基于血缘关系建立全链路的数据质量监控。
    3、通过智能预警,确保任务的按时产出,延迟或者异常时候报警。
    4、针对数据的重要性,可以划分数据等级,可加快恢复速度。

    上文是我对数据质量较根本的问题的一些学习和思考,基于此和我们实际情况提出几点想法仅供设计者参考:

    1、接通企业微信告警/钉钉告警等告警功能,发送消息到对应的群或人通知报告产出 和异常告警。

    2、为简化操作流程和概念,我们可以保留规则,任务的概念,将条目和规则的配置合并一起,减少操作流程。

    以下是阿里云的一个页面:

    在这里插入图片描述
    在这里插入图片描述

  • 相关阅读:
    Redis 常用命令的学习
    程序化广告系列之一---名词解释
    帧同步和状态同步
    PyTorch中的动态学习率
    使用vue3 和Springboot 通过 websocket实现前后端通信
    Azure DevOps (十二) 通过Azure Devops部署一个SpringBoot应用
    【js作用域】JavaScript中作用域的是什么?:从编译时其承担什么角色和查询作用域中的变量的角度解析作用域
    从字节码的角度理解i++、++i和i++ + ++i
    andrid配置gradle
    Linux基础学习——用户和组
  • 原文地址:https://blog.csdn.net/weixin_43978695/article/details/132717723
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号