码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 大数据开发之数据仓库


    概念

    数据仓库:Data warehouse 数仓 DW ,用于存储,分析,报告的数据系统;目的是构建面向分析的集成化数据环境,分析结果为企业提供决策支持

    面向分析

    • 数据仓库本身不产生任务的数据,其数据来源于各个不同的外部系统
    • 数据仓库也不需要任务外部数据,只是把收集好的数据整理好,在提供给外部使用

    在这里插入图片描述

    数仓和OLTP区别

    在面对大量数据的时候,我们很多时候也会使用OLTP 型数据库

    在大多数的OLTP ,是面向业务的,支持事务,对于大量数据的分析还是有很大的压力;

    还有就是,大多数不同的业务系统数据存储在不同的数据库和表中,字段类型还不一致,关联处理比较麻烦;

    数仓特点

    面向主题:比较抽象的一个概念,可以理解为一个纬度,一个业务模块归类后的数据上的抽象

    集成性:一个主题的数据,可能是发布在不同的应用系统中,各个系统独立存储,数据分散,需要综合的集成到数据仓库中来;

    非易失性:拉取其他系统的数据,分析数据,不创造新的数据

    时变性:数仓的数据需要随着时间更新,适应决策需要

    数仓开发语言

    数仓前面也说到了,主要是为了分析数据,只要你这个语言可以读取数据,处理数据,就可以作为数仓的开发语言;

    比如说是C,Java ,Python 都可以作为数仓开发的语言,主要是学习成本的问题,说到学习成本,SQL语言应该是相对比较简单的了,所以现在数据分析领域的主要开发语言就是SQL;

    像是后面介绍的HIVE 就是把我们编写的SQL 转变成Map Reduce任务 跑在Hadoop 集群上来处理大数据查询分析;

    在Hadoop 集群上来处理大数据查询分析;

  • 相关阅读:
    申请实用新型专利有什么优势
    【编程不良人】SpringSecurity实战学习笔记01---权限管理、环境搭建
    Nuxt服务端请求及获取Cookie
    北京旅游HTML学生网页设计作品 dreamweaver作业静态HTML网页设计模板 北京旅游景点网页作业制作 HTML+CSS+JS
    echarts饼图label显示不全原因?
    【递归】树形结构、list转map
    2024-5-18——找出可整除性得分最大的整数
    【大模型应用开发教程】02_LangChain介绍
    【精读Uboot】its文件语法
    Balanced Multimodal Learning via On-the-fly Gradient Modulation(CVPR2022 oral)
  • 原文地址:https://blog.csdn.net/weixin_44244088/article/details/126078981
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号