码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • SparkCore系列-5、RDD 函数练习


    版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。

    大数据系列文章目录

    官方网址:http://spark.apache.org/、https://databricks.com/spark/about
    在这里插入图片描述

    目录

    • 回顾
    • 基本介绍
    • map 函数
    • filter 函数
    • flatMap 函数
    • 交集、并集、差集、笛卡尔积
    • distinct 函数
    • first、 take、 top 函数
    • keys、 values 函数
    • mapValues 函数
    • collectAsMap 函数
    • mapPartitionsWithIndex 函数
    • 下回分解

    回顾

    上篇文章介绍了Spark的一些重要函数,也是企业开发中比较常用的函数,有没看的小伙伴可以去了解下。

    基本介绍

    RDD中的函数有很多,不同业务需求使用不同函数进行数据处理分析,下面仅仅展示出比较常用的函数使用,更多函数在实际中使用体会,多加练习理解。

    map 函数

    对RDD中的每一个元素进行操作并返回操作的结果。
    在这里插入图片描述

    filter 函数

    函数中返回True的被留下,返回False的被过滤掉。
    在这里插入图片描述

    flatMap 函数

    对RDD中的每一个元素进行先map再压扁,最后返回操作的结果。
    在这里插入图片描述

    交集、并集、差集、笛卡尔积

    数学集合中操作,类似Scala集合类Set中相关函数,注意类型要一致。
    在这里插入图片描述

    distinct 函数

    对RDD中元素进行去重,与Scala集合中distinct类似。
    在这里插入图片描述

    first、 take、 top 函数

    从RDD中获取某些元素,比如first为第一个元素, take为前N个元素, top为最大的N个元素。
    在这里插入图片描述

    keys、 values 函数

    针对RDD中数据类型为KeyValue对时,获取所有key和value的值,类似Scala中Map集合。
    在这里插入图片描述

    mapValues 函数

    mapValues表示对RDD中的元素进行操作,Key不变,Value变为操作之后。
    在这里插入图片描述

    collectAsMap 函数

    当RDD中数据类型为Key/Value对时,转换为Map集合。
    在这里插入图片描述

    mapPartitionsWithIndex 函数

    取分区中对应的数据时,还可以将分区的编号取出来,这样就可以知道数据是属于哪个分区的。
    在这里插入图片描述

    下回分解

    通过一些函数的练习,帮助我们更好的理解函数,下篇文章将给小伙伴介绍下RDD的持久化,RDD如何缓存?什么时间释放缓存?等等。

  • 相关阅读:
    配电室远程运维平台:现代化的电力管理解决方案
    适配器模式(Adapter Pattern)
    树控件、下拉框、文本框常用测试用例
    抖音短视频实操:矩阵号之为什么要做矩阵号和如何做矩阵号(中)
    如何使用ChatGPT辅助写论文、数据分析、AI绘图?【附学习资料】
    直播是未来互联网创业者必备的素质之一?
    Excel函数
    多家大厂JAVA面试题整理分布式+微服务+高并发+性能优调+框架源码
    FPGA:什么是流水线?流水线用在哪?
    OSPF高级特性 —— 被动接口 + 按需链路 + donotage标记
  • 原文地址:https://blog.csdn.net/l848168/article/details/126034740
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号