码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 2023_Spark_实验十九:SparkStreaming入门案例


    SparkStreaming入门案例

    一、准备工作
    二、任务分析
    三、官网案例
    四、开发NetWordCount

    一、准备工作


    • 实验环境:netcat
    • 安装nc:yum install -y nc

    二、任务分析


    将nc作为服务器端,用户产生数据;启动sparkstreaming案例中的客户端程序,监听服务器端发送过来的数据,并对其数据进行词频统计,即为流式的wordcount入门程序

    三、官网案例


    • 启动nc作为服务器端,执行:nc -l 1234,并输入测试数据,如图所示:
    • 启动客户端,执行:
      bin/run-example streaming.NetworkWordCount localhost 1234
    注意):如果要执行本例,必须确保机器 cpu 核数大于 2

    四、开发NetWordCount

    1. 创建maven工程
    2. 添加maven依赖,即在pom.xml中添加streamming的依赖,如下(如果之前实验已经添加,就不用再添加,如果之前未添加,则需要添加该依赖)
    1. <dependency>
    2. <groupId>org.apache.sparkgroupId>
    3. <artifactId>spark-streaming_2.12artifactId>
    4. <version>2.1.1version>
    5. dependency>

    3.开发NetWordCount程序
    1. import org.apache.spark.SparkConf
    2. import org.apache.spark.storage.StorageLevel
    3. import org.apache.spark.streaming.dstream.{DStream, ReceiverInputDStream}
    4. import org.apache.spark.streaming.{Seconds, StreamingContext}
    5. object StreamingTest {
    6. def main(args: Array[String]): Unit = {
    7. val sparkConf = newSparkConf().setMaster("local[2]").setAppName("StreamingTest")
    8. val streamingContext = new StreamingContext(sparkConf, Seconds(5))
    9. // 创建DStream对象,并链接到nc服务器端
    10. val ris: ReceiverInputDStream[String] = streamingContext.socketTextStream("192.168.245.110", 1234,StorageLevel.MEMORY_AND_DISK)
    11. // 采集数据,并处理数据
    12. val ds: DStream[String] = ris.flatMap(_.split(" "))
    13. println(ris)
    14. // 统计单词
    15. val resultDS: DStream[(String, Int)] = ds.map(x => (x, 1)).reduceByKey(_ + _)
    16. // 打印结果
    17. resultDS.print()
    18. // 启动实时计算
    19. streamingContext.start()
    20. // 等待计算结束
    21. streamingContext.awaitTermination()
    22. }
    23. }

    4.先在虚拟机上启动nc服务器:nc -l 1234,并输入测试数据,如图
    5.然后运行程序
    6.运行结果如下
    参考:
    https://www.shuzhiduo.com/A/gVdneZLa5W/

  • 相关阅读:
    深度学习入门(十九)深度学习计算——自定义层
    什么是 AirServer?Mac专用投屏工具AirServer 7 .27 for Mac中文破解版百度网盘下载
    学习MySQL 临时表
    防火墙NAT配置实验
    遗传力缺失的案例
    Windows下Qt读取系统的内存、CPU、GPU等使用信息
    AutoSar CP学习概要
    修改时间服务器-域控环境
    php实战案例记录(2)生成包含字母和数字但不重复的用户名
    Uniapp入门
  • 原文地址:https://blog.csdn.net/pblh123/article/details/133856058
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号