• pyspark连接mysql数据库报错


    使用pyspark连接mysql数据库代码如下

    1. spark_conf = SparkConf().setAppName("MyApp").setMaster("local")
    2. spark = SparkSession.builder.config(conf=spark_conf).getOrCreate()
    3. url = "jdbc:mysql://localhost:3306/test?useUnicode=true&characterEncoding=UTF-8&useSSL=false"
    4. table_name = "tab_tf"
    5. properties = {
    6. "user": "root",
    7. "password": "root"
    8. }
    9. # 读取 MySQL 数据库中的数据
    10. df = spark.read.jdbc(url=url, table=table_name, properties=properties)
    11. # 展示数据
    12. df.show()

    执行时报错了,错误信息如下:

    py4j.protocol.Py4JJavaError: An error occurred while calling o32.jdbc.
    : java.sql.SQLException: No suitable driver
        at java.sql.DriverManager.getDriver(DriverManager.java:315)
        at org.apache.spark.sql.execution.datasources.jdbc.JDBCOptionsanonfun$6.apply(JDBCOptions.scala:105)atorg.apache.spark.sql.execution.datasources.jdbc.JDBCOptions

    anonfun$6.apply(JDBCOptions.scala:105)
        at scala.Option.getOrElse(Option.scala:121)
        at org.apache.spark.sql.execution.datasources.jdbc.JDBCOptions.(JDBCOptions.scala:104)
        at org.apache.spark.sql.execution.datasources.jdbc.JDBCOptions.(JDBCOptions.scala:35)
        at org.apache.spark.sql.execution.datasources.jdbc.JdbcRelationProvider.createRelation(JdbcRelationProvider.scala:32)
        at org.apache.spark.sql.execution.datasources.DataSource.resolveRelation(DataSource.scala:332)
        at org.apache.spark.sql.DataFrameReader.loadV1Source(DataFrameReader.scala:242)
        at org.apache.spark.sql.DataFrameReader.load(DataFrameReader.scala:230)
        at org.apache.spark.sql.DataFrameReader.load(DataFrameReader.scala:186)
        at org.apache.spark.sql.DataFrameReader.jdbc(DataFrameReader.scala:257)
        at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
        at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
        at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
        at java.lang.reflect.Method.invoke(Method.java:498)
        at py4j.reflection.MethodInvoker.invoke(MethodInvoker.java:244)
        at py4j.reflection.ReflectionEngine.invoke(ReflectionEngine.java:357)
        at py4j.Gateway.invoke(Gateway.java:282)
        at py4j.commands.AbstractCommand.invokeMethod(AbstractCommand.java:132)
        at py4j.commands.CallCommand.execute(CallCommand.java:79)
        at py4j.GatewayConnection.run(GatewayConnection.java:238)
        at java.lang.Thread.run(Thread.java:748)
     

    经查询,是因为spark中缺少连接MySQL的驱动程序,于是乎下载了与自己mysql数据库版本一致的jar包,下载地址:https://downloads.mysql.com/archives/c-j/ 

    查询mysql版本命令:mysql -V

    下载完成后,解压,将mysql-connector-java-8.0.30.jar拷贝到spark安装目录的libs中

    重新执行程序,问题解决,执行结果如下:

    参考:py4j.protocol.Py4JJavaError: An error occurred while calling o32.jdbc.-CSDN博客

  • 相关阅读:
    MySQL数据库入门到大牛_基础_09_子查询(子查询分类方法;单行子查询,多行子查询;相关子查询)
    31-k8s集群svc的代理模式-iptables修改为ipvs
    mybatis-plus-ext注解学习
    灵感收集·创意写作软件评测:Flomo、Obsidian Memo、Napkin、FlowUs
    Go单元测试及框架使用
    docker自定义镜像与上传
    P1068 [NOIP2009 普及组] 分数线划定
    照片相框软件有什么?照片相框怎么加技巧分享
    面向海洋观监测传感网的移动终端位置隐私保护研究
    五芳斋:「老」字号需要「新」故事
  • 原文地址:https://blog.csdn.net/Flychuer/article/details/134242489