• Python自动化办公(一) —— 根据PDF文件批量创建Word文档


    Python自动化办公(一) —— 根据PDF文件批量创建Word文档

    在这里插入图片描述


    在日常办公中,我们经常需要根据现有的PDF文件批量创建Word文档。手动操作不仅费时费力,而且容易出错。幸运的是,使用Python可以轻松实现这个过程。本文将介绍如何使用Python脚本遍历一个文件夹中的PDF文件,并根据每个PDF文件的名字创建对应的Word空白文件。

    安装所需的Python库

    首先,我们需要安装python-docx库来创建和操作Word文档。在终端或命令行中运行以下命令进行安装:

    pip install python-docx
    
    编写Python脚本

    以下是一个完整的Python脚本,演示如何根据PDF文件名创建对应的Word空白文件:

    import os
    from docx import Document
    
    def create_word_from_pdf(pdf_folder, word_folder):
        # 检查保存Word文件的文件夹是否存在,如果不存在则创建
        if not os.path.exists(word_folder):
            os.makedirs(word_folder)
    
        # 遍历PDF文件夹中的所有文件
        for filename in os.listdir(pdf_folder):
            if filename.endswith(".pdf"):
                # 获取文件名(去掉扩展名)
                base_name = os.path.splitext(filename)[0]
                # 创建对应的Word文件名
                word_filename = base_name + ".docx"
                word_path = os.path.join(word_folder, word_filename)
                
                # 创建一个空白的Word文档
                doc = Document()
                # 保存Word文档
                doc.save(word_path)
                print(f"Created: {word_path}")
    
    # 设置PDF文件夹和保存Word文件的文件夹路径
    pdf_folder = 'path/to/pdf_folder'
    word_folder = 'path/to/word_folder'
    
    # 调用函数
    create_word_from_pdf(pdf_folder, word_folder)
    
    详细步骤解释
    1. 导入必要的模块

      • os: 用于文件和目录操作。
      • Documentpython-docx: 用于创建和操作Word文档。
    2. 定义函数 create_word_from_pdf

      • pdf_folder: 存储PDF文件的文件夹路径。
      • word_folder: 将创建的Word文件保存到这个文件夹路径。
    3. 检查和创建Word文件夹

      • 使用 os.makedirs 创建目标文件夹,如果它不存在的话。
    4. 遍历PDF文件夹

      • 使用 os.listdir 列出文件夹中的所有文件,并过滤出以 .pdf 结尾的文件。
    5. 生成Word文件名

      • 使用 os.path.splitext 获取文件名(去掉扩展名),并生成对应的Word文件名。
    6. 创建空白Word文档并保存

      • 使用 Document 创建一个空白的Word文档。
      • 使用 doc.save 保存Word文档到指定路径。
    运行脚本

    将上面的代码保存为一个Python脚本文件(例如 create_word_from_pdf.py),然后在终端或命令行中运行:

    python create_word_from_pdf.py
    

    确保你已经设置了正确的 pdf_folderword_folder 路径。例如:

    pdf_folder = '/path/to/your/pdf_folder'
    word_folder = '/path/to/your/word_folder'
    

    通过这个脚本,你可以根据PDF文件名在指定文件夹中创建对应的Word空白文件。如果你有任何特定需求或问题,请在评论区告诉我!


  • 相关阅读:
    微服务下整合knife4j接口文档
    藏品新塑 | 聚沙数藏携手Metaboard元乐达成战略联盟 聚沙官方全方位战略扶持
    Dijkstra&floyed
    剑指offer68-77二分查找、排序
    电商APP外包开发-新零售电商系统开发解决方案
    日志门面技术
    【Python】字符串详解
    第一章、基于Ruoyi-Vue开发脚手架之对象存储实现
    Python Socket 基础多用户编程
    零拷贝底层剖析
  • 原文地址:https://blog.csdn.net/weixin_56595425/article/details/139703298