• Python实现将文件夹下的所有pdf文件合并成一个pdf文件,并用文件夹名字命名


    Python实现将文件夹下的所有pdf文件合并成一个pdf文件,并用文件夹名字命名

    # -*- coding: utf-8 -*-
    
    import os
    import PyPDF2
    
    def merge_pdfs(folder_path):
        # 获取文件夹名称
        folder_name = os.path.basename(folder_path)
        
        # 搜索文件夹内的所有PDF文件
        pdf_files = [f for f in os.listdir(folder_path) if f.endswith('.pdf')]
        
        # 按名称排序文件,确保顺序
        pdf_files.sort()
    
        # 创建一个PDF文件合并器对象
        pdf_merger = PyPDF2.PdfMerger()
    
        # 遍历所有PDF文件并将它们添加到合并器中
        for pdf_file in pdf_files:
            file_path = os.path.join(folder_path, pdf_file)
            pdf_merger.append(file_path)
    
        # 合并后的PDF文件保存路径
        output_path = os.path.join(os.path.dirname(folder_path), f"{folder_name}.pdf")
    
        # 写入合并后的PDF文件
        with open(output_path, 'wb') as output_file:
            pdf_merger.write(output_file)
    
        # 关闭合并器
        pdf_merger.close()
    
        print(f"PDFs merged into '{output_path}'")
    # 设置源文件夹路径
    source_dir = r''
    
    # 确保目标文件夹存在
    if not os.path.exists(source_dir):
        print(f"文件夹 {source_dir} 不存在")
        exit()
    # 这里是子文件夹的子文件夹为单位进行转化的,可以根据自己需求修改
    # 例如如果只需要处理一个文件夹,可以直接使用merge_pdfs(folder_path)即可
    dir_1=os.listdir(source_dir)
    for path1 in dir_1:
        if not os.path.isfile(source_dir+f'\{path1}'):
            dir_2=os.listdir(source_dir+f'\{path1}')
            for path2 in dir_2:
                if not os.path.isfile(source_dir+f'\{path1}'+f'\{path2}'):
                    deal_dir=source_dir+f'\{path1}'+f'\{path2}'
                    folder_path = deal_dir
                    merge_pdfs(folder_path)
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37
    • 38
    • 39
    • 40
    • 41
    • 42
    • 43
    • 44
    • 45
    • 46
    • 47
    • 48
    • 49
    • 50
    • 51
    • 52
  • 相关阅读:
    Jemeter实现多用户登录的两种方式
    【解密ChatGPT】:从过去到未来,揭示其发展与变革
    Mysql 基础命令增删改查
    Redis持久化策略剖析
    复制集群架构设计技巧
    C++中的Lambda表达式
    【机器学习算法】集成学习-1 强学习器的融合学习
    可以替代911s5的这几款产品还有跨境人士不知道吗?
    编译原理第三版课后答案
    如何保证接口的幂等性?
  • 原文地址:https://blog.csdn.net/a1920993165/article/details/137978406