• C# iText 7 切分PDF,处理PDF页面大小


    一、itext

    我要使用itext做一个pdf的页面大小一致性处理,然后再根据数据切分出需要的pdf.

    iText的官网有关于它的介绍,https://itextpdf.com/ 然后在官网可以查找api文档https://api.itextpdf.com/。

    其中我要使用的是itext7+,主要在iText.Kernel.Pdf 命名空间下。

    二、处理PDF页面大小一致

    由于原始PDF 是扫描图片合成来的,有些页面扫描的图片规格不一致,导致pdf阅读性很差。

    对于这个pdf我进行处理,首先是在nuget 里面搜索 itext 进行安装,使用itext7。

    处理PDF大小方法:

            public void RestPageSize(string sourcePdfPath, string outputPdfPath)
            {
                PdfReader pdfReader = null;
                PdfDocument pdfDocument = null;
                PdfWriter pdfWriter = null;
                PdfDocument outPDfDoc = null;
                try
                {
                    pdfReader = new PdfReader(sourcePdfPath);
                    pdfDocument = new PdfDocument(pdfReader);
                    var outDir = System.IO.Path.GetDirectoryName(outputPdfPath);
                    if (!Directory.Exists(outDir))
                    {
                        Directory.CreateDirectory(outDir);
                    }
    
                    pdfWriter = new PdfWriter(outputPdfPath);
                    outPDfDoc = new PdfDocument(pdfWriter);
    
                    outPDfDoc.SetDefaultPageSize(PageSize.A3);
    
    
                    for (int i = 1; i < pdfDocument.GetNumberOfPages() + 1; i++)
                    {
                        var page = pdfDocument.GetPage(i);
                        var formXObject = page.CopyAsFormXObject(outPDfDoc);
                        var xPercent = PageSize.A3.GetWidth() / page.GetPageSize().GetWidth();
                        var yPercent = PageSize.A3.GetHeight() / page.GetPageSize().GetHeight();
                        PdfCanvas pdfCanvas = new PdfCanvas(outPDfDoc.AddNewPage());
                        pdfCanvas.AddXObjectWithTransformationMatrix(formXObject, xPercent, 0, 0, yPercent, 0, 0);
                    }
    
                    pdfWriter.Flush();
    
                }
                catch (Exception ex)
                {
                    Console.WriteLine(ex);
                }
                finally
                {
                    if (pdfReader != null)
                    {
                        pdfReader.Close();
                    }
                    if (pdfDocument != null)
                    {
                        pdfDocument.Close();
                    }
                    if (outPDfDoc != null)
                    {
                        outPDfDoc.Close();
                    }
                    if (pdfWriter != null)
                    {
                        pdfWriter.Close();
                        pdfWriter.Dispose();
                    }
                }
    

    思路:遍历原来的PDF页码,将原来的PDF页码对象拷贝PdfFormXObject到要生成的PDF文档中,首先要copy页面对象才能使用,不然直接获取的page对象是原来文档的,我们无法操作。

    var formXObject = page.CopyAsFormXObject(outPDfDoc);
    

    然后对页面进行缩放计算,我们新的PDF默认设置成A3大小,通过计算原始页面和新页面宽高比例进行缩放。

    计算完成后,在新文档中使用PdfCanvas 对象新添加一页,然后将PdfFormXObject 写入到新添加的页中。

    处理后的PDF:

    三、切分PDF

    切分PDF 就比较简单了,直接从原始文件中拷贝页面到新PDF文档中就行了。

    切分PDF 方法:

            public void ExtractPages(string sourcePdfPath, string outputPdfPath, int startPage, int endPage)
            {
                PdfReader pdfReader = null;
                PdfDocument pdfDocument = null;
                PdfWriter pdfWriter = null;
                PdfDocument outPDfDoc = null;
                try
                {
                    pdfReader = new PdfReader(sourcePdfPath);
                    pdfDocument = new PdfDocument(pdfReader);
                    var outDir = Path.GetDirectoryName(outputPdfPath);
                    if (!Directory.Exists(outDir))
                    {
                        Directory.CreateDirectory(outDir);
                    }
                    
                    pdfWriter = new PdfWriter(outputPdfPath);
                    outPDfDoc = new PdfDocument(pdfWriter);
    
                    pdfDocument.CopyPagesTo(startPage, endPage, outPDfDoc);
                    pdfWriter.Flush();
    
                }
                catch (Exception ex)
                {
                    Console.WriteLine(ex);
    
                }
                finally
                {
                    if (pdfReader != null)
                    {
                        pdfReader.Close();
                    }
                    if (pdfDocument != null)
                    {
                        pdfDocument.Close();
                    }
                    if (outPDfDoc != null)
                    {
                        outPDfDoc.Close();
                    }
    
                    if (pdfWriter != null)
                    {
                        pdfWriter.Close();
                        pdfWriter.Dispose();
                    }
                }
    
            }
    

    注意:对写入流要进行pdfWriter.Flush()将缓冲区数据写入PDF后再关。

  • 相关阅读:
    Vue详解
    85-maven工程servlet实例
    Anaconda添加channels后出现unexpected urllib3 DEBUG logging from conda-build
    数据结构体--5.0图
    【基于然也物联MQTT的ESP遥控小车】
    Java,给数组元素赋不同的随机值
    植物大战僵尸杂交版等超火的版本汇总(附说明和下载链接)
    iPhone 可以DIY了?苹果推出自助维修计划
    【LeetCode每日一题】——37.解数独
    NLP 使用Word2vec实现文本分类
  • 原文地址:https://www.cnblogs.com/SunSpring/p/16193835.html