• Java使用pdfbox将pdf转图片


    前言

    目前比较主流的两种转pdf的方式,就是pdfbox和icepdf,两种我都尝试了下,icepdf解析出来有时候会出现中文显示不出来,网上的解决方式又特别麻烦,不是安装字体,就是重写底层类,所以我选择了pdfbox

    添加依赖

    1. <dependency>
    2. <groupId>org.apache.pdfboxgroupId>
    3. <artifactId>pdfboxartifactId>
    4. <version>3.0.0version>
    5. dependency>

    代码

    1. import org.apache.pdfbox.Loader;
    2. import org.apache.pdfbox.pdmodel.PDDocument;
    3. import org.apache.pdfbox.rendering.PDFRenderer;
    4. import javax.imageio.ImageIO;
    5. import java.awt.image.BufferedImage;
    6. import java.io.File;
    7. import java.nio.file.Files;
    8. import java.nio.file.Paths;
    9. public class Main {
    10. public static void main(String[] args) throws Exception {
    11. // 加载pdf文件
    12. PDDocument doc = Loader.loadPDF(new File("data.pdf"));
    13. // 2.x版本的pdfbox写法
    14. // PDDocument doc = PDDocument.load(new File("data.pdf"));
    15. PDFRenderer renderer = new PDFRenderer(doc);
    16. // 遍历每页pdf
    17. for (int i = 0; i < doc.getNumberOfPages(); i++) {
    18. // dpi调到300左右即可,太小会模糊,太大会使图片变得很大
    19. BufferedImage image = renderer.renderImageWithDPI(i, 300);
    20. ImageIO.write(image, "jpg", Files.newOutputStream(Paths.get("data_" + i + ".jpg")));
    21. }
    22. }
    23. }

    arm架构的linux上转换可能会出现模糊情况

    在windows上好好的,x86_64的linux上也好好的,就是arm架构的linux上会出现

    网上的博客基本上不是安装字体,就是重写底层类,但你永远不会想到是jdk的问题,这个一般是低版本的jdk8导致的

    解决办法:将jdk8升级到8u311或以上,或者使用高版本的jdk即可

    转换效果如下:

     附上高版本的jdk8下载地址:https://www.oracle.com/java/technologies/downloads/#java8 

  • 相关阅读:
    【C++】类和对象(上)
    vsftpd 操作手册 - 完整版
    CSS writing-mode属性
    【闲聊杂谈】ElasticSearch的深度分页相关
    【一起入门DeepLearning】中科院深度学习_期末总复习
    【20220903-美团笔试】
    Win11怎么安装语音包?Win11语音包安装教程
    刷题第一天——链表
    Leetcode20.有效的括号
    面试题-springboot篇-SpringBoot的注解
  • 原文地址:https://blog.csdn.net/qq243920161/article/details/132625213