linux下如何将pdf转换成text文本

2025-04-24 07:38:06

1、安装软件sudo apt-get install gocrsudo apt-get install tesseract-ocr

2、打开Screenshot截屏软件截取你要转换的文字

linux下如何将pdf转换成text文本
linux下如何将pdf转换成text文本

3、打开libreOffice Writer,将刚才截屏的图片托进去.

linux下如何将pdf转换成text文本

4、点击保存为PDF格式文件,文件名为text

linux下如何将pdf转换成text文本

5、找到保存好的text.pdf文件,右键打开终端.

linux下如何将pdf转换成text文本

6、在终端中输入pdftoppm text.pdf a,得到a-1.ppm文件

linux下如何将pdf转换成text文本

7、然后输入命令:tesseract a-1.ppm a,得到a.txt文件.

linux下如何将pdf转换成text文本
声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
猜你喜欢