nbgd.net
当前位置:首页 >> pDFminEr 中文 >>

pDFminEr 中文

参考下PDFMiner,里面有一个pdf2txt.py,可以抽取中文,试的时候最好保存成文件, 如果在控制台输出,会因为编码问题而显示乱码。http://www.unixuser.org/~euske/python/pdfminer/index.html

pdfminer3k 和PyPDF2(注意大小写) 不过后者处理中文时一堆乱码,很麻烦!

完全使用python编写。 (适用于2.4或更新版本) 解析,分析,并转换成PDF文档。 PDF-1.7规范的支持。 (几乎) 中日韩语言和垂直书写脚本支持。 各种字体类型(Type1、TrueType、Type3,和CID)的支持。 基本加密(RC4)的支持。 PDF与HTML转换...

这个是要在cmd里用的,注意你是windows还是linux等系统(命令行不一样)

网站首页 | 网站地图
All rights reserved Powered by www.nbgd.net
copyright ©right 2010-2021。
内容来自网络,如有侵犯请联系客服。zhit325@qq.com