ByteScout PDF Multitool(PDF数据文本提取器)可以从pdf文件中提取数据和文本集,不管是PDF到XML,还是PDF到CSV,甚至还可以用正则表达式搜索文本从扫描的PDF文本,提取原始图像和更多!
多功能工具ByteScout PDF Multitool包括的功能从PDF文件中提取数据和文本集:PDF到XML,PDF到CSV,PDF为文本阅读使用OCR,用正则表达式搜索文本从扫描的PDF文本,提取原始图像和更多!包括OCR读数从图片中的文字,支持英语,德语,法语,西班牙语。以及提取文件附件,提取从PDF包文件,从PDF表单中提取FDF和XFA数据,提取ZUGFeRD发票数据作为XML,从合并PDF页面和更多!
使用这个通用的应用程序,可以将PDF文件转换为多种文档和图像格式,读取损坏的文本,从文档中提取数据等等。ByteScout PDF Multitool是一个易于使用且功能强大的转换套件,可以帮助用户将PDF文件保存为其他常见格式,如TXT、CSV、HTML甚至图像。
1.PDF转换及其扫描图像转换为文本搜索PDF文件;
2.阅读文本扫描文件(支持英语,德语,西班牙语,法语和更多)与功能的HTML PDF浏览器后;
3.PDF到CSV转换,PDF到XML和XLS, PDF到XLSX和PDF到HTML的转换;
4.能够自动查找PDF文档中的表;
5.额外的选项,以分割,合并,提取页面从PDF;
6.在PDF文档中执行正则表达式搜索;
7.从PDF、XFA、XFDF中提取附件和内部数据;
8.将PDF转换为TIFF, PDF转换为PNG, PDF转换为BMP, PDF转换为HTML;
9.打印PDF文档;
= 大大提高了OCR的质量和性能。
= 选择OCR等级的新选项。
= 减少选择模式中过多的绘画。
= 修正“合并文件”工具中“删除”按钮的行为。
= 改进PDF文档的解析。
= 改进PDF文档的呈现。
= 其他较小的修复和改进。