发布网友 发布时间:2022-04-20 14:27
共2个回答
热心网友 时间:2022-06-03 17:39
如果你需要将图片(PDF文件)中的文字提取出来。我这里就教你一个方法吧。
首先可以利用Office
2003组件。运行Office
2003安装包,接着在勾选
“选择应用程序的高级自定义”这里要注意的是刚装的在选择安装时要选自定义,而不是默认的“经典”
打开Office工具→Microsoft
Office
Document
Imaging,按提示选择安装“扫描、OCR和索引服务筛选器”和“Microsoft
Office
Document
Image
Writer”
进行更新完毕后。在安装Microsoft
Office
Document
Imaging组件后,Windows
XP系统会自动安装一个名为“Microsoft
Office
Document
Imaging
Writer”的打印机(虚拟打印机)。Imaging组件可以通过这个虚拟打印机,将PDF文件所保存的信息识别,从而达到将它直接转换输出到Word等文字编辑工具中的目的。
第二步:用Adobe
Reader
打开想转换的PDF文件,接下来
选择
“文件→打印”菜单,在打开的“打印”窗口中将“打印机”栏中的名称设置为
“Microsoft
Office
Document
Image
Writer”
确认后将该PDF文件输出为
MDI格式的虚拟打印文件
然后,运行
“Microsoft
Office
Document
Imaging”,并利用它来
打开
刚才保存的MDI文件,选择“工具→
将文本发送到Word
在弹出的“将文本发送到Word”窗口中选中“所有页面”和“
在输出时保持图片版式不变
确认后系统会提示“必须在您执行此操作前识别该文档中的文本(OCR)。这可能需要一些时间”,不管它,点击确定即可
识别完成后,系统会自动调出Word,这时你就可以看到,刚才还不能编辑的文字,乖乖的出现在Word编辑窗口中
需要说明的是,利用Office
2003实现PDF文件转的Word文档不是特别完美,转换后会丢失原来的排版格式,所以转换后还需要手工对其进行排版和校对
热心网友 时间:2022-06-03 17:39
工具-基本工具-文本选择工具
office2003实现pdf文件转word文档
经过尝试,发现可以利用
office
2003
中的
microsoft
office
document
imaging
组件来实现pdf转word文档,也就是说利用word来完成该任务。方法如下:
用adobe
reader
打开想转换的pdf文件
,接下来
选择
“文件→打印”菜单,在打开的“打印”窗口中将
“打印机”栏中的名称设置为
“microsoft
office
document
image
writer”,确认后将该pdf文
件输出为
mdi格式的虚拟打印文件
。
注:
如果没有找到“microsoft
office
document
image
writer”项,使用office
2003安装光盘中的“添加/删除组件”更新安装该组件,选中“office
工具
microsoft
draw转换器”。
然后,
运行
“microsoft
office
document
imaging”,并利用它来
打开
刚才保存的mdi文件,选择“工具→
将文本发送到word
”菜单,在弹出的窗口中选中“
在输出时保持图片版式不变
”,确认后系统会提示“必须在执行此操作前重新运行
ocr
。这可能需要一些时间”,不管它,
确认
即可。
注:
对pdf转doc的识别率不是特别完美,转换后会丢失原来的排版格式,所以转换后还需要手工对其进行排版和校对工作。
以上仅在
word2003
中可用,其他版本没有microsoft
office
document
image
writer。