24小时热门版块排行榜    

查看: 823  |  回复: 12
当前主题已经存档。
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

daojin593

金虫 (正式写手)

[交流] 怎么样将PDF文件中的图片中的文字提取出来?

怎么样将PDF文件中的图片中的文字提取出来?因为我的一个PDF文件全部是图片,我想将图片上的文字以txt格式提取出来,请各位帮忙!.怎么才能将word里面的数百个图片导出并将图片上的文字提取出来?

[ Last edited by daojin593 on 2006-6-21 at 22:35 ]

» 猜你喜欢

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

baboon14

金虫 (小有名气)

★ ★
zhaoyusnow(金币+1):感谢参与,欢迎常来
daojin593(金币+1):谢谢,为我指点了方向!
一款非常好的Pdf向Doc格式转换的工具,ScanSoft PDF Converter for Microsoft Word v1.0。它是由ScanSoft公司同微软共同组队开发了一个全新的Office 2003 插件。该插件可以帮助你通过Word直接将Pdf文档转换为Word文档,并且完全保留原来的格式和版面设计。

  这个名为 ScanSoft PDF Converter for Microsoft Word 的插件是首先捕获Pdf文档中的信息,分离文字同图片,表格和卷,再将其统一到Word格式。现在你可以重新利用早先你从网络上下载或Email中收到的Pdf文件中的信息,而无需添加任何其他软件。
在Microsoft Word 2003中你可以直接通过“文件”—>“打开”来打开Pdf文件。ScanSoft PDF Converter for Microsoft Word插件会自动弹出了,经过转换后我们就可以得到想要的Doc文件。
金谷年年,乱生春色谁为主。余花落处。满地和烟雨。 又是离歌,一阕长亭暮。王孙去。萋萋无数。南北东西路。
8楼2006-06-21 19:13:26
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 13 个回答

netflash

木虫 (正式写手)


daojin593(金币+1):谢谢
抓图后用OCR识别。
2楼2006-06-21 17:53:36
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

daojin593

金虫 (正式写手)

那太麻烦了,我就是因献这样麻烦才求助的嘛
3楼2006-06-21 18:11:37
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

daojin593

金虫 (正式写手)

你看有没有什么软件可以将PDF文件中的图片先取出来,然后用OCR进行识别啊?
4楼2006-06-21 18:13:42
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
普通表情 高级回复 (可上传附件)
信息提示
请填处理意见