24小时热门版块排行榜    

查看: 1143  |  回复: 9
本帖产生 1 个 博学EPI ,点击这里进行查看
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

陈德飞1989

木虫 (小有名气)

[求助] 如何提取PAF图片中的文字???

问题关键:PAF是以图片形式存在的。
目的:提取文字能转换为WORD文档,能够粘贴复制。
已阅   关注TA 给TA发消息 送TA红花 TA的回帖

cbgs110

木虫 (正式写手)

【答案】应助回帖

★ ★ ★ ★ ★
陈德飞1989: 金币+5, 博学EPI+1, 我先试试 2012-05-06 16:06:46
不用那么麻烦,滥糟的·····国内有一个软件是CAJ ,里面的 OCR识别能力非常强,另外,小木虫上很多软件都不错,https://muchong.com/bbs/viewthread.php?tid=4457833&page=1#pid1 个人感觉就很好
天道酬勤
4楼2012-05-06 15:32:57
已阅   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 10 个回答

陈德飞1989

木虫 (小有名气)

非常谢谢,我试试看。
2楼2012-05-06 13:38:16
已阅   关注TA 给TA发消息 送TA红花 TA的回帖

..压力在盛夏

木虫 (著名写手)

小木虫剩女研究办主任

【答案】应助回帖

★ ★
陈德飞1989: 金币+2 2012-05-06 22:08:16
1. 如果不是图片类做成的PDF 你可以尝试用veryPDF PDF2WORD 工具或者使用Solid Converter PDF 转换 但是如果是内嵌了字体的,那么就要看情况了,因为有的字体你系统里面有,转出来就没有问题,如果系统里面没有,那么转出来就是一堆乱码,那么就先要把这些PDF文件转成位图形式(也就是常说的PDF转曲)然后再用工具转,当然这时候上面的2个工具基本无能为力了
2.对于是图片做成的PDF 那么我们就需要用OCR类软件进行识别了,你可以用比较简单的CAJviewer来提取 但是只能是一页页提取文字,或者你可以使用Readiris Corporate 12软件来进行识别,但是Readiris Corporate 12呢需要下载支持韩语 日语还有简体中文的亚洲语言包才是识别中文,但是这个软件的OCR识别率是比较好的~~~~当然还有ABBYY finereader 也是一款识别率很高的软件,关键还支持中文识别~~也是一款不可多得的OCR软件,这里我强力推荐这个软件。
3. 对于一些不允许做修改的PDF文件(就是加密加了权限的PDF),那么就先要去除密码或者去除数字证书,才能照上面两个步骤做试试
吾日三省乎吾身:吃饱了没?还能吃下不?真的吃不下了么?于是一个胖纸诞生了。。。
3楼2012-05-06 13:47:35
已阅   关注TA 给TA发消息 送TA红花 TA的回帖

陈德飞1989

木虫 (小有名气)

引用回帖:
4楼: Originally posted by cbgs110 at 2012-05-06 15:32:57:
不用那么麻烦,滥糟的·····国内有一个软件是CAJ ,里面的 OCR识别能力非常强,另外,小木虫上很多软件都不错,https://muchong.com/bbs/viewthread.php?tid=4457833&page=1#pid1 个人感觉就很好

用了,还是没解决。
5楼2012-05-06 16:25:49
已阅   关注TA 给TA发消息 送TA红花 TA的回帖
信息提示
请填处理意见