版块导航: 正在加载中...

登录注册

应《网络安全法》要求，自2017年10月1日起，未进行实名认证将不得使用互联网跟帖服务。为保障您的帐号能够正常使用，请尽快对帐号进行手机号验证，感谢您的理解与支持！

24小时热门版块排行榜

返回列表

当前主题已经存档。

可以用import

21楼2006-03-25 16:27:57

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

T-Tad

金虫 (小有名气)

应助: 0 (幼儿园)
金币: 825.4
帖子: 99
在线: 10.3小时
虫号: 100397
注册: 2005-11-12
性别: GG
专业: 电工材料特性及其应用

其实Adobe Reader 5.0以上的专业版都可以实现从word到PDF的互相转化，很方便的，只是有些时候从PDF转化为word要麻烦一些！！

赞一下

回复此楼

22楼2006-03-25 21:08:38

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

xiayum

铜虫 (初入文坛)

应助: 0 (幼儿园)
金币: 110.7
帖子: 46
在线: 1.3小时
虫号: 243650
注册: 2006-04-15
专业: 药物分析

★
小狗(金币+1):多谢参与

PDF文件转DOC方法
方法一：使用Adobe reader 6.0。对于某些pdf的文件，可以选择“文件”——“另存为文本”来实现将pdf文件转化为txt格式的文件。然后粘贴到word里面就可以生成doc格式的文件了。
方法二：利用中文简体版的office2003中自带的一个插件工具Microsoft Office Document Imaging，这个方法网上介绍得很多，兹引述如下;
信息来源：http://article.pchome.net/2004/09/22/27039_3.htm
[PDF变身DOC]
实现工具：Office 2003中自带的Microsoft Office Document Imaging
应用情景：目前国外很多软件的支持信息都使用PDF方式进行发布，如果你没有Adobe Reader，无法查看其内容，如果没有相关的编辑软件又无法编辑PDF文件。我们对微软的DOC文档的编辑最为熟悉，那就转换为DOC格式吧。尽管有些软件也可以完成PDF转换为DOC的工作，但很多都不支持中文，我们利用Office 2003中的Microsoft Office Document Imaging组件来实现这一要求最为方便。
使用方法：
第一步：首先使用Adobe Reader打开待转换的PDF文件，接下来选择“文件→打印”菜单，在打开的“打印”设置窗口中将“打印机”栏中的“名称”设置为“Microsoft Office Document Image Writer”，确认后将该PDF文件输出为MDI格式的虚拟打印文件。
编辑提示：如果你在“名称”设置的下拉列表中没有找到“Microsoft Office Document Image Writer”项，那证明你在安装Office 2003的时候没有安装该组件，请使用Office 2003安装光盘中的“添加/删除组件”更新安装该组件，如图4所示。
第二步：运行Microsoft Office Document Imaging，并利用它来打开刚才保存的MDI文件，选择“工具→将文本发送到Word”菜单，并在弹出的窗口中勾选“在输出时保持图片版式不变”，确认后系统提示“必须在执行此操作前重新运行OCR。这可能需要一些时间”，不管它，确认即可。
编辑提示：目前，包括此工具在内的所有软件对PDF转DOC的识别率都不是特别完美，而且转换后会丢失原来的排版格式，所以大家在转换后还需要手工对其进行后期排版和校对工作。
苦冰案：（1）这种转化方法很方便而且由于是微软自己的，兼容性应该会很好，而且速度也是挺快的，另外在第一步的时候将文件输出为高品质的TIFF文件效果会更好。
（2）但是这种方法仅仅对于文字内容为简体中文的pdf文件有效，对于我们搞文史工作的人来说，这种方法局限性太大。不过我总觉得应该能够对繁体中文转化的，由于我自己机子里面装的简体中文的office，所以在Microsoft Office Document Imaging这个工具的OCR语言选项只有简体中文和英文两种选项，即使把office2003的系统语言换成繁体中文，OCR语言选项里面依然只有简体中文和英文的选项，还是无法实现识别繁体中文的任务。上网寻找微软有没有提供识别繁体中文的插件，只是在台湾微软的下载页面下找到微软为繁体中文版office提供的一个简体中文OCR的辨认引擎，没有能够找到繁体中文的辨认引擎。就此推断，是不是繁体中文版的office2003会有这个繁体中文引擎自带，由于没有找到能用的繁体中文版office2003下载，留待以后再试。
方法三：微软简体中文版office2003没有自带繁体中文的OCR辨认引擎，但是由于它的虚拟打印机提供了TIFF文件的输出（在“打印机”旁边的“设置”里有个“高级”的选项卡可以设置文件输出格式），所以对于一部份繁体中文内容的pdf文件，我们可以采取先将其打印成TIFF格式的文件，然后通过其它OCR软件来进行识别，这些软件中我试用了几种，还是清华文通的OCR9.0比较好，相对识别率比较高，这个软件下载地址为ftp://ftp.math.nankai.edu.cn/pub/win32/tools/ocr/
（可能只有教育网用户才能连接，端口21，匿名就可以访问，用ftp工具下载最好，），还需要一个破解补丁OCR9.0補丁地址：http://www.ihdown.com/soft/2252.htm 。（最下面一個“清华OCR－－TH-OCR9.0完全破解”的鏈接有效。不過這個補丁可能是不完全補丁，所以有些功能还是有限制。）[另外网上也有很多地方提供下载这个软件的破解版的，可以用Google去找找]。安装好这个软件以后，就可以用这个软件打开刚才我们保存的TIFF格式的文件，选择好正确的识别语言（我们选着繁体多体）识别就可以得到txt格式的文件了。
苦冰案：（1）这个软件比较好，你还可以对照原文进行校对，比较方便。需要注意的就是要选好识别语言，并且这个软件识别繁体pdf文件后出来的文本存在较多的错误，需要比较精细的校正一下。
(2)这个软件也有不足的地方，尤其是繁体中文，似乎和原始文件的分辨率有关系，比如益智斋主人给我发的几个文件，怎么也不能识别出来，还需要进一步研究一下。
方法四：这可能是最简单的方法了，就是网上有个免费识别的网站 http://www.netocr.com/ 可以帮你免费识别，具体可以去那里看看。

赞一下(5人)

回复此楼

23楼2006-04-22 18:45:52

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

shileyi

金虫 (正式写手)

应助: 3 (幼儿园)
金币: 2330
散金: 77
红花: 1
帖子: 385
在线: 57.6小时
虫号: 214342
注册: 2006-03-10
性别: GG
专业: 信息安全

这样的，有一个工具叫做 PDFReader，
可以非常好的把PDF文件的内容读取出来，比别的工具要好用些。

赞一下

回复此楼

No pains, no gains

24楼2006-04-23 12:17:33

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

xgy750130

金虫 (小有名气)

应助: 0 (幼儿园)
金币: 1065.4
帖子: 187
在线: 27.2小时
虫号: 57249
注册: 2005-01-29
性别: GG
专业: 食品科学基础

那请问各位，有的PDF文档复制时碰到难题：用PDF的选择工具或快照工具选择要复制的内容后，复制到word时成了图像格式，请问如何改成文字格式？谢谢！

赞一下

回复此楼

希望有畜产品加工方面的专家交流指导！

25楼2006-05-11 22:17:47

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

tome22531

新虫 (初入文坛)

应助: 0 (幼儿园)
金币: 6
帖子: 18
在线: 3.3小时
虫号: 136603
注册: 2005-12-16
性别: GG
专业: 材料化学

★
wsshihan(金币+1):感谢参与！

用那个PDF　FACTORY也可以！安装后在打印选项里选中这个PDF　FACTORY，虚拟打印后就会生成一个POF电子书！

赞一下(5人)

回复此楼

26楼2006-05-14 21:19:20

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

tmfm061

应助: (幼儿园)
在线:
虫号: 248423

谢谢大家的提示，刚才试试，果然很简单！

赞一下

回复此楼

27楼2006-05-19 22:51:05

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

888555

新虫 (小有名气)

应助: 0 (幼儿园)
金币: 93.8
帖子: 75
在线: 2.9小时
虫号: 249475
注册: 2006-05-06
性别: GG
专业: 粒子物理学和场论

★
哲舟(金币+1):A多谢参与!!

下面这个网址有一个可以把pdf转化为word的软件，我下了一个用的还不错你可以试一试，软件名：ScanSoft PDF Converter for Microsoft Word v1.0
网站是：http://lib.verycd.com/2005/06/30/0000055578.html
使用方法见：http://muchong.com/bbs/viewthread.php?tid=203066&fpage=3

我不了,但是pdf-------> doc,不好用为什么

赞一下

回复此楼

28楼2006-05-20 22:21:42

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

growingpains

金虫 (正式写手)

应助: 0 (幼儿园)
贵宾: 0.8
金币: 1249.9
红花: 2
帖子: 541
在线: 3.7小时
虫号: 246271
注册: 2006-04-29
性别: GG
专业: 材料学/ 燃料电池用催化剂

大家都在强调转化问题，其实还要看PDF文件本身，有些文件可以选取文字，但是转化或者拷贝后仍然会是乱码，而有些根本就是图像模式，更得不到想要的结果。这个时候对于像我这样的懒人来说，就是文字识别，大部分可以搞定，但还是需要自己更正一些小的识别错误！

赞一下

回复此楼

我抬头望向天空的时候，总是看见很多云，很多云，而那云之后，才是我向往的天空！

29楼2006-05-20 23:13:51

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

相关版块跳转我要订阅楼主 mabaolin 的主题更新

返回列表