QQ登录

只需一步,快速开始

登录 | 注册 | 找回密码

三维网

 找回密码
 注册

QQ登录

只需一步,快速开始

展开

通知     

查看: 8486|回复: 5
收起左侧

[分享] CAJ格式转换成WORD的方法

[复制链接]
发表于 2007-8-14 11:54:07 | 显示全部楼层 |阅读模式 来自: 中国湖南衡阳

马上注册,结识高手,享用更多资源,轻松玩转三维网社区。

您需要 登录 才可以下载或查看,没有帐号?注册

x
现在网上许多资料都是以CAJ、PDF等文件格式提供的,其中的文本不能被直接编辑。网上提供了许多处理这种情况的软件,但是它们不是效率低,就是只能提取其中部分文本。    本文所述利用微软提供的OCR识别技术从CAJ、PDF等文件中提取全部文本的方法,简便快捷,效率很高。) Y  V6 L: S1 u) V
    从不同格式的文件中提取文本前需要做好以下准备工作,安装CAJViewer5.5浏览器软件和acrobat 5 专业版浏览器软件安装Office2003,并完全安装Office工具Microsoft Office Document Imaging,然后在打印机里面会增加Microsoft Office Document Image Writer打印机。 ; r- ~+ e0 F- J& h& h* |
    Microsoft Office Document Image可以非常准确的全文件识别转化中文、英文、表格。
+ w! R7 p0 ?& l, Q! M    CAJ文件的识别6 z7 y0 Z- j5 W% U! ?4 |
(一)首先,从网上下载CAJ格式的资料文件保存到本地硬盘上。- O: |) M* ^9 ~) T2 d
    (二)然后,启动CAJViewer浏览器程序,并在该程序中打开刚才保存的CAJ格式的文件。浏览文件到最后一页后,不要关闭CAJ浏览器程序。; t' F! L4 d$ ?+ Y
    (三)在CAJ浏览器程序窗口中,选择"文件"→"打印",并选择打印机为Microsoft Office Document Image Writer打印机,勾选打印到文件选项和确定打印页数。
8 m5 `( \* ?8 w) [* k; J: ^    (四)保存打印文件(*.prn)到适当位置。等待打印完成后,Microsoft Office Document Image 自动打开刚才保存的打印文件。7 ?. r$ S  n; T* [: ?) V8 Z4 Z
    (五)在Microsoft Office Document Image窗口中,选择"页面"菜单中的"选择所有页面"菜单项,然后选择"工具"菜单中的"使用OCR识别文本"提取文本。
5 g- |0 x5 L, X' L    (六)选择"工具"下的 "将文本发送到word",最后将把整个CAJ文件识别输出到word文件中 。
发表于 2007-10-4 19:31:03 | 显示全部楼层 来自: 中国河北唐山
非常感谢楼主,我有许多CAJ文档,必须用专用浏览器观看,转成DPF文件又效果太差,今天算是有办法了。再次感谢。
发表于 2007-10-5 08:58:15 | 显示全部楼层 来自: 中国陕西咸阳
谢谢!确实不错的方法。真的感谢,正需要。
发表于 2007-10-5 10:53:56 | 显示全部楼层 来自: 中国江西九江
我在网上找了许多都不是很好,希望楼主说的有用!
发表于 2007-10-5 11:22:07 | 显示全部楼层 来自: 中国江西九江
不行啊,机子都动不了,而且变得文件大了去。 :L :L
发表于 2007-10-5 13:36:20 | 显示全部楼层 来自: 中国河北张家口
试试,希望楼主的办法效果好
发表回复
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Licensed Copyright © 2016-2020 http://www.3dportal.cn/ All Rights Reserved 京 ICP备13008828号

小黑屋|手机版|Archiver|三维网 ( 京ICP备2023026364号-1 )

快速回复 返回顶部 返回列表