QQ登录

只需一步,快速开始

登录 | 注册 | 找回密码

三维网

 找回密码
 注册

QQ登录

只需一步,快速开始

展开

通知     

查看: 8480|回复: 5
收起左侧

[分享] CAJ格式转换成WORD的方法

[复制链接]
发表于 2007-8-14 11:54:07 | 显示全部楼层 |阅读模式 来自: 中国湖南衡阳

马上注册,结识高手,享用更多资源,轻松玩转三维网社区。

您需要 登录 才可以下载或查看,没有帐号?注册

x
现在网上许多资料都是以CAJ、PDF等文件格式提供的,其中的文本不能被直接编辑。网上提供了许多处理这种情况的软件,但是它们不是效率低,就是只能提取其中部分文本。    本文所述利用微软提供的OCR识别技术从CAJ、PDF等文件中提取全部文本的方法,简便快捷,效率很高。
& `+ e8 ?! a- J    从不同格式的文件中提取文本前需要做好以下准备工作,安装CAJViewer5.5浏览器软件和acrobat 5 专业版浏览器软件安装Office2003,并完全安装Office工具Microsoft Office Document Imaging,然后在打印机里面会增加Microsoft Office Document Image Writer打印机。
- S: ~3 ?9 p$ P0 r* s# f    Microsoft Office Document Image可以非常准确的全文件识别转化中文、英文、表格。 $ t% c! P& i+ O7 y+ K* d  K
    CAJ文件的识别
6 S1 I' J+ P& N$ m+ L" F) k7 `9 J(一)首先,从网上下载CAJ格式的资料文件保存到本地硬盘上。
0 _  `7 S0 j! y9 m    (二)然后,启动CAJViewer浏览器程序,并在该程序中打开刚才保存的CAJ格式的文件。浏览文件到最后一页后,不要关闭CAJ浏览器程序。! g4 v( r  l2 r1 y
    (三)在CAJ浏览器程序窗口中,选择"文件"→"打印",并选择打印机为Microsoft Office Document Image Writer打印机,勾选打印到文件选项和确定打印页数。
6 i* \0 V- J$ g5 s    (四)保存打印文件(*.prn)到适当位置。等待打印完成后,Microsoft Office Document Image 自动打开刚才保存的打印文件。) Z4 Y' ~, q, O% D. q
    (五)在Microsoft Office Document Image窗口中,选择"页面"菜单中的"选择所有页面"菜单项,然后选择"工具"菜单中的"使用OCR识别文本"提取文本。0 W2 a3 C' u, [+ j7 `
    (六)选择"工具"下的 "将文本发送到word",最后将把整个CAJ文件识别输出到word文件中 。
发表于 2007-10-4 19:31:03 | 显示全部楼层 来自: 中国河北唐山
非常感谢楼主,我有许多CAJ文档,必须用专用浏览器观看,转成DPF文件又效果太差,今天算是有办法了。再次感谢。
发表于 2007-10-5 08:58:15 | 显示全部楼层 来自: 中国陕西咸阳
谢谢!确实不错的方法。真的感谢,正需要。
发表于 2007-10-5 10:53:56 | 显示全部楼层 来自: 中国江西九江
我在网上找了许多都不是很好,希望楼主说的有用!
发表于 2007-10-5 11:22:07 | 显示全部楼层 来自: 中国江西九江
不行啊,机子都动不了,而且变得文件大了去。 :L :L
发表于 2007-10-5 13:36:20 | 显示全部楼层 来自: 中国河北张家口
试试,希望楼主的办法效果好
发表回复
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Licensed Copyright © 2016-2020 http://www.3dportal.cn/ All Rights Reserved 京 ICP备13008828号

小黑屋|手机版|Archiver|三维网 ( 京ICP备2023026364号-1 )

快速回复 返回顶部 返回列表