• 领导讲话
  • 剖析整改
  • 党会党课
  • 文秘知识
  • 转正申请
  • 问题清单
  • 动员大会
  • 年终总结
  • 工作总结
  • 思想汇报
  • 实践报告
  • 工作汇报
  • 心得体会
  • 研讨交流
  • 述职报告
  • 工作方案
  • 政府报告
  • 调研报告
  • 自查报告
  • 实验报告
  • 计划规划
  • 申报材料
  • 事迹推荐
  • 考察鉴定
  • 述职述廉
  • 会议主持
  • 主题演讲
  • 就职演说
  • 领导致辞
  • 周年庆典
  • 晚会游戏
  • 慰问贺电
  • 结婚典礼
  • 悼词殡葬
  • 竞职演说
  • 精彩演讲
  • 信息简报
  • 毕业典礼
  • 节日祝福
  • 开幕闭幕
  • 现实表现
  • 廉政谈话
  • 实习报告
  • 策划方案
  • 合同协议
  • 规章制度
  • 申报材料
  • 情书信件
  • 当前位置: 达达文档网 > 体裁范文 > 思想汇报 > 正文

    从图片中读取文字、把图片转换成文本格式(用word附带功能就能做到)

    时间:2021-02-11 16:49:51 来源:达达文档网 本文已影响 达达文档网手机站

    超简单从图片中读取文字的方法(使用word自带软件)

    (全文原创,转载请注明版权。本文下载免费,如果对您有一定帮助,请在右边给予评价,这样有利于将本文档位于百度搜索结果的靠前位置,方便本方法的推广)

    【本文将介绍读取图片中的文字、读取书中文字、读取PDF格式文件中的文字的方法】一、背景

    看到图片中满是文字,而你又想把这些文字保存下来,怎么办?

    日常读书,某篇文章写的极好,想把它分享到网络上,怎么办?

    一个字一个字敲进电脑?太麻烦了。是不是希望有一种东西能自动识别读取这些文字?

    是的,科技就是拿来偷懒的。

    其实你们电脑中安装的word早就为你考虑过这些问题了,只是你还不知道。

    二、方法

    1、图片格式转换

    只有特定格式的图片才能读取文字,所以要转换。大家常见的图片格式都是jpg,或者png,bmp等,用电脑自带的画图软件打开你要获取文字的图片(画图软件在开始——所有程序——附件中,win7用户直接右击图片,选择编辑,就默认使用画图软件打开图片),然后把图片另存为tiff格式。

    (以我的win7画图为例。另存为tiff格式如下图)

    从图片中读取文字、把图片转换成文本格式(用word附带功能就能做到)

    从图片中读取文字、把图片转换成文本格式(用word附带功能就能做到)

    2、打开读取文字的工具

    开始——所有程序——Microsoft Office ——Microsoft Office工具——Microsoft Office Document Imaging(本文全部以office2003为例。另外,有些人

    安装的是Office精简版,可能没有附带这个功能,那就需要添加安装一下,安装步骤见文末注释①)

    从图片中读取文字、把图片转换成文本格式(用word附带功能就能做到)

    3、导入tiff格式的图片

    在Microsoft Office Document Imaging软件界面中,选择文件——导入,然后选择你刚才存放的tiff格式的图片,导入。

    从图片中读取文字、把图片转换成文本格式(用word附带功能就能做到)

    4、文字识别

    点击下图橙色方框圈中的图标,进行OCR识别,就是让软件把图片中的文字读取出来(图片中文字越多,识别花费的时间越长,进行识别完成之后,左边缩略图框中会有一个眼睛的标志,如图红色箭头所指);点击下图橙色椭圆圈中的图标,就能将整个图片中的文本发送到word。

    从图片中读取文字、把图片转换成文本格式(用word附带功能就能做到)

    5、也可以选择图片中的部分文字。

    首先还是要点击OCR识别(如果上面已经识别过,就不用再识别一次了,具体看有没有眼睛标志),然后点击下图中左上角菜单中的箭头,就可以自由拖动选择文字、图片,右击选择框,就可以复制文本、图片或者将选中的文字发送到word。

    从图片中读取文字、把图片转换成文本格式(用word附带功能就能做到)

    6、展示一下识别效果

    从图片中读取文字、把图片转换成文本格式(用word附带功能就能做到)

    7、重要说明

    一般来讲,图片清晰、对比鲜明的时候,该软件对文字的识别率在95%以上,但不能保证100%。为保险起见,还是要人工核对一下识别的结果,尤其是格式特别复杂、有特殊文字、特殊符号的地方。识别率与图片清晰度、文字大小、文字的端正程度、文字与底色的对比程度有关。不要指望你用肉眼都看不清楚或者不能分辨的文字可以用该软件识别出来。

    该软件的原理是使用扫描的文本字符与系统内置的字符形状、语言辞典进行比较,从而识别文字,只能扫描指定的语言,其他语言不能识别。要更改使用的扫描语言,在“工具”菜单下——选项——OCR选项卡——OCR语言,选择你要使用的语言。一般默认使用的语言跟你word的默认语言相同,因此没有特殊要求,不必更改。

    现在网上有许多这方面的专门软件(百度一下OCR就出来了),使用的基本原理都是OCR,但人家既然号称“专业”,可能功能更强大一些(比如支持更多语言)、识别率更高一些(具体是不是,我没用过,也不知道,感觉word自带的这个就够用了),而且,他们大都需要付费,我就看到一款在淘宝卖的,叫价69元(淘宝网址可以参见文末注释②)。

    三、其他读取文字的需要

    1、读取书上的文字

    可以把书上的文字用像素较高的相机照下来,注意照片要端正,尽量清晰,白纸黑字对比鲜明的照片最好,然后对照片执行以上操作。

    2、读取PDF文件

    用Adobe Reader 打开PDF格式的文件:

    如果读取全文,在Adobe Reader中单击文件——打印,将“打印机”设

    置为“Microsoft Office Document Image Writer”,单击打印,默认输出tiff格式虚拟打印文件(也可以设置为输出mdi格式的文件),然后对输出的tiff格式文件或者mdi格式文件执行以上读取文字的操作;

    如果读取部分文字,翻到你需要的文字所在页面,摁下PrScrn键(有抓取屏幕图像的功能),然后打开Microsoft Office Document Imaging,在左侧窗口中单击右键,选择“粘贴页面”,就能把刚才PrScrn键抓取的整个屏幕粘贴到Document Imaging中,然后执行以上读取文本的操作。

    需要说明的是,现在PDF转word,有更多更方便的方法了。一是现在大家使用的新版的Adobe Reader,其本身就能把pdf页面中的文字转换成文本文档;二是同方知网独创的CAJViewer软件(免费),一般被用来阅读知网的论文使用,也可以阅读PDF格式的文件,对PDF文本的操作功能更多;三是上网转换,百度一下“pdf to word ”,就有许多免费的软件和许多免费的在线网站提供转换服务(网站大多是英文的,但也很简单理解),能一步到位把PDF全文转换为word 格式。

    四、科普一下

    OCR,optical character recognition ,通过光学技术对文字进行识别,当有大量文字需要录入电脑的时候,如果能有计算机自动完成,要比人工录入快很多,且节省人力和时间。OCR软件需要光学输入设备(如扫描仪,数码相机等)的配合,构成OCR系统。

    Microsoft Office Document Scanning组件,便于用户通过扫描仪将文档扫描到计算机;

    Microsoft Office Document Imaging组件,便于用户在计算机屏幕上查看扫描的文档、重拍多页文档、选择识别的文本并操作等等。

    电子文本是指带有文字的图片或者电子书籍(指诸如pdf格式的书籍而并非txt格式的电子书),用户需要从中提取文字。导入电子文本的方式有两种,扫描文档和导入Tag图像文件(tiff)、Microsoft Document Imaging文件(mdi)。

    注释:

    ①添加Office OCR工具的方法(以office2003为例):

    ◆使用office2003安装软件的“添加或删除功能(A),更改已安装的功能或删除指定的功能”选项,安装该组件,单击下一步;

    ◆勾选“选择应用程序的高级自定义”选项,单击下一步;

    ◆打开“office工具”——“Microsoft Office Document Imaging”,选择安装“扫描、OCR和索引服务筛选器”和“Microsoft Office Document Image Writer”,单击更新;

    ◆最后重新启动计算机使更改生效,然后就能启动Microsoft Office Document Imaging。

    ②软件的淘宝网址http://www.wendangku.net/doc/0145aac108a1284ac850439d.html/item.htm?id=139********;

    关于该软件的使用方法,百度经验中有:

    http://www.wendangku.net/doc/0145aac108a1284ac850439d.html/article/af9f5a2df8c71b43150a456d.html;

    2012/05/17夜

    • 生活居家
    • 情感人生
    • 社会财经
    • 文化
    • 职场
    • 教育
    • 电脑上网