清华紫光OCR(TH-OCR)是款专业的图象汉字识别软件,该软件它可以幫助你直接把图片信息“挖”出去,软件支持从TIF、BMP和PCX图片文件格式中读取文字內容,支持简/繁体版、英文和笔写中英,尽管不能确保所有能读取(特别是在文字靠近外框,较为非常容易出错),但最少绝大多数能读取正确。欢迎下载!
文件->打开,选择要识别的文件,可以是tif、bmp、jpg格式的。
命令->识别,会自动识别的。
识别完成后,软件左边的树状栏里会有图像文件名,用鼠标点开哪个加号,就是识别后的文本文件。
单击它,软件右边上方是识别后的文本,下方是被识别的图像文件。
这时用键盘移动光标,就能查看图像和对应文本,并能直接改动文本。
二值图像就是只有黑白两色的图像,用windows自带的画图软件就能做出来。
先用画图打开图像,图像->属性,将颜色改成黑白,再存盘就得到二值图像了。
清华紫光OCR(TH-OCR)是一款拥有完全知识自主产权的图像汉字识别软件,本软件由清华大学1985年开始研发,对中日韩文与英文混排文档的识别水平超过国外同行效果。它的使用很简单,用鼠标框住你要“挖”出来的文字,点“识别(就是那个眼镜一样的图标)”,文字就这样简单的出来了,你可以直接复制或者是保存为文本文档,还是很方便的。