这是tesseract-ocr-setup-3.02.02.exe 官方绿色版(bǎn)下载,是款功能非常强大的(de)图像识别类库;这款(kuǎn)软件一开始是(shì)由惠普进(jìn)行开发的,画面成为了Open source,而(ér)且软(ruǎn)件(jiàn)推(tuī)出之后,成绩一直都是(shì)相当的(de)理想,不(bú)过由(yóu)于时间的不断增加,软件也就(jiù)越来越显得力不从心,不过(guò)软件的许多的功能还是相(xiàng)当的(de)不错(cuò)的,而且拥(yōng)有的一些技术也是相(xiàng)当的超前,使它一直的都在不断的(de)保(bǎo)持(chí)着竞(jìng)争力;软件的操作简单,运(yùn)行稳定,需要(yào)的朋友千万不要错过!
光学字(zì)符识别(OCR,Optical Character Recognition)是指对文本(běn)资料进(jìn)行扫(sǎo)描,然(rán)后对图像(xiàng)文件进行(háng)分析处理,获取(qǔ)文(wén)字及版面(miàn)信息的过程。OCR技术非常专(zhuān)业,一(yī)般多是印刷、打印行业的从业(yè)人(rén)员(yuán)使用(yòng),可以快速(sù)的(de)将纸(zhǐ)质资料转换为电子资(zī)料。目前国内水平(píng)较高的中文ocr有(yǒu)清(qīng)华文(wén)通、汉(hàn)王、尚书等,其产品各有(yǒu)千秋,价格不菲。国外(wài)OCR发展较(jiào)早,像一些大公司,如IBM、微软(ruǎn)、HP等(děng),即使没(méi)有推出单独的OCR产品,但是他(tā)们的研发团队早(zǎo)已掌握核(hé)心技术,将OCR功能植入了自身的(de)软件系(xì)统(tǒng)。对于一般的程序员来说,一般用不(bú)到那么高级(jí)的,主要在开发中能够(gòu)集成基本的OCR功能就(jiù)可以了。
Microsoft Visual C++ 2005 SP1 Redistributable Package (x86) (VC2005运行库下载)安装在未安装 Visual C++ 2005 SP1 的计算机上(shàng)运行使用 Visual C++ 开(kāi)发的应用程序所需的(de) Visual C++ 库的(de)运行时组件。
VC2005运(yùn)行(háng)库安装 C Runtime (CRT)、Standard C++、ATL、MFC、OpenMP 和 MSDIA 库的运行时组(zǔ)件。对于支持(chí)并行部署模式的库(CRT、SCL、ATL、MFC 和 OpenMP),这(zhè)些运行(háng)时(shí)组件安装在支(zhī)持并行程序集的 Windows 操作系统版(bǎn)本的本机程序集缓(huǎn)存中,这一缓存也称为 WinSxS 文件夹。
托管所有代(dài)码(mǎ)
存(cún)储库(kù)帮(bāng)助您将代码(mǎ)保存在一个位置,即(jí)使您使用SVN或使用Git LFS处理大文件(jiàn)也是如此。
由于所有GitHub计划都包(bāo)含无(wú)限的私有存储库,您(nín)可以(yǐ)根据需要创建或导入任意数量的(de)项目。自信(xìn)地进行更改
以精确的(de)提交(jiāo)更改代码,以(yǐ)便(biàn)您可以快速搜(sōu)索修订历史(shǐ)记录中的每(měi)个提交消息以查找更改。
使(shǐ)用(yòng)blame视图来跟踪更改(gǎi),并发现您(nín)的文件和(hé)您的代(dài)码(mǎ)基础是如何演变(biàn)的。包和发布(bù)代码(mǎ)
当您准备好分享(xiǎng)时(shí),您可以将最近关闭的里(lǐ)程(chéng)碑(bēi)或完成的项目的更改(gǎi)打(dǎ)包到(dào)新版(bǎn)本中。
草拟和发(fā)布(bù)发行(háng)说明,发布预发布(bù)版本(běn),附件,并直接(jiē)链接到最(zuì)新的(de)下载。
数年以后,HP意识到,与其将Tesseract束之高阁,不如贡献给开源软件业,让其重焕新生--2005年,Tesseract由美(měi)国内华(huá)达州信(xìn)息技术研究(jiū)所获得,并求诸于Google对Tesseract进行改进、消除Bug、优化工作。
Tesseract目前已作为开(kāi)源项目(mù)发布(bù)在Google Project,其(qí)项目主页在这(zhè)里查看,其最新版本3.0已经支持中文OCR,并提(tí)供了一个命(mìng)令行工具。
不像其他OCR引擎(例如美国(guó)邮政业用于分类邮件的),Tesseract不(bú)能识别手写,而(ér)且只能识别一(yī)共大约64中字体的文本。
Tesseract需要一些处理来(lái)改善OCR结果,图像需要被放缩,图像有(yǒu)非常(cháng)多(duō)的差异,另(lìng)外还有水平排布的文字。
最后,Tesseract仅(jǐn)仅支持Liuux,Windows,Mac OS X。
