67677新澳门手机版 > 67677新澳门手机版 > Tesseract OCR
Tesseract OCR
2020-03-14 20:20

本文由码农网 – 邱康原创翻译,转发请看清文末的转发必要,招待参与大家的付费投稿陈设!

Tesseract OCR Tuitor

Optical Character Recognition (OC兰德酷路泽卡塔尔国即光学字符辨识是把打字与印刷文本转变到三个数字代表的经过。它有琳琅满指标其实应用–从数字化印制书籍、创制发票的电子记录,到车牌识别以致破解基于图像的验证码。

67677新澳门手机版,environment preparement

  1. get the tesseract dll, nuget from vs.
  2. get the test data, we can get it from github

67677新澳门手机版 1

Start to write a hello world

See code below.

 //  var image = new Bitmap(@"C:LearningSpaceTessnetOCRTestscreenshot.bmp");
            var image = Pix.LoadFromFile(@"C:LearningSpaceTessnetOCRTestscreenshot.bmp");
            var ocr = new TesseractEngine(@"C:LearningSpaceTessnetOCRTest","eng");
         //   ocr.SetVariable("tessedit_char_whitelist", "0123456789");
            var result = ocr.Process(image, Rect.Empty);
            Console.WriteLine(result.GetText());

Tesseract是三个能落到实处OCEscort的开源项目。你能在*Nix系统,Mac系统和Windows系统上运维这些项目,不过只要使用贰个库,大家就会在PHP项目中央银行使它了。本课程的指标是教您哪些运用。

安装

准备

为了让事情变得轻松和同等的, 咱们将运用设想机(本文使用Vagrant)来运维应用程序,那会涉嫌到安装PHP和Nginx,大家将安装Tesseract来分别演示进度。要是您想自身依据现存Debian-based系统安装Tesseract,你能够跳过下有个别—也许查看the README来收获在其他*nix上,Mac系统或然Windows的设置教导.

上一篇:没有了 下一篇:没有了