Sobre Tesseract

Tesseract.js é uma biblioteca javascript que recebe palavras em quase qualquer idioma fora de imagens. O motor Tesseract OCR foi um dos três melhores motores do teste de precisão UNLV de 1995. Entre 1995 e 2006 teve pouco trabalho feito sobre ele, mas é provavelmente um dos motores OCR de código aberto mais precisos disponíveis. O código fonte irá ler uma imagem binária, cinza ou colorida e texto de saída. Um leitor de tiff é construído em que irá ler imagens TIFF não compactadas, ou libtiff pode ser adicionado para ler imagens compactadas. Existem arquivos de linguagem para muitas línguas, mesmo para texto definido em Fraktur e blackletter typefaces.

Categorias

  • Free
  • Open Source
  • Paid
  • Office & Productivity