[[OCR]] > [[Tesseract]]
- %% http://code.google.com/p/tesseract-ocr/ %%
- https://github.com/tesseract-ocr
-- https://github.com/tesseract-ocr/tesseract
- [[Tesseract.js]]
* . [#e35b71d0]
- Tesseract OCR 近況(2018/06)
-- https://a244.hateblo.jp/entry/2018/06/20/200000
- https://japan.cnet.com/article/20225107/
-- HPが開発したOCRエンジン「Tesseract」、グーグルの支援で公開に
>
Googleは、HP Labsによって20年も前に開発され、1995年にお蔵入りとなった「Tesseract」のバグを修正し、数カ月前にオープンソースコミュニティに公開していたことを発表した。
* 学習 [#n9c28a03]
- Tesseract 4.0で日本語の認識をチューニングしよう
-- https://qiita.com/masaoki/items/df665e285330d4da3cca
* 日本語 [#l34ee640]
- https://github.com/tesseract-ocr/tessdata/blob/master/jpn.traineddata
* . [#u5ff3b0f]
- 画像やpdfの文字認識を行うtesseractを検証してみる
-- http://nahareport.blogspot.jp/2018/05/pdftesseract.html
- Tesseract OCRに触ってみた
-- https://www.slideshare.net/takmin/tesseract-ocr
- TesseractOCR: An OCR add-on
-- https://addons.nvda-project.org/addons/tesseractOCR.ja.html
>
このアドオンはフリーなオープンソースのTesseract OCRエンジンを使用し、PDF, JPG, TIF, その他の画像ファイルの光学文字認識を、ファイルを開くことなく行ないます。
>
また、WIAが有効なスキャナーにアクセスして紙の書類にOCRを行なえるようになります。
- 画像grepツールを作ってみた
-- https://qiita.com/UTA_v005/items/d8bc4f84ef25c55fe0f3