OCR > Tesseract
Googleは、HP Labsによって20年も前に開発され、1995年にお蔵入りとなった「Tesseract」のバグを修正し、数カ月前にオープンソースコミュニティに公開していたことを発表した。
このアドオンはフリーなオープンソースのTesseract OCRエンジンを使用し、PDF, JPG, TIF, その他の画像ファイルの光学文字認識を、ファイルを開くことなく行ないます。 また、WIAが有効なスキャナーにアクセスして紙の書類にOCRを行なえるようになります。