主にプログラミングに関して。Python, .NET Framework(C#), JavaScript, その他いくらか。
記事にあるサンプルやコードは要検証。使用に際しては責任を負いかねます

スポンサーサイト

                
tags:
上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

PyTesserを入れてみた python OCR

                
tags:
OCRを試してみたかったので、PyTesserを入れた。

使えるまでの手順(Win7 64bit, Python2.6)
1.公式からzipを落として解凍。
http://code.google.com/p/pytesser/downloads/list

2.依存ファイル、フォルダの計5つ(pytesser. py,util.py, errors.py, tesseract.exe, tessdata/)を"python26\Lib\site-packages"にコピー。

3.下のコードを実行(デスクトップには手順1で解凍したものがそのまま残っている、ディレクトリのユーザー名は書き換え必須)。
from pytesser import *
import os
os.chdir(r'C:\Users\xxx\Desktop\pytesser_v0.0.1')
image = Image.open(r'C:\Users\xxx\Desktop\pytesser_v0.0.1\fnord.tif')
print image_to_string(image)


↓インタープリタの出力でfnordと出ている。成功。
110826.jpg

余談.
errors.py, util.pyはありふれた名前だったのでそれぞれteserrors.py, tesutil.pyに変更した。それに伴ってpytesser.pyで使われるクラス名も変更した。この手順は必須ではない。
公式でのお試しスクリプトには↑のスクリプトのディレクトリ移動は入っていない。入れずにトライしたら"IOError: [Errno 13] Permission denied: 'temp.bmp'"と出たので、os.chdirでディレクトリを移動して再チャレンジした。
            

コメントの投稿

非公開コメント

プロフィール

Matoba

Author:Matoba

最新記事
リンク
作ったものなど
月別アーカイブ
カテゴリ
タグリスト

検索フォーム
Amazon
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。