Photo by Unsplash, Bernd ?? Dittrich
納期約1ヵ月。デキソウニナイ。😵
したいこと
①FAXで届いた用紙をスキャン(この時点で文字は「テキスト」から「画像」にかわる)
②「画像」となった文字を読み取る
③CSVファイルにまとめる
です。
Pythonでできそうです。
というのは、PDFの「テキスト」を読み取り、CSVファイルにまとめるプログラムを書くことはできたからです。
次は「画像」化された文字の読み取りです。
読み取る用紙の種類は7種類程度。これ以外のものは超レアです。
各用紙の種類に合わせて、「画像」化された文字を読み取れるようにすればいいです。
読み取る「画像」化された文字の項目は、最大4項目です。
ただし、1枚の用紙に記載された件数は2件以上のこともあります。これは用紙によって最大件数を登録しないといけないですね。
PDFの「テキスト」読み取りのときも座標を指定して読み取りを実行しました。
今回も座標を使うことになるでしょう。
なんとなーくの要件定義はできました。
明日からがんばってみます。🤨
ブログ:1164

コメント