ふってわいたお題

活動日報

2026.03.05

納期約1ヵ月。デキソウニナイ。😵

したいこと

①FAXで届いた用紙をスキャン(この時点で文字は「テキスト」から「画像」にかわる)
②「画像」となった文字を読み取る
③CSVファイルにまとめる

です。
Pythonでできそうです。
というのは、PDFの「テキスト」を読み取り、CSVファイルにまとめるプログラムを書くことはできたからです。
次は「画像」化された文字の読み取りです。

読み取る用紙の種類は7種類程度。これ以外のものは超レアです。
各用紙の種類に合わせて、「画像」化された文字を読み取れるようにすればいいです。

読み取る「画像」化された文字の項目は、最大4項目です。
ただし、1枚の用紙に記載された件数は2件以上のこともあります。これは用紙によって最大件数を登録しないといけないですね。

PDFの「テキスト」読み取りのときも座標を指定して読み取りを実行しました。
今回も座標を使うことになるでしょう。

なんとなーくの要件定義はできました。
明日からがんばってみます。🤨

ブログ：1164