ふってわいたお題

活動日報

Photo by Unsplash, Bernd ?? Dittrich

納期約1ヵ月。デキソウニナイ。😵

したいこと

①FAXで届いた用紙をスキャン(この時点で文字は「テキスト」から「画像」にかわる)
②「画像」となった文字を読み取る
③CSVファイルにまとめる

です。
Pythonでできそうです。
というのは、PDFの「テキスト」を読み取り、CSVファイルにまとめるプログラムを書くことはできたからです。
次は「画像」化された文字の読み取りです。

読み取る用紙の種類は7種類程度。これ以外のものは超レアです。
各用紙の種類に合わせて、「画像」化された文字を読み取れるようにすればいいです。

読み取る「画像」化された文字の項目は、最大4項目です。
ただし、1枚の用紙に記載された件数は2件以上のこともあります。これは用紙によって最大件数を登録しないといけないですね。

PDFの「テキスト」読み取りのときも座標を指定して読み取りを実行しました。
今回も座標を使うことになるでしょう。

なんとなーくの要件定義はできました。
明日からがんばってみます。🤨

にほんブログ村 教育ブログへ にほんブログ村 教育ブログ 在宅学習・通信教育へ にほんブログ村 大学生日記ブログ 社会人大学院生へ にほんブログ村 大学生日記ブログ 通信大学生(放送大学)へ ブログランキング・にほんブログ村へ

ブログ:1164

コメント

タイトルとURLをコピーしました