Pythonでウェブサイトからデータを入手する(2)

python Python

大枠は決まりました。
では、その大枠を図示します。
ざっくりの流れを書いておきます。

全体の流れはこんな感じです。

フローチャート

簡単なフローチャートを書くだけで、整理ができますね。
何が必要であるかが理解できれば、あとはプログラムを書くのみです!

Atomを使い、プログラムを書きます。
今回使ってみて、便利だなと思いました。
カッコなどは開始カッコを入れると、終了カッコを自動で入力してくれます。
Pythonでは重要なインデントも自動で制御してくれます。

スクレイピングに使うライブラリをインポート

Pythonではプログラムでライブラリを利用するさい、プログラムの開始でインポートをします。

import requests
from bs4 import BeautifulSoup

ウェブページにアクセスするためのrequests、ウェブページから必要なデータを取得するBeautifulSoupを、それぞれインポートします。

作業を繰り返す部分:for文

まず、プログラムの大枠を作ります。
前回の記事で書いたように、URLを構成する数字12桁の最小値から最大値までの間、作業を繰り返します。
そこでfor文を利用します。

————————————————————
for (変数) in range(開始値, 終了値, ステップ)
————————————————————

rangeは関数です。
引数として指定した「開始値」から「終了値」の未満までの整数値を「ステップ」ごとに表示します。

<「終了値」の未満まで>に要注意です。
例えば、開始値=1、終了値=5、ステップ=1の場合、range関数は、1・2・3・4を表示します。
つまり、終了値の指定は、表示したい終了値+1で指定する必要があります。

というわけで、(3)に続きます。

コメント

タイトルとURLをコピーしました