Photo by Unsplash, Sihang Chen
昨日までである程度整理はできました。
方針は決まったので、具体的方法をまとめます。
これからすること:第1弾
①第3回NDBオープンデータから第10回NDBオープンデータで開示されている次のデータを取得
【初診】都道府県性年齢別算定回数
【再診】都道府県性年齢別算定回数
【外来診療料】都道府県性年齢別算定回数
【オンライン診療】都道府県性年齢別算定回数
(「オンライン診療」はあまり過去にはないかもしれない。)
②第3回NDBオープンデータから第10回NDBオープンデータで開示されている次のデータを取得、7/3(木)の記事のQ7-A7にあるような算定回数の確認を実施
昨日の記事では第3回の結果のみ紹介しています。第4回以降も確認します。
初再診料_性年齢別算定回数
入院基本料_性年齢別算定回数
③①のデータを編集
①のデータはクロス集計表です。
(↓第10回【初診】都道府県性年齢別算定回数です。)
これだと集計しづらいので「単純な表」にします。
イメージはこんな感じです↓
Pandasでもクロス表→単純な表への変換(「アンピボット化」)は可能だそうです。
でも、データが多い場合は、Pandasに投入する前に、このような処理をしておくほうがよいとのアドバイスをきつねのミカさん(=Copilot)よりいただきました。
③の処理はExcelVBAで行いましょう。
Pythonの課題なので、本来はpandasでするほうがいいのでしょうけど、ちゃっちゃっとできることを考えたいです。
というわけで、まずはここまでをやってみましょー。😊
コメント