【ヘルスケアデーア】applehealthdata.pyで書き出した歩数データ「StepCount.csv」の中身

前回の記事では、ヘルスケアアプリから書き出したファイルとapplehealthdata.pyを使って、歩数計データ「StepCount.csv」を書き出しました。

最終的には歩数計データをグラフ化したいのですが、

今回は、グラフ化するにあたって、どんなデータが入っているのか、そのファイルの中身について見ていこうと思います。

前回の記事はこちら。

applehealthdata.pyを実行した際の「'xml.etree.ElementTree.Element' object has no attribute 'getchildren'」エラー解決方法
iPhoneのヘルスケアアプリで歩数を自動記録しているので、そのデータをパソコンで分析(1日の平均歩数の変化など)したいと思い、パソコンへ移動させることにしました。 ヘルスケアアプリからデータをエクスポートするには、 ヘルスケアアプリを起動...

さて、StepCount.csvをMacのNumbersアプリで開いてみた様子が以下のようになります。

ヘルスケアの歩数計データ「stepcount.csv」

列は全部で9列、行は全部で112,643行もありました。(2014年〜2021年で)

列の内容としては、

  • sourceName
  • sourceVersion
  • device
  • type
  • unit
  • creationDate
  • startDate
  • endDate
  • value

の9つでした。

sourceNameやsourceVersionやdeviceは記録した端末に関する情報です。

自分の場合はiPhoneの他にウェアラブル端末「Mi Fit」のデータも一時期ありました。

typeはすべてStepCount、unitはすべてcountでした。

時刻の列が3つ(creationDate、startDate、endDate)あって、1日の中でも細かい間隔で記録されていました。

valueが歩数になります。

1日の歩数の推移グラフを作る上では、

  • startDate(時刻・日付)
  • value(歩数)

の2つのデータが有れば良さそうですね。

(時刻のデータは3つありますが、どれか1つを選べば良い。日付をまたぐ記録があったとしても、startDate(記録開始時刻)をその日のデータとして使えばよい。多少の誤差は気にしない。)

ただ、このままだと同じ日にいくつものデータが含まれてしまってグラフ化することができません。

(上で載せた画像では、2014年12月12日でいくつのデータに分かれているの?!って話です。)

同じ日の歩数はまとめて合計して上げる必要があります。

その方法については次の記事で紹介していきます。

次の記事↓

DataFrameで同じ日付を合計する方法
前回の記事では、iPhoneのヘルスケアデーアをapplehealthdata.pyでわかりやすく書き出した歩数データ「StepCount.csv」の中身について紹介しました。 今回の記事で何を紹介するかというと、1日の歩数データが複数にわ...

コメント

タイトルとURLをコピーしました