【pythonスクレイピング】pandasでデータ構造の確認
こんな結果が得られます。
行見出しをあたえましょう
これは数学と英語のテストの成績なので、
だいぶデータとしてみやすくなりました。
・type(df)
データ型を表示します。
・df.info()
データ構造の情報を表示します。
こちらの結果から、オブジェクト型のデータであることがわかります。これで基本統計量をだしてみましょう。
df.describe()とすると
このような結果がえられます。もっと詳細なデータを得るためには、データ型をオブジェクト型からint型に変換します。
df = df.astype(int)としてデータを変換します。df.info()をみると、int型に変換されていることがわかります。ふたたび基本統計量を確認すると、
このように詳細なデータ得られました。
各データへアクセスするには、このようにします。
df.Aとしてもアクセス可能です
データ型をみると、series型であることがわかります。
この要領で以下のようなコマンドがあり、さまざまなデータの取得が可能です。
今回はここまでです。
もっとpandasについて学んでみたいひとは、
世界最大級のオンライン学習サイトUdemyから「Data Analysis in Python with Pandas」を探してみてください。
ではでは!