データ分析でよく使う関数について微備忘録としてまとめています。
isnull関数
データの欠損値の確認に使う。
欠損の有無をTrue(欠損有り)、またはFalse(欠損無し)として返す。
# データフレームdfの欠損値を調べ、最初の5行を表示する
print(df.isnull().head(5))
# データフレームdfの各列に欠損値がいくつ存在するかを確認する場合sum関数を使う
print(df.isnull().sum())
# データフレームdfの欠損値を含む行を抽出
# any(axis=1)は、一行毎にTrueの存在の有無を調べるコマンド
print(df[df.isnull().any(axis=1)])
欠損値への対応は、基本的に「削除」か「値の代入」のどちらか。
No responses yet