Jupyter Notebookで大量データを読み込む場合、見切れてしまう。
初期の分析段階では目視でチェックを行いたい部分も多々あるため、対処方法を整理。
対処方法
pandasの設定値を変更。
デフォルトでは行が60、列(カラム数)が20となっている。
data:image/s3,"s3://crabby-images/d77eb/d77eb8e1083346df7056b065aca7f0530cbe03f0" alt=""
このオプションの値を引き上げれば解決。
#行を変更
pd.set_option('display.max_rows', 100)
#列を変更
pd.set_option('display.max_columns', 100)
検証
import pandas as pd
# titanicデータを取得する
url = "https://raw.githubusercontent.com/datasciencedojo/datasets/master/titanic.csv"
df = pd.read_csv(url, encoding='UTF-8')
df_concat = pd.merge(df, df, on='PassengerId')
df_concat.head(100)
行列共に見切れる。
data:image/s3,"s3://crabby-images/9d058/9d05895bd932f8d3ffbd21ff45c0f72b76591881" alt=""
#上限を引き上げ
pd.set_option('display.max_rows', 100)
pd.set_option('display.max_columns', 100)
行列共に表示することができた。
data:image/s3,"s3://crabby-images/87e8e/87e8e8a98ce85a45766fb2afbc035cf62c0695a9" alt=""
コメント