Pythonで標準化とか中心化はどうやってやるんだろうという話です.
結論だけ書きます.(そのうち合間を見て加筆します)
このページではこういうデータを使います
標準化
from scipy import stats x = df.iloc[:, 2:6].apply(stats.zscore, axis=0) x.head()
標準化されているかを調べます
平均ほぼ0,分散(標準偏差)ほぼ1
中心化
y = df.iloc[:, 1].apply(lambda v:v-df.iloc[:, 0].mean() ).astype(float) y.head()