Pandasで特定の列以外を取得して説明変数にしたい時の備忘録

教師あり学習をしたいときなんかがあります。 その時は目的変数のベクトルをyとかにして、説明変数の行列をXとかにしたい場合が多いと思います。 そういった時にnumpyと違って指定がめんどくさいpandasさんで簡単にXとyを指定する方法がこれです。

trainというデータテーブルがあり、その中のy列を目的変数yに、それ以外の列を説明変数Xとしています。

~
X = train.drop("y", axis=1)
y = train['y']
~

drop関数は引数inplaceをTrueにしなければ元のテーブルデータが維持されるので安全に使えますね。