Pandas形式のデータをCSV形式に変換する
Pythonには便利なライブラリがそろっており、それらのライブラリを効果的に使用することで簡単に様々な機能を実現することができます。Pandasもその一つのライブラリであり、表形式でデータを管理できるデータフレームの機能が備わっています。
今回はPandasで整形したデータについてCSVに出力してみます。
サンプルとしてsikit-learnにて提供されているでのアヤメのデータをCSVで出力します。
ソースコード
1 2 |
from sklearn import datasets data = datasets.load_iris() |
1 2 |
from pandas import Series,DataFrame import pandas as pd |
1 2 3 |
#データフレームの設定(あやめのデータ (目的変数を除く)) df = DataFrame(data.data) df.columns = data.feature_names |
1 2 |
#データフレームの中身を表示 df.head() |
1 2 |
#データフレームの設定(目的変数の追加) df['Target'] = data.target |
目的変数についても追加してみます。
1 2 |
#データフレームの中身を表示 df.head() |
データを一旦表示してみます。目的変数が追加されていることが分かります。
1 2 |
# エクセルの出力ファイル名を指定 csv_writer = df.to_csv('iris_data.csv') |
to_csv関数を用いてCSV形式に変換しています。
同じような手順でsikit-learnで提供されているデータや、自作したデータについてCSV形式に変換することが可能なのでいろいろ試してみてください。