AIプログラミング

Excelから読み出したデータを元に機械学習を行ってみる

投稿日:

Excelから読み出したデータを元に機械学習を行ってみる

機械学習を行う場合、ある一定規模のデータが必要となりますが、そのデータはExcelの形式で保存しているというケースは多いかと思います。

また、機械学習のやり方を勉強するためにサンプルソースを入力してみたものの、既に存在するExcelの形式のファイルを元に機械学習の勉強を行いたいというケースも多いかと思います。

そこで、今回はExcelから読み出したデータを元に機械学習を行ってみます。

Excelのデータとして、別記事にてskit-learn上のアヤメのデータをExcel形式に保存しているので、そのデータを使用して行っていきたいと思います。

Pandas形式のデータをExcel形式に変換する

使用するExcel

前提:
ファイル名:iris_data.xls
シート名:target

このExcelはプログラムを実行するパスと同一の直下に格納しておいてください。

データの中身は以下のようになっています。

1.エクセルデータ

B列~E列までは属性データで、F列(Target)は目的変数とします。

ソースコード

エクセルデータを入力します。ファイル名はiris_data.xls、シート名はtargetを指定しています。
2.Pandasデータ

実際に読み込んだデータを表示しています。Excelのデータと同じような構造で格納されています。

属性用と目的変数用にデータを分割するため、df_X(属性用)とdf_Y(目的変数用)の2つのデータフレームにコピーします。その後不要な列を削除していきます。

属性データにTargetの列は不要となるので、列を削除します。axis=1とは列を示しています。

3.Pandas(属性)データ)

一旦表示してみましょう。期待通りのデータとなっています。

目的変数のみ取り出すため、その他の不要な列は削除しています。

4.Pandas(目的変数)データ

一旦表示してみましょう。期待通りのデータとなっています。これらの手順にてExcelから読み込んだデータはPandasのデータとして格納されています。この後は通常の機械学習の手順と同一になります。

訓練データと評価用データに分割します。今回は8:2で分割することにします。

ロジスティック回帰を用いて機械学習を行っていきます。

評価の実行です。今回の正答率は93%でした。

このようにExcelから読み出したデータについても機械学習を行うことができました。Excelを使用したデータを用いて機械学習を行う場合はほぼ同一の手順で実行することができるので、持っているExcelデータを用いていろいろ試してください。

 

 

-AIプログラミング
-,

Copyright© AI人工知能テクノロジー , 2019 All Rights Reserved.