AIプログラミング

ボストン市の住宅価格を調べてみる

更新日:

ボストン市の住宅価格を調べてみる

scikit-learnのデータを用いてボストン市の住宅価格を調べてみます。今回は回帰の分類となります。犯罪発生数や住居の平均部屋数などの10数個のデータより、ボストン市の住宅価格を求めます。全学習データは506件ですが、そのうち学習用に8割、残り2割を評価用に用います。

使用するデータ

全データ :506件 (学習用:404件)
属性データ:14件

CRIM 人口 1 人当たりの犯罪発生数
ZN 25,000 平方フィート以上の住居区画の占める割合
INDUS 小売業以外の商業が占める面積の割合
CHAS チャールズ川によるダミー変数 (1: 川の周辺, 0: それ以外)
NOX NOx の濃度
RM 住居の平均部屋数
AGE 1940 年より前に建てられた物件の割合
DIS 5つのボストン市の雇用施設からの距離
RAD 環状高速道路へのアクセスしやすさ
TAX $10,000 ドルあたりの不動産税率の総計
PTRATIO 町毎の児童と教師の比率
B 町毎の黒人 (Bk) の比率を次の式で表したもの。 1000(Bk – 0.63)^2
LSTAT 給与の低い職業に従事する人口の割合 (%)
MEDV 所有者が占有している家屋の$ 1000単位の中央値

ソースコードの流れ

1、準備作業
2、学習用データの読み込み
3、学習用データの確認
4、学習用データの分割
5、学習
6、評価

ソースコード

ソースコードです。ソースコードの詳細は後で説明します。

ソースコードの詳細

準備作業

scikit-learnからロンドンの住宅価格データをインポートします。今回は線形回帰モデルを利用するのでlinear_modelをインポートします。またデータを分割するためにtrain_test_splitについてもインポートします。

学習用データの読み込み

先ほどインポートした住宅価格データを読み込みます。

学習用データの確認

データの詳細をも見込んでいます。今回のデータが14個の属性と506個のデータを持っていることが分かります。
pandasを用いてロンドンの住宅データを表形式にしています。
住宅価格のデータです。単位は$1000です。

学習用データの分割

データを学習用8割、評価用2割に分割しています。
学習用が404件となりました。
評価用が102件となりました。

学習

線形回帰を用いて学習していきます。

評価

評価用の用いる住宅データを表示しています。
住宅価格の推定値が表示されました。

 

-AIプログラミング
-

Copyright© AI人工知能テクノロジー , 2020 All Rights Reserved.