「 scikit-learn 」 一覧

AIプログラミング

Scikit-Learnの識別器をループで一気に適用させる

Scikit-Learnの識別器をループで一気に適用させる 今回はScikit-Learnを用いて様々な識別器を一括で適用してみます。 普通、Scikit-Learnで識別器を試す場合、一つ一つの識別 ...

データ分析

Pythonでのデータ分析:スケーリングを行う

スケーリングとは何か 統計や機械学習で扱うデータ分析の前処理では"正規化"や"標準化"がよく使用されます。 "正規化"や"標準化"を行っておらず、体重、身長、年齢など複数の異なる特徴量をそのまま扱って ...

AIプログラミング

SckitLearnでグリットサーチを行いパラメータを最適化する

2018/7/7    , ,

SckitLearnでグリットサーチを行いパラメータを最適化する グリットサーチとは グリットサーチとは英名でGridSerchと呼ばれハイパーパラメータの最適化を行う機能です。 ハイパーパラメータと ...

AIプログラミング

Cross Validationを使用して癌の識別を行ってみる

2018/5/18    , ,

Cross Validationを使用して癌の識別を行ってみる 今回はCross Validation(クロスバリデーション法)を使用して癌の識別を行ってみたいと思います。 Cross Validat ...

コラム

機械学習、ディープラーニングでの学習データとテストデータの分割手法について

機械学習、ディープラーニングでの学習データとテストデータの分割手法について 機械学習、ディープラーニングではモデルの精度を高めることが非常に大切です。 モデルの精度を高めるためには手持ちのデータを用い ...

AIプログラミング

sklearnのCountVectorizerを用いて単語の出現頻度を数えてみる

2018/5/18    , ,

sklearnのCountVectorizerを用いて単語の出現頻度を数えてみる。 今回は単語の出現頻度を数えてみます。単語の出現頻度とは文章中に出てくる単語について何回使用されたかをカウントするもの ...

AIプログラミング

3種類のワインの科学的特徴を行ってみる-決定木

2018/5/18    , ,

3種類のワインの科学的特徴を行ってみる(決定木) 機械学習として3種類のワインの科学的特徴を決定木を用いて行っていきます。 3種類のワインの科学的特徴はscikit-leanで用意されているデータセッ ...

AIプログラミング

pandasで欠損値NaNを削除置換する

2018/5/18    , ,

pandasで欠損値NaNを削除、置換(最小、平均、最大)する 医療用データの未検査項目やアンケート調査データの無回答項目のように、欠損値が存在するデータは多数存在します。機械学習を行う上でも欠損値が ...

AIプログラミング

あやめの識別を行ってみる(決定木)

2018/5/18    , ,

あやめの識別を行ってみる(決定木) 機械学習としてあやめの分類を決定木を用いて行っていきます。 あやめの分類とは機械学習として有名な分類方法の試験であり、あやめを構成する4つの属性(がく片の長さ、がく ...

AIプログラミング

ダミー変数の作り方と注意点について

2018/5/21    , ,

Alexas_Fotos / Pixabay ダミー変数とは ダミー変数とはカテゴリー型のデータを0/1で表現し直す変数のことです。 例えば職業のカテゴリとして、1.事務系、2.医療・看護系・・・6 ...

Copyright© AI人工知能テクノロジー , 2019 All Rights Reserved.