「 scikit-learn 」 一覧
-
Scikit-Learnの識別器をループで一気に適用させる
2019/1/27 AI, Python, scikit-learn, アヤメ機械学習, 機械学習
Scikit-Learnの識別器をループで一気に適用させる 今回はScikit-Learnを用いて様々な識別器を一括で適用してみます。 普通、Scikit-Learnで識別器を試す場合、一つ一つの識別 ...
-
Pythonでのデータ分析:スケーリングを行う
2018/12/9 scikit-learn, データ分析, 機械学習
スケーリングとは何か 統計や機械学習で扱うデータ分析の前処理では"正規化"や"標準化"がよく使用されます。 "正規化"や"標準化"を行っておらず、体重、身長、年齢など複数の異なる特徴量をそのまま扱って ...
-
SckitLearnでグリットサーチを行いパラメータを最適化する
2018/7/7 AI, scikit-learn, 癌の識別
SckitLearnでグリットサーチを行いパラメータを最適化する グリットサーチとは グリットサーチとは英名でGridSerchと呼ばれハイパーパラメータの最適化を行う機能です。 ハイパーパラメータと ...
-
Cross Validationを使用して癌の識別を行ってみる
2018/5/18 AI, scikit-learn, 機械学習
Cross Validationを使用して癌の識別を行ってみる 今回はCross Validation(クロスバリデーション法)を使用して癌の識別を行ってみたいと思います。 Cross Validat ...
-
機械学習、ディープラーニングでの学習データとテストデータの分割手法について
2018/5/18 AI, scikit-learn, ディープラーニング, 機械学習
機械学習、ディープラーニングでの学習データとテストデータの分割手法について 機械学習、ディープラーニングではモデルの精度を高めることが非常に大切です。 モデルの精度を高めるためには手持ちのデータを用い ...
-
sklearnのCountVectorizerを用いて単語の出現頻度を数えてみる
2018/5/18 AI, scikit-learn, 機械学習
sklearnのCountVectorizerを用いて単語の出現頻度を数えてみる。 今回は単語の出現頻度を数えてみます。単語の出現頻度とは文章中に出てくる単語について何回使用されたかをカウントするもの ...
-
3種類のワインの科学的特徴を行ってみる-決定木
2018/5/18 AI, scikit-learn, 機械学習
3種類のワインの科学的特徴を行ってみる(決定木) 機械学習として3種類のワインの科学的特徴を決定木を用いて行っていきます。 3種類のワインの科学的特徴はscikit-leanで用意されているデータセッ ...
-
pandasで欠損値NaNを削除置換する
2018/5/18 AI, scikit-learn, 機械学習
pandasで欠損値NaNを削除、置換(最小、平均、最大)する 医療用データの未検査項目やアンケート調査データの無回答項目のように、欠損値が存在するデータは多数存在します。機械学習を行う上でも欠損値が ...
-
あやめの識別を行ってみる(決定木)
2018/5/18 AI, scikit-learn, 機械学習
あやめの識別を行ってみる(決定木) 機械学習としてあやめの分類を決定木を用いて行っていきます。 あやめの分類とは機械学習として有名な分類方法の試験であり、あやめを構成する4つの属性(がく片の長さ、がく ...
-
ダミー変数の作り方と注意点について
2018/5/21 AI, scikit-learn, 機械学習
Alexas_Fotos / Pixabay ダミー変数とは ダミー変数とはカテゴリー型のデータを0/1で表現し直す変数のことです。 例えば職業のカテゴリとして、1.事務系、2.医療・看護系・・・6 ...
-
scikit-learnの機械学習でロジスティック回帰を行い癌の陽性を判断する
2018/9/5 AI, scikit-learn, 機械学習
scikit-learnの機械学習でロジスティック回帰を行い癌の陽性を判断する scikit-learnを使用した機械学習で、ロジスティク回帰を使用した癌の判定プログラムを行ってみます。 使用するデー ...
-
scikit-learnのtrain_test_split関数を使用してデータを分割する
2018/5/17 AI, scikit-learn
scikit-learnのtrain_test_split関数を使用してデータを分割する scikit-learnに含まれるtrain_test_split関数を使用するとデータセットを訓練用データと ...