教師あり学習と教師なし学習の違いについて
機械学習は、大きく分けて「教師あり学習」と「教師なし学習」に分けられます。
「教師あり学習」とは「入力データ」と「正解データ」がセットになった訓練データです。コンピュータに対して大量の「入力データ」と「正解データ」を投入することでコンピュータが入力データの特徴を読み取り、正解データを学習します。
「入力データ」に大量の画像データを投入し、「正解データ」に花や動物などのカテゴリを指定することで、特定の画像を見せたときそのカテゴリは花なのか動物なのかを判定することができます。
また、画像データ以外でも文章データなどを読み込ませ、ニュース記事なのかスポーツ記事なのかのカテゴリを分類することも可能です。
このように、「教師あり学習」とは通常は人間が教師役として「入力」と「正解データ」をコンピュータに与え、「入力」と「正解データ」をもとににコンピュータがそれらの特徴を学習していき、未知のデータについても判断できるようになります。
教師あり学習はさらに「識別」と「回帰」に分類されます。
「教師あり学習」の識別とは
「識別」とは画像データを与えた場合にそれがネコの画像なのか、イヌの画像なのかのカテゴリを判別することです。
画像認識のほかに迷惑メールかどうかを判断する迷惑メールフィルタやニュースドキュメント、スポーツ、芸能ドキュメントなどの文章カテゴリの識別を行うこともできます。
識別の例
迷惑メールフィルタ
メールの文章を与えることで、そのメールがスパムメールなどの迷惑メールなのか通常のメールなのかを分類することが出来ます。
入力:メール
出力:普通のメール、迷惑メール
ドキュメント分類
文章を与えることで、その文章がニュース記事なのかスポーツ記事なのかを判定することが出来ます。AIを使用しない場合は人の手によりその文章がどのカテゴリに属するかを判断しなければいけませんが、AIを使用することで人手を返さずに自動でカテゴリを識別することが可能です。
入力:ドキュメント
出力:ニュースドキュメント、スポーツ、芸能ドキュメント
ジェスチャー認証
人の体の動きや手の動きをセンサを使用してジェスチャーを判断することでそのジェスチャーが何を示しているかを判断することが出来ます。体感ゲームなどで用いられています。これらのジェスチャーはが今後スマートフォンや自動車などに組み込まれていくことで、新しい楽しみ方や安全な自動運転の技術が高まることが予想されます。
入力:センサ信号
出力:登録ジェスチャの種類
「教師あり学習」の回帰とは
「回帰」とは出力が株価予測や価格の予想というような、実数値を予想する場合に使用されます。株価予測として現在・過去の株価データを入力として与えることで今後の株価を予想することができます。株価ではなく価格についても同様に予想することができます。他にも顔画像データを与えることで、顔のイメージから年齢を推測することも可能となります。
回帰の例
株価予測
直近の株価データや1ヶ月前からの株価の推移、1年前からの株価の推移を与えることで、今後の株価を予想することが出来ます。株価の予想はAIの分野の中でも進んでいる技術であり、トレーダーがAIに置き換わったりもしています。
入力:株価、株式データ
出力:株価
価格予測
株価予測同様、価格予測についても行うことが出来ます。特に季節ものの食材の場合は季節により価格が上下する傾向があるため、コンピュータに傾向を教え込むことで価格の予想を行うことができます。
入力:価格、価格データ
出力:価格
教師なし学習とは
「教師なし学習」とは教師あり学習と異なり「正解データ」が与えられていません。コンピュータ自身がクラスタリングとよばれる共通項をもつクラスタに分けたり、頻出パターンを見つけ出す学習方法です。
あるスーパーマーケットの購買データから、平均購買年齢が高い商品や、季節によって売り上げが増加する商品を特徴をコンピュータ自らが学習し、自動的にマッピングします。このようなクラスタリングを行うことで、「おむつとビールが一緒に買われる場合が多い」など、一見相関関係がなさそうで実は隠れた頻出パターンについても見つけ出すことが可能になります。このようなクラスタはビックデータでの分析に使用されています。