機械学習で使用されている人気のソフトウェアについて
機械学習を始めて行う場合など、何のソフトウェアを用いて行うか悩む人が多いかと思います。
一般的に機械学習を行う方法は、商用のソフトウェアを使用する、各企業で公開されているAPIを使用する、ソニーのNNCのようなGUIを用いてみる、Pythonのようなプログラミング言語を書いて実装するなど様々な選択肢があります。
ちなみにこのサイトではPythonを用いて機械学習やディープラーニングを実装しています。
ではどのようなソフトウェアが人気なのでしょうか?
2015年~2017年にかけてデータサイエンスや機械学習を行うために使用されたソフトウェアについての調査結果がkdnuggets社より公開されているのでで引用させて頂きます。
kdnuggets社調べ
https://www.kdnuggets.com/2017/05/poll-analytics-data-science-machine-learning-software-leaders.html
1位:Python
機械学習やディープラーニングで1番人気のソフトウェアはPythonです。Pythonは文法がシンプルで習得しやすいという特徴がある一方で、統計学や図形描画での豊富なライブラリを持っており、機械学習やディープラーニングに最適な言語となっています。
2016年から急激に伸びてきており、2017年には50%以上のユーザが使用しています。これは機械学習やデータサイエンスを行う人の半分がPythonを使用して実装しているということを示しています。
2位:R言語
2位はR言語です。R言語とは統計解析用のソフトウェアであり、統計解析用のパッケージが豊富に備わっています。Pythonがここまで伸びてくる前には、機械学習といったらR言語というような不動の地位を確立していました。
3位:SQL
3位はSQLです。SQLはRDBMS(Relational DataBase Management System)の管理や操作を行うための人工言語の一つです。データサイエンスの分野のデータ解析の主流なソフトとして使用されています。
その他にもExcelなどデータを扱うソフトウェアがランクインしています。
では、何故Pythonがこれほど人気が高いのでしょうか?
Pythonが人気の高い理由
kdnuggets社ではPythonが人気の高い理由として6つの紹介しています。
- コミュニティが活発化している
- 企業スポンサーが存在する
- 大規模データを扱える
- 豊富なライブラリを使用できる
- 信頼性が高く効果がある
- 習得に用意が言語である
Pythoはライブラリが非常に豊富であり、数値計算、科学計算、画像処理、機械学習などの演算関連のライブラリが非常に充実しています。それらのライブラリは簡単に使用することができます。それに加えてPython自体の言語もコードが読みやすく習得が容易がプログラム言語となっています。これらのことが、使用ユーザーの参入を増やし、コミュニティの活発化につながり、更にユーザを増加させる理由となっています。
また、GooGle社では自社のアプリケーションをPythonで開発しており、その点からも品質が保証されている言語といえます。
このように現在では半分以上がPythonを使用しており、これから機械学習やデータサイエンスを始める場合はPythonを使用することがお勧めです。