2016.08.02 Tue |
機械学習の目的・流れ
機械学習の目的
自動的にデータの規則性を見つけ出し、自動的にデータを分類することです。

例えば、多くの動物の画像から自動的に犬の画像に共通する特徴を見つけ出し、犬の写真は犬と分類するといったことが挙げられます。

これを発展させていくとデータから正常な状態に共通する規則性を見出し、次に得られたデータが正常か正常じゃないのか判定する異常検知を行うことができます。

機械学習の流れ
・「訓練→汎化」
訓練とは今あるデータを使って規則性を見出すことです。
汎化とは次に得られたデータを分類することです。

犬の画像の例で言うと、犬の画像に共通する特徴を見出すのが訓練、次に渡された画像が犬か犬じゃないか判断するのが汎化です。
・「訓練データの特徴抽出→訓練→次に得られるデータの特徴抽出→汎化」
実は、全データに対する特徴抽出という段階が「訓練→汎化」の前に入ってきます。特徴抽出とはデータを変換してコンピュータが分類をしやすい形に変えてあげることです。
犬の画像の例では犬と犬でない部分の境界を線で示したり、そもそもの画像の大きさや向きを統一してからコンピュータに学習させたりします。
すなわち、犬らしさを表す特徴がわかりやすいようにしてからコンピュータに分類させるのです。

よって「訓練データの特徴抽出→訓練→次に得られるデータの特徴抽出→汎化」という流れで機械学習を行うことになります。
・ディープラーニングの革新性
上で説明しました特徴抽出を上手に行えば行うほど分類(学習)の精度は向上します。裏を返すといい分類ができるかどうかは特徴抽出によるところが大きいのです。
この特徴抽出は以前まで人が課題に応じたノウハウを使って行ってきました。
しかし、近年注目されているディープラーニングではこの特徴抽出をコンピュータが自動的に行うことができます。すなわち、犬らしさを表す特徴が何なのかをコンピュータ自律的に学び始めたのです。
これにより人が行う作業はデータをディープラーニングの入力に入れるだけということになります。
ちなみにディープラーニングは、人の脳を模した、ニューラルネットワークの一種であり、深層学習とも言います。今後数年は間違いなくホットな話題で有り続けるので、覚えておいて損はないと思います。
