機械学習はさまざまな領域に活用できる技術です。しかし、内容が広まっている一方で適用方法や将来のことはあまり知られていません。本記事ではそれらについてご紹介していますので、ぜひご確認ください。
機械学習の基本
そもそも、機械学習とはどのような技術を指すのでしょうか。名前だけを知っている方や大まかな概要のみ知っている方は、ぜひ具体的な内容についてもご確認ください。
機械学習とは何か
機械学習に明確な定義はありませんが、トム・M・ミッチェルが提唱した下記の定義が広く用いられています。
「コンピュータプログラムがタスクのクラスTと性能指標Pに関し経験Eから学習するとは、T内のタスクのPで測った性能が経験Eにより改善される事を言う。」
簡略化すると、機械学習はコンピュータが大量のデータをもとにルールやパターンを学習していき、分類や予測など人間にとって有意義なデータを出力する技術のことです。そして、この有意義なデータを出力する精度やスピードが急激に上がっており、さまざまなシステムに導入されるようになっています。
機械学習は最近になってよく聞くようになりましたが、実は1950年代にはその概念ができていました。具体的な名称がつけられたのは1956年のダートマス会議時です。その後から現在までさまざまな研究がなされ続けています。
機械学習の目的
前述のとおり、機械学習の目的は人間にとって有意義なデータを出力することです。機械学習はさまざまなことがおこなえますが、その結果が人間にとって有意義なものであるかは判別ができません。そのため、機械学習を用いる際には適切なルール設定が必要です。
しかし、近年では機械学習を用いることが容易になってきたことからも、研究者以外にも利用できるものになりました。その結果、下記のように非常に広い分野で利用されています。
・認識(画像認識、音声認識、文章認識、異常検知)
・分析もしくは予測(数値の予測、イベント発生の予測)
・対処(行動の最適化、作業の最適化、表現の作成)
たとえば、認識の音声認識であればAppleのSiri、分析の数値予測であれば売上などの需要予測と具体的な利用法は多岐にわたっています。
パターン認識とは
機械学習を学ぶ際に非常に重要なのがパターン認識です。機械学習を理解するためにはさまざまなものを学習する必要がありますが、まずはこのパターン認識の概要から理解していきましょう。
パターン認識の役割
機械学習におけるパターン認識とは、大量のデータからパターン(規則性)を発見することです。一般的に大量のデータから共通のパターンを見つけることは容易ではありません。さらに、人間はすべて論理的に判断しているわけではなく、感覚的な判断も数多くあります。
しかし、現在の機械学習は人間の知覚と似たような処理をおこなえるようになりました。そして、パターンを把握することができれば新しいデータが得られた際、それはパターンに当てはまっているのかを予測できます。
このようにパターン認識は人間ではおこなえない量の解析、もしくは人間が論理化できないものの解析を担う重要な役割を持っています。逆を返せば、論理的な処理しかおこなえなかったコンピュータに感覚的な判断を持ち込めるようになったのです。
パターン認識の流れ
パターン認識は下記の流れで処理されることが多いです。
・データ収集
・前処理をする
・特徴を抽出する
・識別や分類をする
まず、前処理とはデータを適切な形式に整える作業を指します。実は、最初に取得したデータは余分な情報が含まれていることが多いです。余分な情報まで含まれていると学習精度に影響を及ぼすため、まずはデータをきれいな形に処理することが必要です。
次に、パターン認識の主な目的である特徴抽出です。特徴抽出は人間がルールを決定する場合もありますが、ディープラーニング(深層学習)と呼ばれる手法では特徴抽出も自動的におこないます。
最後は抽出したものを分類します。しかし、分類されたものが適切であるか、有意義なものになっているかどうか、といった最終的な確認は人間がしなければなりません。
予測モデルの構築
機械学習は現在のデータを分類するだけでなく、そこから予測を立てることも可能です。では、予測モデルはどのように構築していくのかステップごとに確認していきましょう。
予測モデルの構築ステップ
予測モデルの構築は以下のステップを踏むことが一般的です。
・データ収集
・データの前処理
・モデル選択
・モデル評価
・パラメータ調整
データの処理はパターン認識と同様です。次にあるモデル選択とは数ある処理アルゴリズムのなかから適切なものを選択する作業です。一口に機械学習といってもさまざまなモデルがあるため、目的に沿ったモデルを選ばなければなりません。
モデル評価では選択したモデルが予測に正しいのかを検証していきます。モデル評価にもさまざまな種類があるため、適切なものを選ぶことが必要です。
最後はパラメータ調整をおこないます。モデルにはさまざまな定数があり、その値によって結果が大きく変わります。そして、定数には決定的なものはなく、モデルそれぞれで適した値が異なるものです。パラメータ調整は実行と修正を繰り返し、適切な結果となるまでおこなわれます。
モデルの評価と改善
ステップの1つであるモデル評価は非常に重要な事項です。もし、モデルが適切でないのをよしとしてしまうと、予測自体が外れてしまいます。
モデル評価には以下の種類を用いることが一般的です。
・ホールドアウト法:データを学習用データとテストデータとして分割し、精度を確かめる
・クロスバリデーション法:データをk個に分割し、残るk-1個を訓練データとし、すべてのデータがテストデータとなるまで入れ換えて検証を繰り返す
・Leave One Out:データ全体のうち1つだけをテストデータとする
予測モデルを構築する際には必ず精度を確認し、得られた予測が正しいのかどうかを検証していきましょう。
機械学習の応用
機械学習は非常にさまざまな分野に適用できます。また、できることは日々増えてきており、今後はさらに可能になることが多いです。ここで現在の応用分野と将来の可能性について確認しておきましょう。
あなたの仕事を変える機械学習
具体的な例としてマーケティングが1つに挙げられます。マーケティングというとマーケターが顧客のことを予測していましたが、現在では機械学習で予測することが可能です。また、顧客属性と購入情報は大量のデータが入手しやすいことからも利用が進んでいます。
実際にアメリカのウォルマートはマーケティングに機械学習を利用しました。その結果、おむつと同時にもっとも購入される商品はビールであると人間では予測しづらいことも予測しています。
また、データ入力や窓口などの単純作業も導入例が多いです。そして、それらは精度と速度ともにAIのほうが勝ってきています。このようにデータ分析や単純作業が主である業務は徐々に機械学習がおこなうようになってきているのが現状です。
未来の機械学習
まず、未来の機械学習は効率化がさらに進むと予想されます。現在は判断がすぐに必要な場面にはあまり適用が進んでいません。また、間違えてしまうと人体に危害が及ぶ場面への導入も進んでいないのが現状です。今後はそれら分野にも広まることが予想できます。
また、今後はアートなどの分野へも適用される可能性が高いです。機械学習の認識と私たちの感性は非常に近しい部分があります。機械学習に対する研究が進むほど人間に対する理解も進み、人間の感性に対して訴えかけるような作品も作ることができるようになるでしょう。