公開日:2020.12.24
更新日:2025.03.24
機械学習にはさまざまな種類があります。機械学習を始める場合、それぞれの種類について理解したうえで始めるのが重要です。
そこで本記事では機械学習の概要を改めて解説したうえで、技法(種類)を紹介します。
あなたの経験職種のフリーランス案件相場を確認しませんか?
<目次>
1.そもそも機械学習とは
機械学習の仕組み
教師あり学習
教師なし学習
強化学習
2.よく混同されるAI(人工知能)・ディープラーニング(深層学習)との違い・関係性
3.機械学習の技法(種類)
クラスタリング
クラス分類
回帰
異常検知
次元削減
4.まとめ
そもそも機械学習とは何かということについて解説します。
既に理解している方も改めて確認してください。
機械学習はコンピュータに大量のデータを学習させ、分類や予測などのタスクを行うアルゴリズムやモデルを自動的に構築させる技術です。
コンピュータに大量のデータを読み込ませ、さまざまなアルゴリズムに基づき、分析させます。
そして膨大なデータを反復的に学習することで、データの中に潜むパターンや特徴を見つけることが可能です。
使用するアルゴリズムは、データの特性や目的によって異なります。ここでアルゴリズムの内容を理解する必要はありませんが、以下のような有名な機械学習のアルゴリズムが存在します。
・二アレストネイバー法
・決定木・ランダムフォレスト
・サポートベクターマシン
・ニューラルネットワーク
適切なアルゴリズムを利用して機械学習を行うのが重要です。
機械学習は「教師なし学習」「教師あり学習」「強化学習」の3種類の枠組みに分けて考えることができます。それぞれ解説していきます。
「識別」「回帰」などのタスクに利用されることが多いのが教師あり学習です。
教師あり学習では、学習データとして入力とその正しい出力が与えられ、学習を行うことで、データセットに対する応答値の予測を可能にします。
具体的には例えば手書きの数字を学習データとし、どの手書き数字がどの数字を表すかを意味する正しい出力を与え学習させます。
そして学習の終了時点では新しい画像データに対して、画像内の手書き数字がどの数字を表しているのかを判別できる状態にするのが目標です。
トレーニングデータから学習するプロセスが、教師が生徒に学習指導を行っているようにみえることから教師あり学習と呼ばれます。
似た特徴を持つ有するものをグループに分類する「クラスタリング」のタスクに利用されることが多いのが教師なし学習です。
教師なし学習では、正しい出力が与えられていない学習データが与えられます。
教師なし学習では、アルゴリズム自身がそのデータを探索することで、データの構造やパターンを抽出します。具体的にはペアとなる正解ラベルの付いていない画像データの類似度や規則性に基づいて分類する方法です。
教師あり学習と異なり、正解がない、つまり先生がいないため教師なし学習と呼ばれます。アルゴリズムはデータ中の構造を見つけ出す役割を持ちます。
AlphaGoに代表されるようなゲームに多く利用されているのが強化学習です。
システムが試行錯誤しながら、最適なシステム制御を実現します。
強化学習は教師なし学習と同じく正解データは与えられない代わりに、望ましい出力結果に対し報酬を与えることで、データの出力を価値付けしその価値を最大化する行動をとるようにアルゴリズムを最適化する仕組みです。
強化学習の概念は昨今のAIブーム以前に存在し、原型は機械の自律制御を可能にする「最適制御」の研究として1950年代には存在しました。
機械学習についてこちらの記事もご一読ください↓
機械学習とAI(人工知能)、ディープラーニング(深層学習)には包含関係があります。
AI(人工知能)は人間の知能や行動を模したコンピュータを人工的に作る研究分野です。
機械学習はAI(人工知能)という大きな枠組みの中に存在する研究分野の1つです。
ディープラーニング(深層学習)という研究分野は機械学習の、特に強化学習が発展して生まれました。
総務省はICTスキル総合習得教材においてディープラーニング(深層学習)を以下のように説明しています。
ディープラーニング(深層学習)は、より基礎的で広範な機械学習の手法であるニューラルネットワークという分析手法を拡張し、高精度の分析や活用を可能にした手法です。
人間の脳により近いかたちで学習するコンピュータを開発するのが、ディープラーニング(深層学習)の研究テーマです。
機械学習とディープラーニング(深層学習)について詳しく知りたい方は下記記事をご一読ください↓
機械学習の代表的な技法(種類)を5つ紹介していきます。
学習を開始する前に技法(種類)について理解することで、全体像を掴みましょう。
既存のデータをもとに予測や認識を行うといったタスクではなく、データの構造理解に用いられるのがクラスタリングです。
クラスタリングでは類似度をもとにデータのグループ分けを行います。
教師なし学習の項目でも触れたように、クラスタリングは教師なし学習の1つです。
クラスタリングはさらに「ハードクラスタリング」と「ソフトクラスタリング」の2つのグループに分かれます。
ハードクラスタリングでは、それぞれのデータ点は1つのクラスタに完全に属しているか否かの二択です。
ソフトクラスタリングでは、それぞれのデータは1つのクラスタに完全に割り当てられるのではなく、そのデータ点がそのクラスタに属する確率や尤度が計算されます。
教師データを利用して、それぞれのデータ点がどのクラスに分類されるかを学習させるのがクラス分類です。
見つかった法則性をもとにしてテストデータにラベル付けを可能にすることを目的とします。
クラス分類はクラスタリングと混同されることがありますが、クラスタリングが正しい出力が与えられていないデータを利用する教師なし学習である一方で、クラス分類は正しい出力が与えられたデータ(教師データ)を利用する教師あり学習です。
連続値などの値の予測に利用されるのが回帰です。
具体的には広告予算の増加による商品の売上増加の予想といった場面で使用されます。
回帰分析には線形回帰や多項式回帰など、さまざまな方法があります。回帰は教師あり学習の1つです。
異常検知はデータの中の他のデータと一致しない観測結果や期待されるパターンを学習させる機械学習です。
異常検知はさらに「外れ値検知」「異常部位検知」「変化点検知」などに分かれます。
例えば外れ値検知は、急激な株価指数の値上がり、下落を自動的に検知し、アラートを発生させるといった目的で利用されます。
異常部位検知は心拍数のデータから急激な心拍数の変動が発生した異常部位のみを抜き出すといった目的で利用されます。
種類によって、教師あり学習や教師なし学習、強化学習などが利用されます。
次元削減とはデータの次元数を減らすことを意味します。次元数は換言すると、データセットのフィーチャの数ともいえます。
データの圧縮やデータの可視化に利用することが可能です。
データのグラフ化を行う際、データが4次元以上になると、端的にまとめるのが難しくなります。
そこで次元削減を利用して、次元を減らし、グラフ化を可能にするといった目的で利用されることが多いです。
機械学習の開発求人・案件を覗いてみたい方↓
本記事では機械学習について解説してきました。機械学習にはさまざまな技法(種類)があり、それぞれできることが異なります。機械学習を何に役立てたいのかを明らかにして、適切な機械学習の種類(技法)を選びましょう。
フリーランスエンジニア専門の求人・案件一括検索サイト「フリーランススタート」に少しでも興味がある方は是非ご登録ください。
なお、フリーランススタートはiOSアプリ版やAndroid版をリリースしています。
通勤しているエンジニア・デザイナーでちょっとしたスキマ時間で手軽にフリーランス求人・案件を検索したい、開発言語の単価が知りたい、フリーランスを将来的に検討している方などは是非インストールしてみてください。
フリーランススタートのアプリを有効活用して、フリーランスとして第一線で活躍しましょう!
フリーランススタート iOSアプリのインストールはこちらから→
フリーランススタート Androidアプリのインストールはこちらから→
本記事が皆様にとって少しでもお役に立てますと幸いです。
フリーランスお役立ち記事を検索
あなたの経験職種のフリーランス案件を見てみませんか?
SNSアカウントでログイン