AI分野の知識を身に付けるなかで避けて通れない用語が「ディープラーニング」です。
この記事では、ディープラーニングの意味や仕組み、関連用語との違い、活用例やアルゴリズムの種類、知っておきたい注意点をご紹介します。
1. ディープラーニング(深層学習)とは
ディープラーニング(深層学習)とは、多くのAIが誕生する契機となった革新的な機械学習技術の一つです。与えられた大量のデータからコンピューターが自動でパターンを見出し、自ら学習を進めていける技術として知られています。この「自ら学習を進められる」ことが、ディープラーニングの最大の特徴です。
従来の機械学習では、学習すべき要素を人間の手で指示する必要がありました。例えば、カラスとスズメの画像識別を学ばせる場合は、色やくちばしの形状など、多様な要素を見分け方として設定しなければいけません。しかしディープラーニングでは、このような特徴量(パターン分類に役立つ属性やポイント)が自動で抽出されます。
加えて、自動抽出される特徴量は人の手によるものよりも複雑で質が高いケースも多く、学習後の推論の精度(例:カラスとスズメの画像を見分られる確率)も優れています。
2. ディープラーニングの仕組み
ディープラーニングが深層学習とも呼ばれるのは、その仕組みに層の厚い「ニューラルネットワーク(人間の神経細胞を模したモデル)」を用いるためです。
ニューラルネットワークは、入力層・隠れ層(中間層)・出力層の3種類の層からなり、それぞれの層に人間でいう「ニューロン(神経細胞)」のようなものが多数存在します。そして、各層は以下のような流れで働きます。
STEP1:入力層がデータを受け取る
STEP2:隠れ層が特徴量の抽出を行う(複数層ある場合は各層で抽出を繰り返す)
STEP3:出力層がふさわしい結果をアウトプットする
一般的には、隠れ層が3層以上あるものをディープラーニングとみなします。高度なディープラーニングでは、隠れ層が100層以上も存在することもあります。
3. AIや機械学習との違い
AI・機械学習・ディープラーニングのそれぞれの関係性は、以下の表の通りです。AI技術の一つに機械学習があり、機械学習の一種にディープラーニングがあります。
【AI・機械学習・ディープラーニングの違い】
名称 | 概要 |
AI(artificial intelligence) | 人工知能やそれに付随する技術。AI技術の一つに機械学習がある。 |
機械学習 | 大量のデータを与えてコンピューターに学習をさせる手法。通常、特徴量を人の手で与える必要がある。 |
ディープラーニング | 機械学習の一種。特徴量を自動で抽出でき、上手に学習できた場合は従来と一線を画すほど精度も良い。 |
AIは定義があいまいな言葉ですが、「強いAI」「弱いAI」と呼ばれる分類を知ると、その定義を理解しやすくなります。以下の記事もあわせてご確認ください。
>>弱いAI?強いAI?それぞれの違いやシンギュラリティとの関係性を解説
4. ディープラーニングが注目されるようになった背景
近年、ディープラーニングの活用が進む背景には、従来では不可能であった高度なデータ処理ができることと、利用ハードルが下がりつつあることが挙げられます。
特徴量を自ら見出すディープラーニングでは、人間の想定を上回る形で学習を進められます。人の手では不可能な速度・精度で画像分別ができるAIを作るなど、ビジネスに転用すれば大きなインパクトを生み出すことが可能です。
また、ディープラーニングの利用には、大量のデータの確保と高速処理ができるハードウェア(例:業務用グラフィックボード)の準備が必須ですが、デジタル化の浸透と技術革新により、そのハードルも下がりつつあります。
5. ディープラーニングが活用されているもの
では、実際のところディープラーニングはどのような形で活用されているのでしょうか。代表的な3つの例をご紹介します。
1. 画像認識
前述したカラスとスズメの画像分別例のように、画像認識はディープラーニングが特に活用されている分野です。病気のある部位と健康な部位を見分ける医療画像診断や、製造業における不良品の検知、スマートフォンにも搭載されている個人を判別する顔認証などが代表的です。
2. 音声認識
音声認識の分野でもディープラーニングは活躍しています。話者をできるだけ識別しながら会議の議事録を自動作成したり、スマートスピーカーのような機器を音声操作でスムーズに動かしたりと、音声をコンピューターが高精度に処理するための学習方法として用いられています。
3. 自然言語処理
自然言語処理とは、人間の言葉をコンピューターに処理させる技術を指します。質問に応じて適切な返答を行うチャットボットや、入力した文章の言語を変換する自動翻訳などは、ディープラーニングが活用された自然言語処理の好例です。
ちなみに、自然言語処理に関連してAI分野で押さえておきたい用語に「LLM(大規模言語モデル)」があります。LLMは、ディープラーニングを駆使して作り上げた、自然言語処理ができる生成AIです。
LLM(大規模言語モデル)の詳細については以下の記事で解説しています。
>>LLM(大規模言語モデル)とは?仕組みや活用事例について詳しく解説
6. ディープラーニングのアルゴリズムの種類
ディープラーニングにはいくつかのアルゴリズムがあり、それぞれ特徴が異なります。ここでは代表的なアルゴリズムの概要をご紹介します。
1. CNN(Convolutional Neural Network)
CNN(Convolutional Neural Network:畳み込みニューラル ネットワーク)は、画像の認識や処理の分野で活用されるアルゴリズムです。
仕組みでご紹介したネットワーク内に「プーリング層」と「畳み込み層」と呼ばれる特別な層を用意し、画像の特徴を高精度に学習します。
2. RNN(Recurrent Neural Network)
RNN (Recurrent Neural Network:再帰型ニューラルネットワーク)は、物事の時系列や順番を取り扱えるアルゴリズムです。動画の次のフレームを予測したり、文章の短い繋がりを把握したりと、ある出力を行うまでの過去の情報を考慮できます。
3. LSTM(Long Short Term Memory)
LSTM( Long Short Term Memory)は、RNNを拡張させたものです。RNNには長期的な依存関係や時系列を見失ってしまう欠点があり、それを改善すべく誕生しました。「LTSMブロック」という特別な演算箇所を用意し、「ゲート」と呼ばれる仕組みで情報をコントロールする形で機能しています。
4. オートエンコーダー
オートエンコーダーはニューラルネットワークの一種で、入力データを圧縮する際、後から元に戻せるよう重要な要素は残して(不要な部分のみ削ぎ落として)圧縮する技術です。勾配消失(隠れ層が多すぎるとかえって学習精度が落ちる問題)と過学習(与えたデータに学習結果が寄りすぎる問題)という、ニューラルネットワークの課題に対処する目的で主に活用されます。
5. GAN(Generative Adversarial Network)
GAN(Generative Adversarial Network::敵対的生成ネットワーク)は、画像生成によく採用されるアルゴリズムです。画像を生成するニューラルネットワークと生成された画像の真偽判定を行うニューラルネットワークとを争わせて、生成物の質を向上させる仕組みが採り入れられています。
6. Transformer
Transformerは自然言語処理分野に革命をもたらしたアルゴリズムです。2017年にGoogle が発表した論文「Attention Is All You Need」で登場した理論で、Attentionと呼ばれる仕組みにより「ある単語の意味を理解するためには文章のどの部分に着目すべきか」を推測できます。
人気のChatGPTのTは「Transformer」を意味しています。最近では、自然言語処理以外にも、画像や動画に関する分野でも理論の活用が進んでいます。
7. ディープラーニングの注意点や課題点
最後に、ディープラーニングの注意点や課題を押さえておきましょう。
1. 大量のデータが必要になる
ディープラーニングを成功させるためには、従来の機械学習よりも大量のデータが求められます。データが不足した場合、適切な特徴量を自動抽出できず、学習が失敗に終わる恐れがあります。
2. 根拠が不明確で調べることが難しい
ディープラーニングの重大な欠点に、判断基準のブラックボックス化があります。ディープラーニングは、人間が特徴量を与えなくても自ら抽出してくれる点が長所です。しかし、抽出された特徴量が複雑すぎて、何を基準に判断しているのか人間に分からなくなるケースがあります。
3. 導入コストがかかる
自社でディープラーニングを行おうとする場合、導入にコストがかかる点も問題です。大量のデータを購入したり、自社で取得するためのITツールを導入したり、ディープラーニングの処理を高速でこなせるハードウェアを準備したりしなければいけません。ハードルが下がりつつあるとはいえ、まとまった費用は求められます。
4. 破局的忘却が起こる可能性がある
破局的忘却(破滅的忘却:catastrophic forgetting)とは、学習済みの内容と別の学習を始めると過去に覚えたことを忘れてしまう現象です。
例えば、カラスとスズメの画像識別ができるよう学習させたネットワークにイルカの画像も学習させると、先ほどまではできたカラスとスズメの見分けが不可能になるような現象を指します。ニューラルネットワークの欠点として知られています。
5. 人の感情を正確に捉える・表現することが難しい
ディープラーニングは高度な技術ですが、計的な推論から回答を出力しており、現時点では人の感情を正確に理解したり表現したりできる形で学習をしているわけではありません。そのため、顧客の気持ちに寄り添う必要がある場面などは、まだまだディープラーニングから生まれたAIによる完全な置き換えは難しいのが現状です。
8. まとめ
ディープラーニングは機械学習の一種であり、コンピューターが自ら学ぶべきポイント(特徴量)を抽出できる点に特徴があります。ChatGPTをはじめとする、多くのAIを誕生させた技術です。
まだまだ大きな発展の余地があるディープラーニング。技術の向上によってはビジネスに大きな変革をもたらす可能性を秘めており、今後も大きな期待を集め続けるはずです。