昨今話題の生成AIの一種「LLM(大規模言語モデル)」。LLMについて知ることで、ChatGPTに代表される有名AIの概要も理解しやすくなります。
この記事では、LLMの意味や仕組み、種類と活用できる分野、サービス例や課題などをご紹介します。
1. LLM(大規模言語モデル)とは
LLM(大規模言語モデル)とは、膨大なテキストデータとディープラーニング技術を活用して作られた巨大な言語モデルのことです。
LLMを理解するためには、まずは言語モデルとは何かを知る必要があります。
1. 言語モデルとは
言語モデルとは、コンピューターが私たちの言葉を取り扱えるよう、文章の並び方や単語の出現可能性について確率を用いてモデル化したものです。
例えば、私たちが「“頭の回転が”に続く言葉は?」と質問された場合、自然と「速い」「遅い」などの回答が思い浮かびあがります。
しかし、何の情報も持たないコンピューターの場合だと、何が適切か判断ができませんが、自然な並びとなる言葉は高確率に、不自然となる言葉は低確率に出現する(あるいはまったく出現しない)ように確率を割り当てると、コンピューターは文章を処理しやすくなります。この仕組みを言語モデルと呼びます。
LLMは、その言語モデルのうち以下の3要素が大規模化したものを指します。
- 計算量:コンピューターが処理できる仕事量
- データ量:入力したテキストデータの量
- パラメータ数:ディープラーニング技術特有の係数量
2. 生成AIや機械学習との違い
生成AIとは学習データから新たなコンテンツを生み出せるAIのことであり、LLMは生成AIの一種(AIの仕組みの一つ)にあたります。
一方、機械学習はコンピューターにデータを与えて学習させる手法のことで、LLMは「大量のテキストデータで機械学習を進めたモデル」、すなわち機械学習の結果の一つとなります。
生成AIの詳細やビジネスでの活用方法は以下の記事で解説しています。
>>生成AI(ジェネレーティブAI)とは?ビジネスに活用する手法や得意なことを解説
2. LLM(大規模言語モデル)の仕組み
LLMの仕組みは高度であり、以下の流れで与えられた文章に対する適切な回答を導き出しています。
- STEP1:入力されたテキストデータをトークン(最小単位)に分割
- STEP2:トークン同士の関連性や類似性を数値化(ベクトル化)
- STEP3:ニューラルネットワークを通じて特徴量を抽出(文脈の把握)
- STEP4:確率から出力テキストを決定(ベクトルをテキストデータに戻す)
通常、LLMを用いたサービスの利用者視点では、単に「○○をして」「○○とは?」などと指示文や質問文を与えるだけで扱えます。
3. LLM(大規模言語モデル)の種類
続いて、代表的なLLMの種類をご紹介します。
1. GPT-3/GPT-4
GPT-3/GPT-4は、米国のOpenAI社が開発したモデルです。2023年に登場したGPT-4は、米国の司法試験で上位10%の成績を修められるほどの能力を持ち、その性能の高さから人々に「AIの時代が来た」と衝撃を与えました。
GPTシリーズは、ChatGPTに採用されるなど、私たちのもっとも身近なLLMだといえます。現在はより高性能な「GPT-4 Turbo」も登場しています。
2. PaLM/PaLM 2
PaLM/PaLM 2はGoogle社のLLMです。PaLM 2は2023年5月に発表されたモデルで、100種類以上の多言語処理が行えるほか、高度な推論や数式の処理、プログラミングコードの生成に強みを持ちます。
3. BERT
同じくGoogle社が2018年に発表したLLMがBERT(Bidirectional Encoder Representations from Transformers)です。BERTは文章を文頭と文末の双方向から学習できるのが特徴で、一方向からしか学習できないそれまでのLLMとは一線を画す文脈理解力を誇りました。
4. LaMDA
同じくGoogle社が2021年発表したLaMDAは、対話能力に特化したモデルです。「Language Model for Dialogue Applications」の略称で、ほかのLLMよりも自由に柔軟な会話ができる特徴を持ちます。その返答のクオリティは、「LaMDAは意識を持つ」と主張するエンジニアが現れるほどです。
5. LLaMA / LLaMA2
LLaMA / LLaMA2は、Meta社(旧Facebook社)が2023年に公開したLLMです。オープンソースで公開されており、研究利用も商用利用もできるのが特徴で、開かれたLLMとして支持を集めています。
4. LLM(大規模言語モデル)が活用できる分野
では、LLMが活用できる分野にはどのようなものがあるのでしょうか。
1. 検索エンジン
身近な例として、LLMは検索エンジンに活用できます。単に入力KWが一致したページを表示するのではなく、KW同士の文脈を把握し(例:「カップ コーヒー」「カップ サッカー」では違うカップだと理解できる)、適切なWebページを上位表示できると期待されています。
また、すでにLLMを用いた対話型検索エンジンも登場しています。
2. 自然言語処理
自然言語処理とは、コンピューターが人間の使う言葉をまるで人と同じように理解したり、出力したりする仕組みです。膨大なテキストデータからなるLLMは、この自然言語処理を目的としたモデルの一つです。
3. テキスト要約・生成
自然言語処理が可能なLLMは、テキストの生成や要約をこなします。特に要約では、原文として出力に必要な情報をすべて与えられることから、回答の不正確さが問題になりにくく重宝されています。
4. チャットボット
LLMをチャットボットに活用すれば、24時間365日、顧客の問い合わせに即時回答ができるようになると期待されています。実際に導入も進んでいますが、2024年3月時点では、チャットボットが顧客に誤った回答(存在しない割引情報)を伝えて裁判になった事例も登場するなど、まだその正確性には課題があります。
5. コード生成
LLMはプログラムコードの生成にも対応します。「○○ができるコードを作って。言語はPython」などと指示を与えるだけで、必要なコードを出力してくれます。まだ精度には問題がありますが、将来的には誰もがプログラムを扱えるようになるかもしれない夢のある機能です。
6. マーケティング活動のサポート
LLMはマーケティング活動においても活躍が期待されています。顧客へのアンケート結果の分析、社内外への連絡文章の半自動作成、広告や広報資料に載せるテキストの候補作成、競合分析の補助など、多様な業務への利用可能性があります。
7. 教育・学習のサポート
教育や学習分野におけるLLMの活用も予想されています。実際に、塾講師や家庭教師の代わりにLLMに質問したり、自分だけの英単語テストを出力してもらったりと、すでにさまざまな形で試用が始まっています。
ただし、こちらも現時点では回答や出力内容が誤っている可能性に注意が必要です。
5. LLM(大規模言語モデル)を活用したサービス事例
続いて、LLMを用いた代表的なサービスをご紹介します。
1. ChatGPT
AIブームの火付け役ともいえる「ChatGPT」は、LLMを用いた生成AIの代表格です。前述の通りGPTシリーズが利用されており、私たちの質問や指示に対してまるで人間のように応対してくれます。
ChatGPTのビジネスでの活用の可能性については以下の記事で解説しています。
>>ChatGPTをビジネスで活用するために知っておくべきこととは-活用メリットや注意点
2. Copilot(旧:Bing AI)
MIcrosoft社の「Copilot(旧:Bing AI)」は、同社が提供する検索エンジン「Bing」と連携して機能するAIです。質問や指示を与えるとリアルタイムでWeb検索を行い、最新の情報を踏まえたうえで回答してくれます。モデルにはGPT-4や、より高性能なGPT-4 Turboが採用されています。
3. Gemini(旧:Bard)
「Gemini(旧:Bard)」はGoogle社が提供する対話型AIです。AIとのチャットを通じて、文章作成・計画立案・勉強といった作業をこなせます。
モデルは「LaMDA」→「PaLM 2」→「Gemini Pro」と積極的に更新されており、最新の「Gemini Pro」はテキストに加えて画像・音声・動画を同時に取り扱う力にも優れているといわれています。
6. LLM(大規模言語モデル)の課題
LLMは私たちの生活を一変させる可能性を秘めていますが、現時点ではまだ課題もあります。
1. 論理的に推論するものは正確性に欠ける
LLMは人間に迫るレベルでコンピューターが自然言語を処理できる高度なモデルですが、出力の正確性はまだ十分ではありません。特に論理的な推論が必要な質問には誤った回答を出力しやすく、またその偽回答を断言してしまう危険性が指摘されています。このことは、専門用語で「ハルシネーション」と呼ばれます。
2. 情報が少ないと偏る可能性がある
LLMは、学習したデータから確率的な推論を経て回答を出力しています。そのため、学習時に与えたデータ量が少ない場合、そのデータの内容に引っ張られて偏った返答をしてしまうリスクがあります。
3. 膨大な量のデータと計算リソースが必要
前述の通り、情報が少ないと偏りが出てしまいます。そのため、LLMの作成には莫大な量のテキストデータが必要であり、稼働にも大量の計算リソースが求められます(例:グラフィックボードやサーバー)。そのため、圧倒的な資金力を誇る一部の大企業による独占が懸念されています。
4. 最新の情報や出来事に対応するのは難しい
LLMは学習済みデータの情報しか持たず、それ以降の時系列の出来事は理解していません。そのため、最新の情報やイベントについて質問すると、嘘の回答が生成されやすい傾向にあります。
ただし最近では、この欠点を解消するため、出力前にWebの情報をリアルタイムに検索できるものも登場しています(例:Copilot)。
5. 言語によって精度が異なる
LLMは作成時のテキストデータの言語によって得意な言語が決まっています。例えば、中国語や日本語で作成したLLMにフランス語で質問をしても、期待する質の回答は得られません。日本語で質問しつつ「回答はフランス語で」と条件を出した場合も同様です。
6. セキュリティやプライバシーリスクがある
LLMは、クラッカーが悪意のあるプログラムの作成に活用するなど、セキュリティやプライバシーに対する脅威となる可能性が指摘されています。ビジネスにおける利用者視点では、機密情報を入力しないことが大切です。LLMを活用したサービスのなかには、入力した文章の機密性が保たれていないケースがあります(例:運営会社のスタッフが確認でき、今後の学習に使われる)。
7. まとめ
LLMは言語モデルのなかでも特に巨大なものであり、確率的な推測から自然言語を処理できる点に特徴があります。流行のChatGPTにも採用されるなど、今後ますます活用が進むと考えられます。
LLMの可能性や技術は日々向上しています。ビジネスでの適切な活用に向けては、引き続きその進化に注目していく必要があるでしょう。