「GPT-3.5」vs「GPT-4」–「ChatGPT Plus」は月額20ドルの価値があるか？ │ クラウド図鑑

筆者は、OpenAIの最新の大規模言語モデル（LLM）である「GPT-4」をその公開以来使ってきている。OpenAIのサービスを通じてGPT-4にアクセスする唯一の方法は「ChatGPT Plus」をサブスクライブすることであり、その月額料金は20ドル（約2800円）となっている。

OpenAIによると、GPT-4は「その前バージョンである『GPT-3.5』に比べると10倍進歩している」という。
提供：NurPhoto/Getty Images

自らの疑問に対する正確な回答をテキストで返してほしいという場合、この有償サービスは最初の大衆向けバージョンである「GPT-3.5」よりもずっと優れていると筆者は実感している。

誤解しないでもらいたい。GPT-4であっても依然として誤り、つまり「ハルシネーション」（もっともらしいウソ）を生成し得る。しかし、難しい質問に対するスマートな回答を望んでいるのであれば、GPT-4が役立つはずだ。この点を念頭に置いた上で、無償で利用できるGPT-3.5と、有償サービスの「ChatGPT Plus」を通じて利用できるGPT-4の技術的な違いについて説明したい。

OpenAIはGPT-4を「その前バージョンであるGPT-3.5に比べると10倍進歩している。この進歩によって、同モデルは文脈をよりしっかりと理解するとともに、ニュアンスを見極め、より正確かつ筋の通った回答を返せるようになっている」と説明している。同社はその違いを以下の具体的な観点から解説している。

1. ＃1：パラメーター数
2. ＃2：マルチモーダルモデル
3. ＃3：最大トークン数の増加
4. ＃4：多言語対応
5. ＃5：制御性
6. ＃6：検索機能の制約
7. ＃7：プラグイン
8. まとめ
9. ZDNet より

＃1：パラメーター数

OpenAIはGPT-4のパラメーター数を公表していない。しかし、AI企業Cerebras Systemsの最高経営責任者（CEO）Andrew Feldman氏によると、GPT-4はおよそ100兆個のパラメーターを用いて訓練されているという。これはGPT-3の1750億個というパラメーター数に比べると桁違いに大きい。

＃2：マルチモーダルモデル

GPT-4はマルチモーダルモデルとなっているため、テキストデータと画像データの双方を処理できる。一例を挙げると、プロンプトの一部として画像を受け取り、適切なテキストを応答できる。このためGPT-4は、ユーザーの冷蔵庫内の中身を画像として「視認」し、確認できた食材を用いたレシピを提供することができる。しかし、ChatGPT Plusが返してくるのはテキストだけだ。つまりモナ・リザとよく似た画像を要求した場合、同様の作品について教えてくれるが、画像そのものは返してこない。

＃3：最大トークン数の増加

GPT-4は以前のバージョンよりも最大トークン数が多い。GPT-3.5では4096トークン（およそ8000ワードに相当）だが、GPT-4では3万2768トークン（およそ6万4000ワードに相当）まで拡張されている（編集部注：新たな「gpt-3.5-turbo-16k」では1万6384トークン）。さらに、GPT-4はプロンプト内にURLを含めた場合、ウェブページからテキストを取得することもできる。

＃4：多言語対応

GPT-4は対応言語数も増えており、英語に加えて、フランス語やドイツ語、スペイン語といった25種類の言語に対応している。

-PR-

＃5：制御性

GPT-4はさらに「制御性」、つまりユーザーが選択した「個性」によって応答をコントロールする能力が高められている。例えば、海賊言葉で答えを返すように指示することができる。こういった指示を出す状況はあまり考えられないかもしれないが、GPT-4ベースのChatGPTは「I ain’t certain why ye’d be cravin’ to, but aye, ye can, matey!」（何故かは分からんが、アーイ、やってみるぜ相棒！）といった答えを返すようになる。

＃6：検索機能の制約

GPT-4ベースのChatGPTを訓練したデータも依然として2021年9月までのものとなっているが、「Bing」を用いてインターネットを検索するよう指示することができる。これにより、ずっとタイムリーな答えが得られるようになる。しかしベータ版であるため、完璧を期待するべきではないだろう。

＃7：プラグイン

もう1つベータ版として提供されているものに、プラグイン機能がある。この機能を用いれば、OpenAIとサードパーティーの開発者は外部開発のAPIを介してGPT-4ベースのChatGPTを「より賢く」することができる。例えば、ExpediaやKayakの旅行プラグインを用いれば、バンクーバー行きの最適なフライトを教えてくれるようになる。また、「Ask Your PDF」というプラグインを用いれば、ユーザーが指定した任意のPDFドキュメントから回答を探し出せるようになる。

まとめ

GPT-4はこういった機能向上により、以前のバージョンに比べて「より賢く」なったと言える。例えばGPT-4は、LSAT（米国のロースクールへの入学試験）やSAT（米国の大学への入学試験）、Uniform Bar Exam（米国統一司法試験）、GRE（米国の大学院への進学試験）を含む数々の試験で好成績を収めている。OpenAIによると、GPT-4の回答は「GPT-3.5に比べると、事実に基づいた回答を返す確率が40％高まっている」という。

ただ、GPT-4が本当の意味で賢いというわけではない。例えば、AP English Language and Composition（大学進学準備課程の英語及び英作文科目）試験において、GPT-4のスコアは依然として5段階のうちの2となっている。このスコアでは希望する大学への入学は無理だし、ライターの仕事には到底就けない。

さらにGPT-4ベースのChatGPTは、説得力ある文章をよどみなく生成するものの、これらのAIエンジンは非常に高度なオートコンプリート機能を有した穴埋め機械でしかない。その回答は自らのLLMから導き出された、統計的に最もありそうな言葉を列挙しているだけなのだ。

とは言うもののOpenAIによると、GPT-4では技術的に許されていないプロンプトに回答する確率が82％低減され、事実を捏造（ねつぞう）する確率も60％低減されているという。

ではGPT-4に軍配が上がるのだろうか？ChatGPT Plusはお金を払う価値があるのだろうか？筆者はこれら2つの質問に対する答えがイエスだと考えている。ただし、生成型AIは仕事を手助けするためのものであり、労働者を置き換えるものではないという点を忘れてはいけない。