生成AIサービスが多すぎる」
「結局どれを使えば正解なの?」
世はまさにAI戦国時代。
OpenAIの「ChatGPT」、Googleの「Gemini」、Anthropicの「Claude」の3大巨頭を筆頭に無数の生成AIサービスが群雄割拠しています。
黎明期はOpenAIの「GPT」が一強と言われていましたが、開発競争が加速するにつれて言語モデルの基本的な性能が拮抗してきており、各社は独自の指向性やサービス連携、機能追加で差別化してユーザーのシェアを獲得しようとしています。
これは技術の発展という意味では好ましい状況ですが、私たちユーザーにとっては悩ましい事態でもあります。
今年も「自律的にタスクをこなすAIエージェント」、「コマンドラインベースのツール」など画期的なリリースが各社から発表されましたが、その度に右往左往した方も多いのではないでしょうか。
こうした拮抗状態を抜け出すべく、一歩先に躍り出たのは元祖生成AIサービス「ChatGPT」を擁するOpenAIです。
2022年11月にリリースされた世界初の生成AIサービス「ChatGPT」に搭載されて以来、最も有名な言語モデルとして生成AI時代の最先端を走り続けている「GPT」が、更なる進化を遂げました。
それが8/7の「OpenAI Summer Update」にて発表されたGPTシリーズ最新モデル「GPT5」です。
GPT-5は、AIの社会実装に向けた実用性の向上と、セキュリティの強化に主眼が置かれています。
そのため、劇的な性能向上や機能追加よりも、ハルシネーションの抑制や低コスト化など、一般ユーザーや企業が利用しやすくなる方向で大きく改善されています。
メジャーアップデートとして見ると派手さはありませんが、着実に底上げされており、今後はよりAI活用が加速していくと期待されます。
「ChatGPTは選択できるモデルが多すぎる」
「違いが分からないし、効果も実感がない」
「いちいち用途にあったモデルを選ぶのが面倒」
これらの悩みは今回のアップデートで、解決されます。
性能や用途、API利用料金など細かい差分があったすべてのモデルが「GPT5」1つに統一され、シンプルになりました。
また、内部ルーターを採用し、熟考が必要な場合はThinkingモデルが、そうでない場合は通常モデルが自動的に選択されるようになりました。 明示的にThinkingモードを使いたい場合には、「think hard(よく考えて)」とプロンプトで指定することもできます。
そして、GPT5は8/8から無料版を含むすべてのユーザーが利用できるようになっています。
これまで、最新モデルは有料プランのユーザーのみに提供されるケースが多かったのですが、今回のバージョンアップで既存のモデルが廃止・統合された結果、無料ユーザーも有料プランと同等の最新モデルが利用できるようになりました。
誰もが実用的で高性能なモデルに触れられるため、一般ユーザーの生成AI利用が促進される可能性があります。
多くのベンチマークで、既存のモデルや他社のモデルを上回る成績を叩き出しており、現時点では最も優れた言語モデルであると言えるでしょう。
この性能の違いについて、GPT-4が大学生レベルだとすると、GPT-5は専門家レベルであると表現されています。
しかし、既存のモデルの性能がすでに高い水準にあるため、一般ユーザーレベルで違いを実感することは少ないかもしれません。
生成AIの欠点として、事実と異なる情報を出力してしまう「ハルシネーション」が指摘されていました。
そのため、AIの出力を全面的に信頼するのではなく、事実かどうか確認する「ファクトチェック」が重要と言われていました。
今回のアップデートでは、従来モデルと比較してハルシネーションが大幅に抑制されており(通常モデルで20%、Thinkingモードでは70%以上抑制)、より安心して使えるようになりました。
ただし、ハルシネーションが全くなくなったわけではないため、ファクトチェックは依然として必要です。
これまでのモデルでは、自身の能力を過大評価してなんでも分かる、なんでも出来るかのように振る舞うことが指摘されていました。
GPT-5では、自身の能力で理解できないこと、実現できないことは正直に「わからない」「できない」と答えるようになったとされています。
例えば、一度に10万行のコードを生成するように依頼すると、GPT-4までは実現性を無視してコード生成を始めてしまいますが、GPT-5では「一度に10万行を生成しようとすると動作しない可能性が高い」と申告した上で、分割して生成する現実的な方法を提案してくれます。
これまでのモデルでは、ユーザーの意見に対して大げさに同調しようとしたり、不自然に絵文字を多用することが指摘されていました。
GPT-5では、このような極端に同調的な出力を減らし、より人間的に振る舞うように調整されているようです。
一方で、無条件でユーザーに寄り添うスタイルに愛着を持っていた人も少なくないようで、GPT-5への切り替えに伴ってGPT-4oが使用できなくなったことに対し、XなどのSNS上で「keep4o(GPT-4oを返して)」という署名運動が巻き起こりました。
これに対し、OpenAIのサム・アルトマンCEOは「GPT-4oの魅力的な要素がユーザーにとってどれほど大切なのか、私たちは過小評価していた」とコメントしているため、実用性の向上と感情的な需要とのバランスにどう向き合っていくのか、今後に注目したいところです。
従来のモデルでは、INPUT(入力時)の利用料金が高く設定されていました。 しかし、ビジネス利用ではINPUT量の方が多くなりがちで、コストが嵩む傾向になっていました。
GPT-5では、INPUTの価格が大幅に下がっており、最も安価だったGeminiと同じ価格帯になっています。
また、更に安価な軽量モデルの「nano」と「mini」も選択可能なため、予算や用途によって適切なモデルを選択できるようになっています。