注目キーワード

ChatGPTの新モデル「GPT-4.5」って正直どうなの? – メリットもある一方で、ネット上の評価が決して良くないワケ 【AI】

はじめに

みなさん、ChatGPT、使ってます?
このAI分野の技術進展はまさに日進月歩です
ついこの間出た新しい技術が、あっという間に古いものとみなされるのがAI界隈というものです。
私はこの分野に明るくないのですが、聞くところによるとつい数ヶ月前に登場した新技術や論文が「かなり昔のもの」として扱われるそうですよ?
さて、そんなAI界隈に、新しい大規模言語モデルが登場しました、皆さんも耳にしたことがあるでしょうか、「GPT-4.5」です。

Youtube版

本記事の内容について解説したYoutube動画を作成しました。こちらより視聴できます。

GPT-4.5


GPT-4.5は、OpenAIがつい先日、2025年2月27日に発表した最新の大規模言語モデルのことです。
従来のGPT-4oをさらに進化させ、性能と機能を大幅に向上させたらしいです。
GPT-5への橋渡しとなるモデルと位置づけられています。
OpenAIのCEO、サム・アルトマンによると、「社内でOrionと呼んでいたGPT-4.5を、思考連鎖機能を持たない最後のモデルとして提供する」とのことで、推論モデルではないことが明言されています。
この思考連鎖機能、chain-of-thoughtというのは人間のように段階的な推論を経て最終的な問題解決を実現する人工知能のアプローチのことで、これを持たないGPT-4.5は一見すると際立った魅力がないように思えますよね?

でも、案外そうでもないんです。

思考連鎖機能なきモデル


GPT-4.5のような、思考連鎖機能のないモデルというのは一長一短です。
階層的な推論過程が乏しく、いわば「直感的」に出力するため、出力の一貫性がなかったり深い推論が難しかったりと確かにデメリットは存在します。
一方で入力に対して即座に応答できるという高速応答性は、思考連鎖機能のあるモデルにはないメリットです。


複雑な思考過程を必要としないケース、例えば動画内で喋ってる文章にあった適切な画像を自動選択する、といった用途においては一貫性や深い推論は必要とせず、それよりも高速性が求められますよね。
また、適用範囲が広く、わりとどんな種類の質問でも答えてくれる、というメリットもあります。
このように、使い方によってはGPT-4.5のように思考連鎖機能のないモデルのほうがいい、というケースも確かに存在するんです。

主な特徴


続いてGPT-4.5の特徴をいくつか見ていきましょう
まず1つ目が「高度な情緒的知性」。
要は、ユーザーの感情や意図を理解し、共感的な応答を生成する能力が強化されている、ということ。
ただ個人的には、自然な対話が欲しいだけなら、従来のGPTモデルでもプロンプトを使えば実現できるような気がするんですけど、それとどう違うんですかね?
続いて「計算リソースの向上」が挙げられます。
要するに複雑なタスクでも高精度な結果を提供できる、ということ
具体的にどの程度の結果を出力するのかは、後でベンチマークのほうを確認することとしましょう。
そして最後が「ハルシネーションの低減」。
つまり、誤情報を生成する頻度が減少するということです
個人的にはこの点に魅力を感じているところではあります。
ただ、こうした魅力があるのにも関わらず、皆さんご存じの通りネット上のGPT4.5に対する評価は決して高いものとは言えません。
この辺の理由については後程深堀していきます。

ベンチマーク


さて、ここではGPT4.5が実際どの程度の結果を出しているのかを見ていきましょう
こちらはOpenAIが出している各モデルの結果になります


これをご覧いただくと分かるのですが、確かにGPT4.5は既存のGPT4oと比較して高いパフォーマンスを発揮できていることが分かります。
しかし、o3と比較するとパフォーマンスは同程度かそれ以下であることを考慮すると、あまり画期的なモデルとまでは言えないのかな、という気がしています。
GPT4.5はあまり計算能力を重視したモデルではないように感じました。
続いてこちらは他モデルと比較したGPT4.5の正確性についての結果になります。


これを見ると一目瞭然ですね、GPT4.5は他モデルと比較して正確な情報を提供する割合が高く、また間違った情報を提供する割合も低いことが分かります。
正確性や汎用性を重視する場合は使えるのではないでしょうか?
後述する理由より実用上は難があるんですけどね…

デメリット


続いて、GPT4.5のデメリットについても目を向けていきましょう。

まず第一によく言われるのが、「高コスト」である点。
具体的にはAPIを使用する場合、入力トークンが100万トークンあたり75ドル、出力トークンが100万トークンあたり150ドルであり、既存のGPT4oだとそれぞれ2.5ドル、10ドルであることを考慮するとあまりに高いと言わざるを得ません。


つまり、入力はGPT4oの30倍、出力は15倍に相当し、とても気軽に使えるものではない気がしています。
ネット上でGPT4.5に対する評価が高くない理由の大部分がこの点に尽きるでしょう。
第二に、他モデルと比較して明確な優位性が見いだせない点も見逃せません。
確かに、ベンチマーク上では改善がみられますが、その進化は決して劇的とまでは言えず、正直に言って「ちょっと良くなっただけ」というのが実態でしょう。
それでいて価格が大幅に上がるとなると、「実用上難がある」という評価が妥当かもしれません。
単にAIのAPIが使えればいい場合は4oやminiを使えばはるかに安価で済みますし、出力の一貫性や質を求める場合、o3といった既存の高性能モデルに軍配が上がる気がしています。

結論


というわけで、ここまでGPT4.5について語ってきました
確かに計算能力の若干の向上や正確性の高さなど、評価できる点もあるのですが、その一方で使用時のコストの高さが何よりもネックになる気がしています。
個人的にはひとまず様子見といったところです。

最新情報をチェックしよう!