ChatGPT vs Gemini vs Claude3 vs Copilot：あなたに最適なLLM（大規模言語モデル）はどれ？

AI技術が急速に進化する中で、多くの人が「どのLLM（大規模言語モデル）を使えばいいのか？」と悩んでいます。特に、ChatGPT、Gemini、Claude3、Copilotといった各種モデルには、それぞれ異なる特徴があり、選択が難しいですね。このブログでは、そんなあなたのために、これらのモデルの性能と特徴をわかりやすく比較分析します。

Sara Nanase

April 16, 2024

LLM（大規模言語モデル）の長所と短所

質問：あなたの長所と短所を説明してください。

日常生活の質問

分析的な質問

画像生成機能

質問：下記のプロンプトで絵を描いて。

画像の分析

質問：添付した画像を描写してインスタグラムの投稿を作成してください。

結論

最近、急速に進化したAIテクノロジーにより、新しい言語処理モデルであるLLM(大規模言語モデル)が登場しました。LLM（大規模言語モデル）は、膨大なテキストデータを学習することで、人間のような言語理解力と表現力を発揮できるようになっています。

LLMの中核となっているのは、語彙、文法、文脈などの言語的特徴を理解するための自然言語処理(NLP)技術と、大量のデータから規則性を見出すマシンラーニング（機械学習）の融合です。これにより、LLM（大規模言語モデル）は、質問への回答、文書要約、翻訳、創造的な文章作成など、さまざまな言語活用分野で優れた性能を発揮できるようになりました。

代表的なLLMサービスには、ChatGPT、Gemini、Claude3、Copilotなどがあり、各モデルには固有の特徴と強みがあります。どのような目的で使用するかによって、最適なモデルを選択することが重要です。今回は、これらのLLM（大規模言語モデル）モデルの無料版の性能と特徴を比較していきます。

ChatGPT

OpenAIが、開発したChatGPTは、自然な会話能力と豊かな文脈理解で知られる対話型人工知能モデルです。詳細な回答と創造的なアイデアの提供に優れています。

Gemini

Geminiは、Googleが提供するLLM（大規模言語モデル）で、Gemini Ultra、Gemini Pro、Gemini Nanoに分類されます。Gemini Ultraは最高の精度を提供し、有料サービスで使用されています。Gemini Proは、一般的な対話型AIとして無料で利用可能です。また、Gemini Nanoはオンデバイス用に開発されました。

Claude3

AnthropicのClaude3は、その汎用性が高く、様々な分野で利用可能です。複雑な問題解決や創造的な文章作成に強みを持っています。

Copilot

最後に、Microsoftが提供するCopilotは、GPT-4とBingの検索技術を活用して、文章作成、コード生成、要約、翻訳、創作などに利用されます。

LLM（大規模言語モデル）の長所と短所

まず、LLM（大規模言語モデル）にそれぞれ自身の強みと弱点について答えさせると、以下のような回答が得られました。

質問：あなたの長所と短所を説明してください。

Copilotを除く他の3つのLLMは、それぞれの特性をよく理解しているようです。一方でCopilotは、自分の性格について語るのではなく、一般的な長所と短所の定義や、履歴書作成時に役立つような例を提供しています。これは、Copilotが自己分析よりも実用的な情報提供に重点を置いていることを示しているかもしれません。

各LLMの特性を理解することは、それらをどのように活用するかを決定する上で重要です。以下は、それぞれのLLMが自己認識に基づいて自身の可能性について語った例です。

ChatGPT：自分自身の長所と短所をよく理解しているように感じました。

Gemini：情報が多すぎて、まるでおしゃべりな人のようです。

Claude：他のLLMと同様に自身の長所と短所をうまく表現しました。また、最後に付け加えられた表現が他のモデルよりもより自然に感じられました。

Copilot：唯一、自分自身の長所と短所について話していませんでした。Copilotの長所と短所について質問したとき、私が求めていた答えを得ることができました。

日常生活の質問

質問：明日の東京の天気は？

リアルタイムデータの扱いについて知るため、私は明日の天気に関する質問をしました。リアルタイムデータを提供してくれたのはGeminiとCopilotです。一方で、ChatGPTとClaude3はリアルタイムデータにアクセスできないことを明確にし、ユーザーに外部の情報源を確認するよう指示しています。

ChatGPT :リアルタイムデータを提供できないと回答します。

Gemini: 私たちがよく接する天気予報のように、画像とともにわかりやすく天気を知らせてくれます。特に、テキストを「読み上げる」機能が付いているので、非常に便利です。このような機能は、視覚情報だけでなく聴覚情報も提供するため、さまざまなニーズに対応できる利点があると思います。

Claude3：ChatGPTと同様に、リアルタイムデータを提供できないと回答します。

Copilot：テキストだけでしたが、明日の天気情報を教えてくれました。

質問：簡単に作れる夕食のおすすめメニューを教えてください。

全てのLLMがおすすめのメニューを提供しましたが、CopilotやGeminiはウェブと直接接続できるため、写真や動画を含むより具体的な情報が得られました。このような機能は、ユーザーがより詳細な情報を求める場合に特に便利です。

ChatGPT：メニューの一覧を分類なく教えてくれます。

Gemini：写真付きのレシピが提供され、画像をクリックすると別サイトの作り方を教えるサイトにリンクします。

Claude：料理の方法によってメニューが分類され、提供されます。分類されたおかげで、ChatGPTよりも見やすくなりました。

Copilot：写真は付いていませんが、情報元を教えてくれ、Geminiと同様にクリックすると別サイトの作り方を教えるサイトに繋がります。

分析的な質問

まず、Yahoo FinanceからNVIDIAの過去1年間のデータ（履歴データ）をダウンロードします。次に、4つの言語モデルに対して、そのデータに基づいた3つの質問をします。ただし、今回使用しているGemini無料版とGPT3.5無料版ではファイルの添付機能が提供されていないため、このテストは実施できませんでした。

質問：このファイルについて説明してくれ。

驚くべきことに、そのファイルに関する基本情報が何も提供されていなかったにもかかわらず、それが株取引データであると気付き、さらに各データ列の内容を分析してその意味を教えてくれました。

Claude 3：ファイルの内容が株価の推移データであることがわかります。

Copilot：日付のデータを選んで提供します。

質問：RSI分析をしてくれ

Claude：RSIの推移を見ながら、分析をしてくれます。但し、全日付のRSI値は提供してくれません。

Copilot：RSIの推移を見ながら、分析をしてくれます。Claudeでは、提供してくれないPythonコードを提供します。

RSI分析をグラフと一緒に行ってください。

Claude：直接コードを実行することはできませんので、Pythonコードを提供します。

Copilot：RSI分析のグラフまで提供してくれました。

画像生成機能

画力がない人にとって、テキストだけで思い通りの絵を描けることは何よりも驚くべき機能だと思います。このテストではLLMの無料版を使っており、ChatGPT、Gemini、Claudeでは残念ながら望んだ結果を得ることができませんでした。しかし、無料でChatGPTを利用できるCopilotでは、画像生成の結果を得ることができました。無料で画像生成を行いたい場合は、MicrosoftのCopilotをお勧めします。