ChatGPT vs Gemini vs Claude3 vs Copilot:あなたに最適なLLM(大規模言語モデル)はどれ?

AI技術が急速に進化する中で、多くの人が「どのLLM(大規模言語モデル)を使えばいいのか?」と悩んでいます。特に、ChatGPT、Gemini、Claude3、Copilotといった各種モデルには、それぞれ異なる特徴があり、選択が難しいですね。このブログでは、そんなあなたのために、これらのモデルの性能と特徴をわかりやすく比較分析します。

Sara Nanase
April 16, 2024

最近、急速に進化したAIテクノロジーにより、新しい言語処理モデルであるLLM(大規模言語モデル)が登場しました。LLM(大規模言語モデル)は、膨大なテキストデータを学習することで、人間のような言語理解力と表現力を発揮できるようになっています。

LLMの中核となっているのは、語彙、文法、文脈などの言語的特徴を理解するための自然言語処理(NLP)技術と、大量のデータから規則性を見出すマシンラーニング(機械学習)の融合です。これにより、LLM(大規模言語モデル)は、質問への回答、文書要約、翻訳、創造的な文章作成など、さまざまな言語活用分野で優れた性能を発揮できるようになりました。

代表的なLLMサービスには、ChatGPT、Gemini、Claude3、Copilotなどがあり、各モデルには固有の特徴と強みがあります。どのような目的で使用するかによって、最適なモデルを選択することが重要です。今回は、これらのLLM(大規模言語モデル)モデルの無料版の性能と特徴を比較していきます。

ChatGPT

OpenAIが、開発したChatGPTは、自然な会話能力と豊かな文脈理解で知られる対話型人工知能モデルです。詳細な回答と創造的なアイデアの提供に優れています。

Gemini

Geminiは、Googleが提供するLLM(大規模言語モデル)で、Gemini Ultra、Gemini Pro、Gemini Nanoに分類されます。Gemini Ultraは最高の精度を提供し、有料サービスで使用されています。Gemini Proは、一般的な対話型AIとして無料で利用可能です。また、Gemini Nanoはオンデバイス用に開発されました。

Claude3

AnthropicのClaude3は、その汎用性が高く、様々な分野で利用可能です。複雑な問題解決や創造的な文章作成に強みを持っています。

Copilot

最後に、Microsoftが提供するCopilotは、GPT-4とBingの検索技術を活用して、文章作成、コード生成、要約、翻訳、創作などに利用されます。

LLM(大規模言語モデル)の長所と短所

まず、LLM(大規模言語モデル)にそれぞれ自身の強みと弱点について答えさせると、以下のような回答が得られました。

質問:あなたの長所と短所を説明してください。

Copilotを除く他の3つのLLMは、それぞれの特性をよく理解しているようです。一方でCopilotは、自分の性格について語るのではなく、一般的な長所と短所の定義や、履歴書作成時に役立つような例を提供しています。これは、Copilotが自己分析よりも実用的な情報提供に重点を置いていることを示しているかもしれません。

各LLMの特性を理解することは、それらをどのように活用するかを決定する上で重要です。以下は、それぞれのLLMが自己認識に基づいて自身の可能性について語った例です。

  • ChatGPT:自分自身の長所と短所をよく理解しているように感じました。
ChatGPTの長所と短所
  • Gemini:情報が多すぎて、まるでおしゃべりな人のようです。
Geminiの長所と短所
  • Claude:他のLLMと同様に自身の長所と短所をうまく表現しました。また、最後に付け加えられた表現が他のモデルよりもより自然に感じられました。
Claudeの長所と短所
  • Copilot:唯一、自分自身の長所と短所について話していませんでした。Copilotの長所と短所について質問したとき、私が求めていた答えを得ることができました。
Copilotの長所と短所

日常生活の質問

質問:明日の東京の天気は?

リアルタイムデータの扱いについて知るため、私は明日の天気に関する質問をしました。リアルタイムデータを提供してくれたのはGeminiとCopilotです。一方で、ChatGPTとClaude3はリアルタイムデータにアクセスできないことを明確にし、ユーザーに外部の情報源を確認するよう指示しています。

  • ChatGPT :リアルタイムデータを提供できないと回答します。
ChatGPT:リアルタイムデータ
  • Gemini: 私たちがよく接する天気予報のように、画像とともにわかりやすく天気を知らせてくれます。特に、テキストを「読み上げる」機能が付いているので、非常に便利です。このような機能は、視覚情報だけでなく聴覚情報も提供するため、さまざまなニーズに対応できる利点があると思います。
Gemini:リアルタイムデータ
  • Claude3:ChatGPTと同様に、リアルタイムデータを提供できないと回答します。
Claude:リアルタイムデータ
  • Copilot:テキストだけでしたが、明日の天気情報を教えてくれました。
Copilot:リアルタイムデータ

質問:簡単に作れる夕食のおすすめメニューを教えてください。

全てのLLMがおすすめのメニューを提供しましたが、CopilotやGeminiはウェブと直接接続できるため、写真や動画を含むより具体的な情報が得られました。このような機能は、ユーザーがより詳細な情報を求める場合に特に便利です。

  • ChatGPT:メニューの一覧を分類なく教えてくれます。
ChatGPTの料理メニュー提供
  • Gemini:写真付きのレシピが提供され、画像をクリックすると別サイトの作り方を教えるサイトにリンクします。
Geminiの料理メニュー提供
  • Claude:料理の方法によってメニューが分類され、提供されます。分類されたおかげで、ChatGPTよりも見やすくなりました。
Claudeの料理メニュー提供
  • Copilot:写真は付いていませんが、情報元を教えてくれ、Geminiと同様にクリックすると別サイトの作り方を教えるサイトに繋がります。
Copilotの料理メニュー提供

分析的な質問

まず、Yahoo FinanceからNVIDIAの過去1年間のデータ(履歴データ)をダウンロードします。次に、4つの言語モデルに対して、そのデータに基づいた3つの質問をします。ただし、今回使用しているGemini無料版とGPT3.5無料版ではファイルの添付機能が提供されていないため、このテストは実施できませんでした。

質問:このファイルについて説明してくれ。

驚くべきことに、そのファイルに関する基本情報が何も提供されていなかったにもかかわらず、それが株取引データであると気付き、さらに各データ列の内容を分析してその意味を教えてくれました。

  • Claude 3:ファイルの内容が株価の推移データであることがわかります。
Claude:株データの分析情報
  • Copilot:日付のデータを選んで提供します。
Copilot:株データの分析情報

質問:RSI分析をしてくれ

  • Claude:RSIの推移を見ながら、分析をしてくれます。但し、全日付のRSI値は提供してくれません。
Claude:RSIの推移
  • Copilot:RSIの推移を見ながら、分析をしてくれます。Claudeでは、提供してくれないPythonコードを提供します。
Copilot:RSIの推移
Copilot:Pythonのコード

RSI分析をグラフと一緒に行ってください。

  • Claude:直接コードを実行することはできませんので、Pythonコードを提供します。
Claude:グラフ提供による、Pythonのコードの提供
  • Copilot:RSI分析のグラフまで提供してくれました。
Copilot:RSI分析のグラフ

画像生成機能

画力がない人にとって、テキストだけで思い通りの絵を描けることは何よりも驚くべき機能だと思います。このテストではLLMの無料版を使っており、ChatGPT、Gemini、Claudeでは残念ながら望んだ結果を得ることができませんでした。しかし、無料でChatGPTを利用できるCopilotでは、画像生成の結果を得ることができました。無料で画像生成を行いたい場合は、MicrosoftのCopilotをお勧めします

質問:下記のプロンプトで絵を描いて。

Cartoonish,Smiling baby bunny, big shiny eyes,Birthday party in the meadow, small animals around to celebrate the party,Bright atmosphere

  • ChatGPT:無料版のChatGPTは、画像生成機能が提供されません。
ChatGPT:画像生成機能
  • Gemini:Geminiも画像生成機能がないです。
Gemini:画像生成機能
  • Claude:邪念ながらClaudeも画像生成機能は、提供していません。
Claude:画像生成機能
  • Copilot:Copilotは、無料でChatGPTを利用できるツールの一つです。テストしたLLMの中で唯一、画像生成ができました。
Copilot:画像生成機能

画像の分析

今回は、画像を提供し、その画像を基にInstagramの投稿文とタグを作成するよう依頼しました。このテストを通じて画像分析の機能を試すことができました。ただし、テストは、ClaudeとCopilotの添付機能のみで行いました。

質問:添付した画像を描写してインスタグラムの投稿を作成してください。

3つの文章と5つのハッシュタグを作って。

  • ChatGPT:残念ながら、無料版のChatGPTには添付機能がないため、分析を行うことができませんでした
  • Gemini:Geminiでは、画像の添付はできましたが、人種差別対策でのアップデートのためか、画像機能の描写がうまく行えませんでした。
Gemini:画像分析機能
  • Claude3:Claude3では画像の添付ができ、回答も得られましたが、それが英語で提供されたため、再び日本語での回答を求めました。また、回答はインスタグラムのような雰囲気ではありませんでした。
Claude:画像分析機能
  • Copilot:Copilotの無料版では、Instagramの投稿文とタグ、そして、画像まで生成してくれました。
Copilot:画像分析機能

結論

今回のテストでは、LLM(大規模言語モデル)の無料版を使用したので、画像生成やファイルの添付機能などを完全に比較することはできませんでした。

それでも、有料版を使わずにAIの機能を十分に活用できた特別な体験でした。

全体的には、LLMの機能に大きな差は感じられませんでしたが、文章の作成や分析に関しては、ChatGPTやClaudeが文脈のつながりや内容の充実、日本語の表現がより自然でした。

リアルタイムのデータが必要な場合は、GeminiやCopilotを使う必要がありました。

また、画像生成に関しては、Copilotだけで十分な結果を得ることができました。

ChatGPTは、頭が良く能力が高いですが、少し共感力に欠けると感じました。Claudeは、共感力があり、ある程度の分析能力もありますが、まだ能力不足だと思います。Geminiは、何かしているようで少し不器用な印象です。Copilotは、控えめで何でも上手くこなす感じがします。

また、もっと多くの面白い質問で第2弾を準備します。

よくある質問

Q1: LLM(大規模言語モデル)とは何ですか?

A1: LLMは、大量のテキストデータを学習して人間のように言語を理解し生成するAI技術です。これにより、文章の要約、翻訳、質問応答など多岐にわたるタスクをこなせます。

Q2: LLM(大規模言語モデル)の主な利点とは何ですか?

A2: LLMの最大の利点はその柔軟性にあります。多様なテキストベースのタスクに適応し、精度の高い言語理解を提供するため、多くの業界で利用されています。

Q3: LLM(大規模言語モデル)の欠点は何ですか?

A3: 主な欠点は、大量のデータを必要とすることと、時には偏見を含むデータから学習してしまうことです。これにより、バイアス(偏見)が結果に影響を及ぼす可能性があります。

Q4: LLMを使用して画像を生成することはできますか?

A4: 一部のLLMは画像生成機能を提供していますが、利用可能な機能はモデルによって異なります。具体的な機能については、各モデルの仕様をご確認ください。

Q7: LLMを使ってInstagramの投稿を作成することは可能ですか?

A7: はい、LLMはテキスト生成に優れているため、魅力的なキャプションや効果的なハッシュタグを生成するのに役立ちます。ただし、具体的な画像内容の分析やタグの提案はモデルによります。

#LLM #AI #ChatGPT #Gemini #Claude #Copilot #LLM比較