クロード3 試用

今日はClaude3を使って、GeminiやGPT-4と比較しながら同じ質問に対する答えを見てみましょう。

タスク1

この画像を中国語で説明してください:

Claude3

この画像は「この猫は階段を上っているのか、それとも下りているのか?」という問題を提示しています。画像には灰色の猫の背中が写っており、石段を歩いている様子が描かれていますが、画像の角度からでは猫が階段を上っているのか下りているのか判断できません。これにより、視点や認識に関する観者の思考を引き起こし、異なる人々によって異なる理解や意見を持つことがあります。また、これは面白い視覚的トリックでもあり、深く考えさせられます。

Gemini

この画像は、猫が階段を歩いている様子を捉えたものです。猫の頭と体は階段の上を向いており、おそらく階段を上っている可能性が高いです。しかし、階段の形状と猫の体の姿勢のため、一部の人々は猫が階段を下りていると考えています。この画像が錯覚を引き起こす理由は、階段の形状と猫の体の姿勢が対称性を持っているためです。画像を上下に反転しても、猫の姿勢は依然として合理的です。さらに、階段の手すりも誤解を招く要因となっています。手すりだけを見ると、猫が階段を下りているように感じられるかもしれません。猫が階段を上っているのか下りているのかを確定するためには、以下の詳細を観察できます:猫の耳:もし猫の耳が上を向いていれば、おそらく階段を上っているでしょう。猫のしっぽ:もし猫のしっぽが上を向いていれば、おそらく階段を上っているでしょう。猫の足:もし猫の足が前に伸びていれば、おそらく階段を上っているでしょう。これらの詳細に基づき、私は猫がおそらく階段を上っていると考えています。以下はこの画像の中国語での説明です:画像の説明:猫が階段を歩いている様子を捉えた画像です。猫の頭と体は階段の上を向いていますが、階段の形状と猫の体の姿勢により、一部の人々は猫が階段を下りていると考えています。錯覚の原因:階段の形状と猫の体の姿勢には対称性があります。さらに、階段の手すりも誤解を招く要因となっています。判断方法:猫の耳、しっぽ、足の姿勢を観察します。結論:画像の詳細に基づき、私は猫がおそらく階段を上っていると考えています。

GPT-4

この画像は、階段上の猫の視覚的錯覚です。画像の上部のテキストには、「この猫は上り中ですか、それとも下り中ですか?」と尋ねています。これは、画像が撮影された角度と階段の構造設計により、猫の進行方向を判断するのが非常に難しいためです。明確な視覚的な手がかりがないため、この写真は猫が上っているようにも見え、下っているようにも見えることがあり、これは観賞者が猫の姿勢や影をどのように解釈するかに依存します。この種類の画像は通常、観察者の視覚認識や脳が曖昧で不明確な情報をどのように解釈するかについて議論するために使用されます。

評価:ジェミニ(Gemini)は最も賢いですが、個人的には検索能力の問題だと思います。なぜなら、この画像はインターネットの古いものなので、この画像に関するさまざまな解析に対して、Googleの方がより多く見ているはずです。

タスク2

キーボードの上下左右キーを使って操作できる、実行可能なウェブ版の2048ゲームを作成してください。

Claude3

正常にプレイでき、キーボードで簡単に操作できます。


Gemini

コードが完了していないので、表示に問題があり、プレイもできません。


GPT-4

プレイ不可能


評価:このコードのタスクでは、Claude3が最も信頼できます。

タスク3

パズルの解答

Claude3

「?」を置き換えるには B を選択すべきです。6x6 の大きな図は 2x2 の小さな四角形で構成されており、各小四角形が一つの候補模様に対応しています。「?」がある 2x2 の四角形において、他の3つの格子の模様は選択肢 B と一致しているため、B が正しい答えです。

Gemini

答えは B) 000 です。推論プロセスは以下の通りです:

  1. 各フレーム内の円の数は、上段と下段の行にある円の数の合計に等しくなります。
  2. フレームの下の二つの数字は、それぞれ上段と下段の行に追加する必要のある円の数を表します。
  3. 「?」のフレーム内の円の数は7であり、上段にはすでに2つの円がありますので、上段に3つの円を追加する必要があります。
  4. したがって、答えは B) 000 で、これは上段の行に3つの円を追加し、下段の行には0つの円を追加することを意味します。要するに、B) 000 は四角の中の円の合計数を7にする唯一の選択肢です。

GPT-4

正しい答えはオプションDです。なぜなら、それは9つの点を持ち、パズルの増加規則に従っているからです。

分析:3つの大規模言語モデル(LLM)の答えはすべて正しくありません。正しい答えはAです。このタスクでは、行列の各行と各列において、黒い点が一意的に配置されるようにする必要があります。つまり、各行と各列には1つの黒い点しか存在してはいけません。

タスク4

文字IQ問題

問題: 3人の人物 Alex、Ben、Codyがいます。この中で1人は騎士、1人は無頼、1人はスパイです。騎士はいつも真実を言い、無頼はいつも嘘をつき、スパイは嘘をつくこともあり得るし真実を言うこともあります。Alexは「Codyは無頼だ」と言っています。Benは「Alexは騎士だ」と言っています。Codyは「私はスパイだ」と言っています。質問:誰が騎士で、誰が無頼で、誰がスパイですか?

Claude3

Alexが騎士、Benがスパイ、Codyが無頼です。理由:

  1. Alexは「Codyは無頼だ」と言っています。もしAlexが騎士であれば、Codyは無頼となります。
  2. Benは「Alexは騎士だ」と言っています。もしBenが無頼であれば、それは嘘であり、Alexは騎士ではありません。
  3. Codyは「私はスパイだ」と言っていますが、Codyが騎士であることは不可能です。なぜなら、騎士はスパイではないからです。したがって、唯一論理に合致する説明は、Alexが騎士、Benがスパイ、Codyが無頼ということです。

Gemini

騎士:アレックス 無頼:ベン スパイ:コーディ 解析:

  • アレックスはコーディが無頼だと言ったが、コーディは無頼ではない可能性があるため、アレックスは騎士またはスパイである只能说。
  • ベンはアレックスが騎士だと言ったが、ベンは無頼なので必ず嘘をつくため、アレックスは騎士ではない。
  • したがって、アレックスは騎士、ベンは無頼、コーディはスパイである。

GPT-4

簡潔な回答:アレックスは騎士、ベンはスパイ、コーディは無頼。簡単な解析:

  • もしアレックスが本当のことを言っている場合(つまり、コーディが無頼である場合)、アレックスは騎士です。
  • 騎士は常に真実を言うため、ベンがアレックスを騎士と言ったことは、アレックスが騎士であるという事実と一致します。
  • コーディは自分をスパイだと言いますが、無頼として彼の言葉は必ず嘘なので、コーディは無頼です。
  • したがって、残るベンはスパイでなければなりません。

分析結果:GPT-4とClaude3の回答は正しく、Geminiは誤っています。

タスク5

https://sdk.vercel.ai/ 上では、Google Gemini API がないため、Claude 3、Llama、および GPT-4 の速度を比較しました。皆さん自身で体感してみてください。

全体的に見て、Llama が最も速い応答を示し、次に GPT-4、Claude 3 は比較的遅いです。