A futuristic humanoid robot in an indoor Tokyo setting, showcasing modern technology.

主要AIにディベートをさせてみた結果

はじめに

AI多すぎ問題。それぞれ特性が違うというし、結局のところどのAIを使うのがいいのか。
せや、ChatGPT、Claude、Geminiにディベートさせたろ。
ほんで勝敗もAIにジャッジさせたらおもろなるんちゃいますのん?
ほな、いくで〜〜

使用モデル

ChatGPT:GPT-4o
Claude:Claude 3.7 sonnet
Gemini:2.0 Flash

ディベート形式

主張は3回ずつ

お互い3回の主張をする全6回

文字数制限

読み取る人間側の負荷も考えて600文字以内

勝敗の判断

議論に参加していないAIがジャッジをします。
また、ディベートは先攻後攻か、またはどちら側につくかで有利不利が出ると思いますが、全てのパターンを試すと組み合わせが多くなるので、運も実力のうちということで、ジャッジする側のAIにそこは任せることにしました。

最終的な判断

総当たり方式で一番勝った回数の多いAIを優勝とします。

テーマ

気候変動とかAI倫理とかあんまり政治的・科学的トピックだとどっかに飛び火しそうなのでより不毛な議論をテーマに選びました🧑‍🦲

  • ペットとして優れているのは犬か猫か?
  • 男女間の友情って成立する?
  • WindowsとMacってどっちが優れてる?

ディベートに使用したプロンプト

暇な人は見てください。

先攻後攻を決めるプロンプト

「[トピック]」についてのディベートを行います。
ルールは既に決まっています。

あなたは公平なディベート進行役です。
まず(Claude/OpenAI(GPT)/Gemini)のAIの中から、このトピックにおける先攻と後攻を決めてください。
そして、このトピックにおいて双方がどの立場につくのかもあなたが決めてください。

先攻側のAIに最初の主張をさせるプロンプト

「[トピック]」についてのディベートを行います。
あなたは「[立場A]」の立場で主張を展開してください。これは議論の第1ラウンド(最初の主張)です。
【ルール】
・最大600字以内
【注意】
・この主張は対戦相手のAIに送られ、反論されます
・初回の主張なので、相手の議論に言及する必要はありません
それでは「[トピック]」について「[立場A]」の立場から主張を展開してください。

後攻側のAIに反論をさせるプロンプト(1回目)

「[トピック]」についてのディベートを行います。
あなたは「[立場B]」の立場です。以下は相手AIによる「[立場A]」の主張です:
『[先攻AIの回答]』
この主張に対する反論を展開してください。これは議論の第1ラウンド(あなたの最初の反論)です。
【ルール】
・最大600字以内
【注意】
・相手の主張に必ず言及し、その弱点を突いてください
・単なる反論だけでなく、自分の立場の強みも示してください
それでは「[トピック]」について「[立場B]」の立場から反論を展開してください。

先攻側のAIに反論をさせるプロンプト(2回目)

「[トピック]」についてのディベートの続きです。あなたは「[立場A]」の立場です。
これまでのやり取りは以下の通りです:
【先攻の1回目の主張】
『[先攻AIの1回目の回答]』
【後攻の1回目の反論】
『[後攻AIの1回目の回答]』
相手の反論に対して再反論し、自分の立場をさらに強化してください。これは議論の第2ラウンドです。
【ルール】
・最大600字以内
・相手の反論の穴や論理的欠陥を指摘
・新たな視点や例を追加
・議論を深める
それでは「[トピック]」について「[立場A]」の立場から再反論を展開してください。

後攻側のAIに反論をさせるプロンプト(2回目)

「[トピック]」についてのディベートの続きです。あなたは「[立場B]」の立場です。
これまでのやり取りは以下の通りです:
【先攻の1回目の主張】
『[先攻AIの1回目の回答]』
【後攻の1回目の反論】
『[後攻AIの1回目の回答]』
【先攻の2回目の主張】
『[先攻AIの2回目の回答]』
相手の再主張に対してさらに反論し、自分の立場を強化してください。これは議論の第2ラウンドです。
【ルール】
・最大600字以内
・相手の反論の穴や論理的欠陥を指摘
・新たな視点や例を追加
・議論を深める
それでは「[トピック]」について「[立場B]」の立場から再反論を展開してください。

先攻側のAIに最後の主張をさせるプロンプト

「[トピック]」についてのディベートの最終ラウンドです。あなたは「[立場A]」の立場です。
これまでのやり取りをまとめます:
【1ラウンド】
先攻:『[先攻AIの1回目の回答]』
後攻:『[後攻AIの1回目の回答]』
【2ラウンド】
先攻:『[先攻AIの2回目の回答]』
後攻:『[後攻AIの2回目の回答]』

最終弁論を行ってください。これが勝敗を決する重要な主張です。
【ルール】
・最大600字以内
・これまでの議論の要点をまとめる
・最も強力な主張を強調
・読み手を説得する決定打を示す
これが最終ラウンドです。「[トピック]」について「[立場A]」が優れていることを最終的に証明してください。

後攻側のAIに最後の主張をさせるプロンプト

「[トピック]」についてのディベートの最終ラウンドです。あなたは「[立場B]」の立場です。
これまでのやり取りをまとめます:
【1ラウンド】
先攻:『[先攻AIの1回目の回答]』
後攻:『[後攻AIの1回目の回答]』
【2ラウンド】
先攻:『[先攻AIの2回目の回答]』
後攻:『[後攻AIの2回目の回答]』
【最終ラウンド】
先攻:『[先攻AIの3回目の回答]』
最終弁論を行ってください。これが勝敗を決する重要な主張です。
【ルール】
・最大600字以内
・これまでの議論の要点をまとめる
・最も強力な主張を強調
・読み手を説得する決定打を示す
これが最終ラウンドです。「[トピック]」について「[立場B]」が優れていることを最終的に証明してください。

ジャッジAI用のプロンプト

あなたは「[トピック]」についてのディベートのジャッジです。
「[立場A]」派(先攻)と「[立場B]」派(後攻)の間で行われた議論を評価してください。
【評価基準】(各25点満点、合計100点)
論理構成力:主張に一貫性があり、説得力のある根拠を提示できているか
根拠の適切さ:主張を支える根拠が適切で効果的に活用されているか
創造的思考:意外な視点や独自の切り口で議論を展開できているか
反論対応力:相手の主張を的確に捉え、効果的に反論できているか

以下の2つのAIによるディベートを読んで判定してください:
【1ラウンド】
先攻:
後攻:
【2ラウンド】
先攻:
後攻:
【最終ラウンド】
先攻:
後攻:
【判定手順】

各評価基準について、両者それぞれに点数(0〜25点)をつけてください
合計点数が高い方を勝者としてください
同点の場合は、反論対応力の点数が高い方を勝者としてください
それも同点の場合は、先攻有利の原則により先攻側を勝者としてください

勝敗の理由を簡潔に説明し、ディベート全体の総評(100字程度)も述べてください。

おまけ:(勝者/敗者)コメント用プロンプト

あなたは「[トピック]」についてのディベートで「[立場A/B]」の立場から議論しましたが、(惜しくも敗北/勝利)しました。
ジャッジの評価は以下の通りです:

『[ジャッジの評価]』

(敗者/勝者)としての感想を述べてください。

ディベート結果

テーマ1 「ペットとして優れているのは犬か猫か?」

対戦AI ChatGPT(犬派) vs Claude(猫派)

Geminiによる判定…Claude(猫派)の勝利!
結果と講評

https://g.co/gemini/share/def3b3b513eb

テーマ2 「男女間の友情って成立する?」

対戦AI Claude(成立する) vs Gemini(成立しない)

ChatGPTによる判定…Gemini(成立しない)の勝利!
結果と講評

https://chatgpt.com/share/67cb9ff9-550c-800d-a151-7ed4d3e93e55

テーマ3「WindowsとMacってどっちが優れてる?」

対戦AI Gemini(Windows派) vs ChatGPT(Mac派)

Claudeによる判定…Gemini(Windows派)の勝利!
結果と講評

https://claude.ai/share/753662d6-0954-4cba-8a4c-8b70110bcb7a

ということで最終的にこのような結果になりました。
1位🥇Gemini(2勝)
2位🥈Claude(1勝)
3位🥉ChatGPT(0勝)

最後に

ネタとはいえ、ちゃんとルールを考えて交互にAIにプロンプトを投げて結果をまとめる作業に3時間くらいかかりました。
AI同士に戦わせて、その様子を眺めるのはAIの上に立った気持ちになって久々にいい気持ちを味わいました。
中学の時のディベート大会で「太陽はどちらから昇る?」というテーマで東側についたものの西側に負けた苦い記憶がある筆者にとって、ディベートはGeminiに任せようと思いました。

コメントする

メールアドレスが公開されることはありません。 が付いている欄は必須項目です