[AI 最新情報紹介ブログ] - [Chain of Thought（思考の連鎖）とは]

Chain of Thought（思考の連鎖）とは | AI 最新情報紹介ブログ

"Chain of Thought（思考の連鎖）"とは、「難しい問題を解くときに、頭の中でステップを踏んで考える方法」のことです。

例えば、数学の問題を解くときに、いきなり答えを出すのではなく、

・問題の内容を理解する
・どんな計算が必要か考える
・ひとつずつ計算していく
・最後に答えを出す

というふうに、順番に考えていきますよね？このように考える過程を順番にたどることを「Chain of Thought」といいます。

AIも同じように、一気に答えを出すのではなく、途中の考え方も自分で整理しながら答えを導き出すことができます。これにより、より正確で論理的な答えを出せるようになるのです。

簡単にいうと、「考えながら問題を解く」という方法ですね！

2023年～2024年には単純な生成AIが大ブレークしました。しかしこれは脊髄反射的に単純な回答をするだけです。難しい問題は分割したり、プロンプトを工夫する必要がありました。
しかしこのChain of Thoughtにより、より複雑な推論が可能となりました。

OpenAIのo1モデルは「Chain of Thought（思考の連鎖）」と呼ばれる手法を活用しています。この手法により、モデルは回答を生成する前に内部で段階的な思考プロセスを経ることで、複雑な問題に対する推論能力を向上させています。

具体的には、o1モデルは大規模な強化学習を通じて、問題解決のための思考プロセスを洗練し、異なる戦略を試行し、誤りを認識・修正する能力を習得しています。
このアプローチにより、物理学、化学、生物学などの分野で博士課程の学生と同等のパフォーマンスを発揮し、数学やコーディングのタスクでも優れた成果を上げています。
ただし、この内部の思考プロセスはユーザーには直接表示されず、モデルの応答時間が従来のモデルよりも長くなる場合があります。

要約すると、OpenAI o1はChain of Thought手法を活用し、複雑な問題に対する推論能力を高めたモデルです。

Chain of Thoughtを採用したモデル
・OpenAI o1
・GoogleのPaLM
・DeepSheekR1

Chain of Thoughtの例

問題: あるお店でリンゴを3個買いました。1個100円ですが、10%の消費税がかかります。合計いくらでしょうか？

・初期のAI (CoTなし)

答え：「330円」 (計算なしで回答)

・Chain of Thought

リンゴ1個の値段は100円
3個買うので 100 × 3 = 300円
消費税は10%なので 300 × 0.1 = 30円
合計は 300 + 30 = 330円
答え：330円

(解法のポイント)
1つずつ手順を踏んで考える
間違えにくくなる
複雑な問題にも対応できる

[AI 最新情報紹介ブログ] - [Chain of Thought（思考の連鎖）とは]