OpenAIで先進的なAIモデルの開発を率いるヤクブ・パチョッキ氏は、AIが自律的に知識を生成できるようになりつつある現在の状況を、「ビジネスと研究における転換点」と表現している。
同氏によれば、いわゆる「推論モデル」は、従来の人間の思考とは異なるが、独自の方法で論理的な推論を行っているという。これらのモデルは、大量のデータを取り込む「事前学習」と、強化学習と人間からのフィードバック(RLHF)による「応用学習」の2段階で構築される。特に後者は、複雑で正解が一義的でない課題にも対応可能であり、最新の推論モデルにとって不可欠な要素となっている。
ただしパチョッキ氏は、事前学習と強化学習を分離して考えるべきではないと指摘する。AIは「空っぽの状態から思考を学ぶ」のではなく、すでに構築された世界モデルに基づいて推論を行っているからである。現在の研究は、両者の連携をいかに最適化するかに焦点を当てており、OpenAIのCEOサム・アルトマン氏も同様の方向性を示している。
最新の論文では、推論訓練が新たな能力を付与するのではなく、既存の知識をより効果的に活用するための「構造化」を促すものとされている。パチョッキ氏は、AIが商業的成果を出し、自律的に研究を進められるようになることが、AGI(汎用人工知能)に最も近い状態だと考えている。
OpenAIとマイクロソフトは、AGIの進捗を経済的成果、具体的には「1,000億ドルのリターン」によって測定する方針を採用しており、これはパチョッキ氏の経済中心のAGI観と一致している。
※本記事は、以下の記事をもとに翻訳・要約しています。
THE DECODER「OpenAI’s chief scientist Jakub Pachocki says there is evidence that AI models discover novel insights」
コメント
AIが知識を自律的に生み出す時代が近づいています。OpenAIの研究者は、AGIとは単なる知的能力の集積ではなく、実際に商業的価値を生むシステムだと捉えています。こうした視点は、研究や開発に携わる人だけでなく、ビジネスにAIを取り入れたい企業にとっても重要な指針となるでしょう。今後、AIがどのように社会や経済に貢献していくか、その進化の行方に注目です。