【翻訳】サム・アルトマンが語る、OpenAIの未来、ChatGPTの起源、そしてAIハードウェアの構築

AIによる要約:サム・アルトマンは本インタビューで、OpenAI設立の背景と初期の困難、ChatGPTの誕生と進化、そして今後のAIのあり方について語った。今後のモデルは記憶や継続性を持ち、OSのように人々の生活に深く統合されていくと述べた。また、AIとエネルギー、ロボットの融合が新たな豊かさを生む鍵になるとし、少人数のチームでも大きな成果を上げられる時代が来ると強調した。最後に、起業には信念と継続力が必要であり、それは子育てと同じくらい困難だが価値があると語った。
「わかりました、AGIを目指します」と私たちは言いました。世界の99%は私たちが正気ではないと思いました。残りの1%は本当に共鳴してくれて、「10年か20年のうちに、何か大きな失敗がない限り、想像もつかないようなスーパーインテリジェンスを手にすることになる」と考えました。これは、技術の歴史上、会社を始めるには最も良い時代です。
インタビュアー:サム、本日はご参加いただきありがとうございます。また、これまでのインスピレーションにも感謝します。OpenAI自体が、本当に野心的な人にとっての真のインスピレーション源です。では、そこから始めましょう。初期のうちに一見小さく見えて、実は非常に重要だった意思決定にはどのようなものがありましたか?
サム:まず、始めると決めたこと自体が大きなものでした。実はOpenAIを始めないまま終わる寸前だったのです。AGIは狂ったアイデアに見えました。私は当時Garyの役職に就いていて、他にもたくさん魅力的なスタートアップの仕事がありました。AGIは夢のような話でしたし、たとえそれが実現可能だとしても、DeepMindが遥かに先を行っているように思えました。だから私たちは、2015年の1年間をかけて設立について話し合っていましたが、それはまるでコインを投げて決めるようなものでした。
サム:多くの野心的な試みはこのような経緯を辿ると思います。非常に困難で、「やめておけ」という理由があまりにも多いために、本当に限られた数人が部屋に集まって、お互いの目を見て「よし、やろう」と言うことが必要なのです。これはとても重要な瞬間です。迷ったときには、そういった瞬間に身を任せるべきだと思います。
サム:やるべきではないと思える理由は、何十億もありました。たとえば、スケーリング法則を見つけたこともそのひとつです。もうすぐ10周年になります。ありがとうございます。当時のAIに対する空気感を思い出すのは非常に難しいです。最初の言語モデルが登場するずっと前で、私たちはゲームをプレイさせようとしたり、小さなロボットハンドにルービックキューブをやらせようとしたりしていました。本当にかろうじてできるレベルでした。製品のアイデアもなく、収益もなく、「いつか収益が出るかもしれない」という見込みすらありませんでした。
サム:私たちは会議室のテーブルやホワイトボードの前に座り、論文のネタを考えていました。今となっては、当時それがどれほど非現実的に思われていたかを説明するのは難しいです。ChatGPTというアイデア自体、完全にサイエンスフィクションの範疇でした。
インタビュアー:私が特に印象的だったのは、AGIに取り組むべきだと掲げると同時に、それに取り組んでいた最も優秀な人々を集めた点です。
サム:実はその二番目の部分は、思ったよりも簡単でした。「このクレイジーなことに取り組もう」「もしうまくいけば、重要かつ興奮することになる」「他にやっている人がいない」と言えば、人々は実際に集まってくれるのです。私たちは「AGIに挑む」と決めました。世界の99%は私たちを狂っていると考えましたが、1%は本当に共感してくれて、その1%の中には多くの賢い人々がいたのです。
サム:彼らには他に行く場所がなかったので、才能を集中させることができました。そしてそれは、人々が本当に意義を感じられるミッションでもありました。可能性は低そうでも、うまくいったときの価値が非常に高い。これは私たちがスタートアップで何度も目にしてきた現象です。他の人々と同じことをしていると、才能を集めるのも難しく、ミッションに本気で取り組んでもらうのも難しい。でも、唯一無二の取り組みをしていれば、追い風を得ることができます。
インタビュアー:この部屋にいる方々の中には、「OpenAIレベルの規模で最初からやってみるべきか」と考えている人もいるかもしれません。でも、あなたはLoopにも関わっていたと思います。そこから得た教訓はありますか?
サム:OpenAIは最初からOpenAIのような規模ではありませんでした。本当に、部屋に8人がいるだけ、次に20人。それが始まりです。何をすべきかは明確でなく、単に良い研究論文を書こうとしていただけでした。つまり、最終的に非常に大きくなるようなものも、最初からそういう形では始まりません。
サム:うまくいけば大きくなるかもしれないと夢を見ることは大切ですが、大きなものは最初からそうであることはありません。Vinod Khoslaの言葉で、私が常に気に入っているものがあります。「1億ドルのスタートアップと、0億ドルのスタートアップには大きな違いがあるが、どちらも収益はゼロで、数人が部屋に座って、最初の一歩を成功させようとしている」というものです。
サム:だから、「何か大きなものを始めたい」という人への唯一のアドバイスは、「うまくいけば大きくなる可能性がある市場を選ぶ」ことです。それ以外は、しばらくの間は「愚直に一歩ずつ」進むことになります。
インタビュアー:ChatGPTの使われ方は大きく変わりました。APIの使い方も変わりました。では、最新のモデル(GPT-4-turboなど)で最も驚かされた点や、今際立っている創発的なユースケースには何がありますか?
サム:今は非常に興味深い時期にあります。しばらくこのようなフェーズはありませんでした。現在は、モデルの能力と比較して、製品として実装されている範囲が非常に限られている状況です。モデルが今後一切改善されなかったとしても、まだまだ作るべき新しいものが膨大にあります。
たとえば、先週のGPT-4-turboの使用コストは、今週の5倍でした。これは今後も下がり続けます。性能あたりの価格の下落幅に人々は驚くことになるでしょう。
私たちは近く、オープンソースモデルも公開予定です。ここで先に発表してチームの功績を奪うことはしたくありませんが、皆さんの予想をはるかに上回るものになると思います。ローカルで非常に強力なモデルを実行できるようになるという点で、多くの人がその可能性に驚かれるでしょう。
今、モデルの能力は新たな領域に突入しました。APIのコストは劇的に低下し、オープンソースモデルは非常に優れたものになるでしょう。そして、これらの推論モデルの能力に見合うようなプロダクトイノベーションは、まだ目にしていません。それも無理のない話です。なぜなら、これらのモデルはまだ新しいからです。
しかし、今はこの新しい存在――周期表に新しく追加された要素のようなもの――を使って何かを創るには絶好の時期です。
私の実感としても、ようやくこの1か月で「推論モデルはまったく別のものである」と理解したスタートアップが現れ始めたように思います。
インタビュアー:私にとっても、メモリーは「このAIは私のことを理解している」と感じさせるようになりました。それは非常に興味深いことです。
サム:メモリーは、私たちが今年リリースした中で、私個人としては最も気に入っている機能です。OpenAI社内ではそう思っていない人も多いかもしれませんが、私はChatGPTのメモリーが大好きです。
この機能は、今後の製品が進むべき方向性を示しています。つまり、あなたのことを理解し、あなたのあらゆるデータと接続され、積極的に支援してくれるような存在になるという方向です。
もはや「あなたがメッセージを送ったら、それに返答が返ってくる」というだけではなく、常時動作し、あなたの状況を見て、必要なタイミングでメッセージを送ってきたり、あなたの代理で行動したりします。
あなたは新しい種類のデバイスを手にし、それがあなたが使うあらゆるサービスと統合され、日常生活の中でずっと一緒に動作する存在になります。
メモリーは、人々がその未来を初めて垣間見られる機能になっていると思います。
インタビュアー:以前あなたは映画『her/世界でひとつの彼女』についてツイートしていました。あのような未来はいつ到来するのでしょうか?何か「アルファ版」のようなものがありますか?
サム:答えは「少しずつ」です。もし私が明確な日付を知っていれば、おそらく今ここで興奮してその日を皆さんに伝えているでしょう。でも、現時点では段階的に実現しつつあるという感じです。
たとえば、今のメモリーにはその一部があります。次の段階では、バックグラウンドで常時動作し、あなたに通知を送るような機能が登場するでしょう。さらにその次には、新しいデバイスを出荷することになると思います。
『her』の本質は、小さなハードウェアではなく、「バックグラウンドで常時動作し、AIの伴侶のように感じられる存在」であることです。
インタビュアー:LMS(大規模モデル)の力が、実データと統合されて発揮され始めていますね。MCP(Microsoft Copilot Platform)がOpenAIにも導入されるという話を聞きましたが、それは今日のことですか?
サム:たしかに今日だと思います。
インタビュアー:素晴らしいですね。実際の統合で意外だったことはありますか?たとえば人々が本当に自分の中核的なデータベース上で操作しているのを見ましたか?
サム:YC(Y Combinator)では実際に社内でエージェントインフラを使っていますが、それを常用しています。間違いなく、人々はChatGPTをまるで自分のオペレーティングシステムのように使い始めています。そして、あらゆるデータソースと統合することが重要になっています。
常に手元にあるデバイス、新しい種類のWebブラウザ、すべてのデータソースとの接続、メモリー、そして常時動作するモデル――これらがすべて組み合わさると、非常に強力な状態に到達します。
インタビュアー:将来的には、クラウドでそれが動作すると思いますか?それともローカルPCで?あるいはその両方の混合ですか?
サム:間違いなく両方の混合になると思います。ある用途ではローカルモデルが動作することになるでしょう。たとえば、ChatGPTの負荷の半分をローカルデバイスに押し出せるなら、我々としても非常にうれしいです。なぜなら、近いうちに世界で最大かつ最も高価なインフラストラクチャを運用することになるからです。それを一部でもオフロードできるなら助かります。
とはいえ、大部分はクラウドで動作し続けることになるでしょう。
インタビュアー:コンピューティングリソースを確保することの難しさに、あなたは驚きましたか?
サム:私たちはこの分野に非常に熟達してきましたが、それでも難しいです。2年半前にはchat.openai.comというサイトは存在していませんでした。それが今では世界で5番目に大きいWebサイトになっています。将来的には3番目、もしかすると成長率が維持できれば1番目になるかもしれません。
それを達成するのは、どんな手段であっても大変なことです。通常、新興企業がこのレベルのインフラをスケールアップするにはもっと時間がかかります。それでも、多くの人が助けたいと申し出てくれています。
インタビュアー:あなたたちがやっていることは本当に驚異的です。GPT-4-turboのような推論モデルが、GPT-4oなどのマルチモーダルモデルと並行して進化しています。この2つの流れが融合したとき、何が起きると考えていますか?GPT-5およびその先にあるもののビジョンはどのようなものですか?
サム:GPT-5でそのすべてを実現することはできませんが、最終的には、必要に応じて推論し、必要に応じてリアルタイム映像を生成する統合モデルを作りたいと考えています。
たとえば、あなたが何か質問をしたとき、それに対してその場で深く考え、リサーチを行い、必要であればコードを書き、あなた専用のアプリを作成し、あるいはライブ映像をレンダリングして、インタラクション可能にする――そういうことができるようになります。
それはAIが既にある程度実現している「新しいタイプのコンピュータインターフェース」となるでしょう。しかし、真に完全なマルチモーダル性、完璧な映像生成、完璧なコーディング能力、そして深い推論力を持つモデルが実現されれば、それは非常に強力な存在になります。
インタビュアー:その先にあるのは、身体性を持ったAI、つまり「実体を持つAI」ではありませんか?視覚、音声、推論能力が揃えば、それはもはやロボットになるのでは?
サム:私たちの戦略としては、まずそこ(視覚・推論など)を完璧に仕上げることです。そのうえで、それをロボットに接続できるようにします。ロボットの時代も間もなく到来すると思います。
たとえば、ChatGPTの最上位プランに申し込んだら、人型ロボットを無料で送付する、というような未来が来るかもしれません。それは本当に奇妙な世界になるでしょうが、現実になりつつあります。
実世界で本物の仕事をこなせるロボットが登場するまで、それほど時間はかからないと思います。もちろん、ロボットの機械工学的な側面は非常に難しく、またロボットに必要な認知的AIの部分も難しかったですが、いまやそれは手の届くところまで来ています。
サム:数年のうちに、ロボットは本当に役立つ作業をこなせるようになると思います。もちろん、10億台のロボットを製造するにはまだ時間がかかるでしょう。でも私は興味があるのです。「サプライチェーンを完全に自動化するには、どれだけのロボットが必要なのか?」という問いに。
たとえば、人型ロボットを従来の方法で100万台作ったとします。そのロボットたちが鉱山機器を操作し、コンテナ船を操縦し、製鉄所を稼働させ、新しいロボットを作ることができるなら、かなり短期間で世界に多数のロボットを配備できるかもしれません。
ただ、現時点の供給網で想定されている以上に、人型ロボットの需要ははるかに高くなると思います。
インタビュアー:かつてあなたが私の立場にいたとき、YC(Y Combinator)で「ハードテックへの投資を増やす」というリードを取りました。今この地政学的な状況下において、アメリカが実際に製造業と産業能力を持ち続けられるようにするには、何が必要でしょうか?精密ネジや大きな金属板すら、コスト超過なしには作れない現実があります。
サム:いろんな人がいろんな政策を提案してきましたが、従来の方法ではうまくいっていないのは明らかです。だから、私は新しいアプローチを試すべきだと思います。AIとロボティクスは、それを実現するための新しい手段を私たちに与えてくれます。
製造業を再びアメリカ国内に取り戻し、複雑な産業をここで再構築するには、この新たな技術を活用するしかないというのが私の直感です。それは、少なくとも「試す価値がある」ことだと思います。
インタビュアー:ここで皆が気にしている古典的な質問があります。「OpenAIに潰されずに済むスタートアップをどう作るか?」というものです。
サム:私たちは、皆さんの邪魔をしたくはありません。私たちは私たちのことをしっかりやるだけです。そして、ChatGPTを最高のスーパーアシスタントにするために必要なことを加えていきます。それが私たちの役割の一部です。
しかし、それは目の前にある機会全体の中のごく一部にすぎません。ですから、誰かが「自分は新しいスタートアップを作って、ChatGPTのクローンを作るぞ」と言ってくると、少し悲しくなります。なぜなら、私たちはその分野では既にかなり先行しているし、そこは私たちがうまくやれると確信しているからです。
サム:ただし、ChatGPTの上に構築された他のすばらしい企業がたくさんあります。それは本当に喜ばしいことです。今後は、皆さんが構築するスタートアップに対して、ChatGPTから大量のトラフィックを送れるような構造にしたいと考えています。
ChatGPTの中に「新しいアプリ」や「エージェント」やその他の形の「ストア」のようなものを作り、そこから新しいスタートアップへと人を誘導できるようにしたいのです。
たとえば「OpenAIでログインする」という機能を提供すれば、ユーザーが自分のパーソナライズされたモデルを持ち、それを簡単に他の新しいスタートアップと接続できるようになります。それによって、多くの利点が生まれるでしょう。
私たちは「他人が何かを作るためのプラットフォーム」でありたいと考えています。アドバイスとしては、「私たちが作っている中核のチャットアシスタントそのものは作らないでください」とお伝えしたいです。
サム:とはいえ、もう一つの問題があります。これは過去のあらゆるスタートアップのタイミングに共通することですが、人々は同じことに同時に興奮してしまうという性質を持っています。
だからこそ、自分が本当に考え抜いた、自分だけが思いついたようなアイデアを作るべきです。他の人たちが何をしているかに影響を受けずに。
今Garyが「AIでよく聞く5つのアイデア」を読み上げたとしたら、おそらくこの部屋の半分は、それらのうちどれかに取り組んでいるはずです。
でも、この中に、いつかOpenAIよりも大きな会社を作る人がいるとしたら、その人はその5つのアイデアのどれにも取り組んでいないはずです。
サム:みんなが同じことをやっている中で、防御力のある(=競合に潰されない)ものを作るのは難しいです。もちろん、時にはそれでもうまくいくことはありますし、不可能ではありません。でも、最も長く続く企業というのは、他の誰とも違うことをやっている企業です。そのおかげで、何が最高のプロダクトなのか、どうやって技術を構築するのかを考える時間を得られるのです。
私たちがChatGPTで「防御力」のある仕組みを作るまでには、かなり時間がかかりました。最初のうちは、唯一市場に存在するプロダクトだったということだけが、唯一の防御力でした。
その後、ブランドが知られるようになり、メモリーや外部サービスとの接続機能など、いろいろな「本物の防御要素」を持てるようになりました。
ただ正直に言えば、当初は私たちに明確な防御戦略などありませんでした。ただ「唯一のまともなプロダクトが存在していた」というだけだったのです。
ですので、一定の猶予期間内に、明確な防御力を持つ仕組みを作らなければならないということです。
インタビュアー:過去にも話題に出ていましたが、私たち二人ともピーター・ティールの思想に強く影響を受けています。彼は「正しくありながら逆張りであれ」と語っています。
サム:ピーターは間違いなく天才です。
インタビュアー:あなたは、本当に根本的なレベルで「逆張り」であることを貫いてきたと思います。たとえば、スケーリング法則に価値があるという主張は、今でこそ常識ですが、当時はまったくそうではありませんでした。
そのような反発を受けたとき、あなたやチームはどう感じていましたか?「反発があるということは、ここが逆張りポイントであり、私たちの賭けどころだ」と思ったのでしょうか?
サム:多くの人から「お前は間違っている」と言われる中で、自分の信念を保ち続けるのは難しいです。それを「簡単だ」と言う人は正直ではありません。
ただ、それは時間が経つにつれて少しずつ楽になります。
たとえばこれは公になっている話なので言いますが、OpenAIを始めて数年後、イーロン(マスク)から非常に厳しいメールが届いたことがあります。当時、私たちは彼と協力していました。彼は「お前たちの成功確率は0%だ」と言い放ちました。ゼロです。完全に失敗していると。
ちょうどGPT-1を見せた直後のことで、「これはクソだ」「意味がない」と言われました。彼は私にとってヒーローのような存在だったので、その夜は本当に落ち込みました。「彼の言う通りだったらどうしよう」「これは最悪だ」と思いました。
自分の人生を捧げて取り組んでいるものに対して、自分が尊敬する賢い人たちから「完全に間違っている」と言われる。防御力がない、競合に潰される、何もかもがダメだ――と。
これに対して魔法のような答えはありません。本当に辛いものです。ただ、時間が経てば徐々に耐性がつきます。そして、皆さんも同じようなことを経験すると思います。そのたびに倒れても立ち上がり、埃を払って前に進むしかありません。
インタビュアー:AIエージェントについて話しましょう。これは、いわばAGIレベル3とも言える分野です。最近グレッグ・ブロックマンも「今年はエージェントの年になる」と話していました。OperatorやCode Interpreterのようなツールが出てきた今、これから消えていくワークフロー、あるいは新たに登場するワークフローにはどのようなものがあると予想していますか?
サム:長い間、ChatGPTはGoogleの代替のような存在でした。つまり、Google検索と同じくらいの長さの質問を投げる、あるいはGoogleで30分くらいかけて調べるようなことを、1回で返してくれる存在という感じです。それはそれで非常に良かったのですが、それでも「より高度な検索」にとどまっている印象でした。
しかし今では、たとえばCode Interpreterや深いリサーチタスクを与えて、それがいろんな作業をこなして結果を持ち帰ってくれるという使い方ができるようになってきました。それは、非常に優秀なジュニア社員のような存在です。短時間で集中して何かに取り組み、その成果を持ってくる。
世界中で行われている仕事のうち、実際には「数時間、パソコンの前でできるタスク」というものがどれだけ多いかを考えてみてください。そしてそれらの多くは、誰かが「これは十分よくできている」「これは不十分だ」と判断すれば済むようなものです。そう考えると、これは本当に大きなインパクトをもたらす分野になると思います。
これこそが、先ほど言った「製品側の遅れ」に該当する部分です。そして、GPT-4-turboだけでもこういった使い方は可能であり、次のモデルになれば、さらに多くのことができるようになります。
インタビュアー:人とコンピュータのインターフェースは今後どう変わっていくと考えていますか?そして、現在のインターフェースにどのような限界を感じて、それを動機にしてきたのですか?
サム:SF作品が正しく予見していたことのひとつに、「インターフェースがほとんど見えなくなる」という考えがあります。音声インターフェースは、現在では「微妙なもの」として扱われていますが、それは性能がまだ不十分だからです。
理想的には、たとえばあなたがコンピュータに「今日はこういうことを全部やってほしい」と伝えるだけで、遅れがあったり変更が生じたりしたら、それもすべて自動で調整して実行してくれる。あなたは中断されることもなく、考える必要もない。ただ信頼して任せることができる。それが実現されれば、インターフェースは消えたも同然になります。
例外的に、それが本当に素晴らしい人間アシスタントのような存在として、あなたに話しかけてくる場面があるかもしれませんが、それはむしろうれしい瞬間になるはずです。
今、私がスマホを使うときは、まるでニューヨークのタイムズスクエアを歩いているような感覚になります。人にぶつかられ、あちこちから通知が飛んでくる。スマホは素晴らしい技術ではありますが、通知、ポップアップ、明るい色、点滅する要素などで、非常にストレスフルです。
でも、私はこう想像します。コンピュータが「ほぼ見えなくなる」ようなインターフェースがあったら――必要なことは全部してくれて、しかも判断も的確で、重要なときにだけ適切に情報を見せてくれる。そういったインターフェースの実現にはとても期待しています。
サム:新しいデバイスについて、ここでは詳しくは言いません。個別に聞かれたらお話ししますが、この場では伏せます。ただ、私はそれによって「人々がコンピュータとのまったく新しい付き合い方」を実感できるようになることを強く望んでいます。
インタビュアー:それが理由で、ジョニー・アイブ氏(Jony Ive)という、世界最高峰のインダストリアルデザイナーの一人をチームに招いたのですか?
サム:はい。彼は本当に素晴らしい人物です。世間で語られている評価はすべて正しいと思います。
この50年で、コンピュータのインターフェースにおける大きな革命は、たった2回しか起きていないと思います。ひとつは、キーボードとマウス、画面によるインターフェース。そしてもうひとつは、タッチ操作とスマートフォンです。
それに匹敵する新しい何かが登場する機会は、めったにありません。しかしAIは、この分野をまったく新しいものにする可能性を秘めています。
そして、もしその「まったく新しいもの」を発見するために誰か1人だけを選ばなければならないとしたら、それは彼(ジョニー・アイブ)であることは明らかです。
インタビュアー:最近YC内部でも議論しているテーマがあります。これは、多くのB2B SaaS企業のソフトウェアエンジニアにとっては怖い話かもしれません。もし将来、データベースがあり、その上にAPIレイヤーがあり、それがアクセス制御や業務ロジックを処理する。そしてフロントエンドのインターフェースはLLM――つまり大規模言語モデルになるとしたらどうでしょうか。
たとえば、ユーザーが複雑な操作を求めたとき、LLMがその都度コードを生成して対応する。必要があればファイルも作成してくれて、再び取り出せる。そうした未来は現実になるのでしょうか?
サム:それは確実に起きると思います。
ここで2つの見方ができます。まず、皆さんが今スタートアップを始めようとしている、あるいはすでに始めている前提でお話しします。今は、技術史上、これまでで最も良いタイミングです。本当に、断言できます。
ただし、それが最良である理由のひとつは、「地殻変動」が起きているからです。つまり、前提条件がすべて大きく変わろうとしている。だから、そうした話――たとえば「SaaS企業が築いたコードベースが、すべてその場で生成されるようになってしまう」といったことは、確かに不安要素でもあります。
でも、それは全員に起こることです。そして、スタートアップが勝つときというのは、こういった大きな変化があるときなのです。
スタートアップは、大企業よりもはるかに早く動けます。そして、大企業の強みの多くは「コストが高い」という前提に依存していますが、そのコストが劇的に下がると、大企業のアドバンテージも失われます。
ですから、私はこういう変化を「問題」として見るのではなく、「誰もが同じ条件で直面するチャレンジとチャンス」と捉えるべきだと思います。
業界のクロックサイクルがこれほど大きく変わる時代には、スタートアップが勝つのが常です。そして今回は、これまでで最大級の変化です。その方向から攻めるのが良いと思います。
サム:今度、私を講演に呼んでいただけるなら、「時間と共に構築できる防御力のある領域にはどんな種類があるか」について話すのは面白いと思います。
というのも、さきほどの「SaaS企業がやがてすべてのソフトウェアをオンデマンドで生成する時代にどう対応するのか」という質問の裏には、「では実際、どうやって防御力を持たせるか?」という問いが隠れていると思うからです。
それは、いずれきっと面白い話題になるでしょう。
インタビュアー:数回前のイベントのバックステージで、「セブン・パワーズ」という、マッキンゼー系の古典的な経営書の話をしましたね。まさか私たちのようなテクノロジストが、マッキンゼーのコンサルタントが引用するような本を実際に引き合いに出すとは、昔は考えられませんでした。
サム:正直、美的にどうかとは思いますが(笑)、でも、はい、『セブン・パワーズ』ですね。
インタビュアー:では、次の時代――つまり知能の時代が本格的に始まったこの現代についてです。あなたのエッセイ『The Age of Intelligence(知能の時代)』も読みましたが、これからの10年、私たちはどう生き、どう働き、どうやって社会全体として価値を生み出していくべきだと思いますか?
サム:ある意味で、テクノロジーの歴史全体は、ひとつの物語とも言えます。それは、「科学を発見し、それをもとにより優れた道具を作り、それによって社会全体の足場が一段ずつ高くなっていく」という物語です。
つまり、ひとつのツールチェーンが次の世代へと引き継がれ、それによってひとりの人間が、過去の人々よりもはるかに大きなことをできるようになる。それがテクノロジーの目的だと思います。
そして、この流れはずっと続いてきました。たとえば今の人が、100年前や1000年前の人と比べて、どれほど多くのことを成し遂げられるようになっているかを考えてみてください。
社会の「契約」はこうです――今の世代は、次の段階の足場を作り、さらにその先の世代がそれを使ってもっと多くのことを実現する。
今この新しい層――つまりAIというツールが構築され、手に入ったことで、人ができることは本当に劇的に広がると思います。
私が思うに、これからの10年で最も大きく変わるのは、「たった一人の人間、あるいは少人数のチーム」が成し遂げられる成果の大きさです。
これは一見、些細な変化に思えるかもしれませんが、実際には非常に大きなインパクトをもたらします。
なぜなら、「人同士の調整コスト(コーディネーションコスト)」というのは、実は極めて大きいからです。
ですから、ひとりの人間、または少数の自律性のある人々に、より多くの知識・道具・リソースを与えられるようになれば、「ちょっとだけ」ではなく「本当に大きく」世界が変わると思います。
サム:一人または少人数のチームが実現できる量、それを成し遂げることの満足感、そして最も重要なのは、お互いに提供し合える成果の質――これらが今後飛躍的に高まると思います。
OpenAIのこれまでの歴史を振り返るとき、私は、信じられないほどの成果を出してきた数十人のコアメンバーのことを真っ先に思い浮かべます。
けれども同時に、こう考えることも大切だと思っています。私たちがここまで到達できたのは、何千万人、あるいはもっと多くの人たちが、長い時間をかけて積み重ねてきたおかげです。岩を掘り出し、半導体を理解し、コンピュータを作り、インターネットを築いてきた。そうした人類全体の成果の上に、私たちは立っているのです。
もしそれがなかったら、少数精鋭の私たちであっても、今のような成果を生み出すことなど到底できなかったはずです。
インタビュアー:この部屋の人々は、すでにあなたの話に強く共感している人たちばかりですが、それでもなお驚かされるのは、世の中の大多数の人――おそらく75億人のほとんどが、こうした技術をまだ試してもいない、あるいは「うまく動かない」「幻覚(ハルシネーション)が出る」といった否定的な印象だけを持っているという現実です。
今ここにいる3000人の前で、あなたは何を伝えたいですか?
サム:これは、まさに「槍の先端」に立つような瞬間です。私たちは今、世界にこの技術を最初に届け、使い方を教えている立場にあります。それは、非常に素晴らしいポジションです。
私がYCで働いていて最も楽しかったことのひとつは、常に最前線にいるという感覚を持てたことでした。そして、周囲には常に先鋭的な人たちがいた。
それは、人生を生きる上でとても面白い方法だと思います。未来を先取りし、それを形にする手助けができる。わずかでもその未来に影響を与えられるかもしれない。それは特権的な立場だと感じています。
サム:AIは、今やある程度「主流」になったとも言えるでしょう。ただし、多くの人はAIを「ChatGPT」のことだと捉えています。そして、ChatGPTを実際に使っている人もたくさんいますが、それでも「ただのチャットボット」としてしか使っていないのです。
そしてまだ、これから何がやってくるのか、その本質を理解している人は少ないと思います。
皆さんのような人々は、たぶんすでに理解しているでしょう。でも、私たちは今、「未来の中に少しだけ足を踏み入れている状態」にあります。そして、それを他の人たちのために先に作っておくのです。
それは本当に素晴らしいことだと思います。
インタビュアー:あなたは「世界中の優秀な人材を集める」という点で、おそらく最も優れた人物の一人です。この部屋にいる多くの人は、まだ誰かをマネジメントしたこともなければ、大企業の高収入ポジションを辞めさせてまで、自分のビジョンのために人を巻き込むという経験もないと思います。
そのような人々にとって、チーム作りで最も難しかった教訓は何ですか?
サム:本当に頭が良くて、明らかにやる気があり、生産性が高く、チームとしてもうまく働ける人を雇うこと――それだけで、成功の9割は達成できると思います。
それなのに、人々が採用において他のことばかり重視してしまうのは、私にとって常に驚きです。
ですので、短時間ではありますが、条件を挙げるとすれば、「本当に賢い」「内発的に動ける」「勤勉である」「過去に成果を出している」「チームワークができる」「会社のビジョンに共感している」、そして「みんなが同じ方向に向かって進んでいる」――これらがそろえば、だいたいうまくいきます。
インタビュアー:その「実績がある」という点ですが、たとえば20年間、一流の機関で管理職を務めてきた人も含まれますか? それともあなたが重視してきたのは、もっと別のタイプの人材でしょうか?
サム:特にスタートアップの初期段階においては、私はそういう人たちをあまり雇うべきだとは思いません。
もちろん経験は重要ですし、そういった人材が本当に必要になるタイミングも来ます。ですが、正直に言うと、私はああいった「非常にシニアで、名の通った管理職タイプの人材」を最初の採用として迎えてうまくいった経験がありません。
そして、YCとしても、その手の人材をスタートアップ初期に迎え入れて成功した例はあまり多くありません。
私だったら、若くてガッツがあって、明らかに「結果を出せる」人材を選びます。実績はあまり華やかでなくても、自分で物事を動かしてきた人の方がいいです。
そういう人の方が、非常に洗練された経歴を持つ人より、初期段階でははるかに適していると私は思います。
サム:私は応募書類を読むとき、経歴欄――「Googleにいた」とか「この大学を出た」といったところ――はまったく見ません。私が真っ先に見るのは、「この人が成し遂げた中で、最も印象的なことは何か?」という項目です。
そこに納得できなければ、ようやく次に履歴書を確認する、という順番です。
サム:PB(Patrick Collison)がよく言っているのですが、「Y切片でなく、傾きで採用せよ(hire for slope, not y-intercept)」という言葉があります。私はこの言葉が本当に素晴らしいと思います。
インタビュアー:では、OpenAIのCEOであることについてうかがいます。それを通じて得た最も困難な教訓にはどのようなものがありますか?
サム:正直に言うと、あまりおすすめできる仕事ではありません。
一つひとつの課題は、個別にはそれほど大変ではないかもしれません。けれども、それらをすべて同時にこなさなければならないという点において、想像を超える大変さがあります。
私たちに敵対的な姿勢を取っている巨大企業も多数存在します。そうした中で、絶え間なく文脈を切り替えながら、大きな意思決定を次々に行っていかなければならない。しかも、それぞれの決定は全く異なる種類の問題であることが多いのです。
私はこの仕事に就くまで、そこまでの量のコンテキストを一度に処理するというのが、人間にとって可能なのかどうか、考えたことすらありませんでした。
インタビュアー:10年後、20年後を見据えたとき、あなたが個人的に最も楽しみにしていることは何ですか? そして、今から人々が取り組むべきことは何だとお考えですか?
サム:まず前提として、ここにいる方々は皆、技術者か研究者だと思いますので、それを踏まえてお話しします。
10年、20年後――もしこの間に大きな問題が起きなければ、私たちは「想像を絶するほどのスーパーインテリジェンス」を手にしているでしょう。それがどう展開するのか、非常に楽しみにしています。
もし一つだけ選べと言われたら、私は「科学のためのAI(AI for Science)」が最も楽しみな分野です。
私は、「長期的かつ持続可能な経済成長」というものは、第一に新しい科学的発見から生まれるものだと信じています。そして、その科学を正しく育て、世の中に広める制度やガバナンスもまた、不可欠です。
ですので、AIによって科学的発見のスピードを大幅に高めることができれば、それは全人類にとって計り知れない恩恵をもたらすと信じています。
その意味で、私はこの分野が次の10〜20年における最大の可能性を秘めていると思っています。
インタビュアー:私が個人的にとても感銘を受けたことのひとつに、あなたがHelionの創業者を直接リクルートして、彼らにYCの支援を受けさせたという話があります。彼らはいま、核融合の分野で非常に素晴らしい成果を上げていますよね。
エネルギーと気候の問題は、当時から重要視されていたと思いますが、当時からAIとエネルギーの結びつきを意識していたのですか?
サム:少し恥ずかしい話ですが、私は昔からAIとエネルギーに取り憑かれていました。ずっと「自分が最も情熱を注げる2大分野」だと思っていました。そして、時間と資本の大部分を、この2つに注ぎ込んできたのです。
ただ、OpenAIを始めるまで、両者がこれほど密接に関係してくるとは全く思っていませんでした。
私の中では、それぞれが独立した「極」だと思っていたのです。AIは「すべてのアイデアを生み出すため」に必要で、エネルギーは「それらのアイデアを現実に動かすため」に必要なものだと。
OpenAIを始めた直後、私は「AIにはエネルギーが必要だ」と突然気づいて、そこからエネルギーの意味がまったく違って見えるようになりました。
でも正直に言えば、2015年以前は、私はこの2つをまったく別物として考えていました。
サム:ご存知かもしれませんが、「一人あたりの高い生活水準」を実現するために必要なもの――つまり、すべてのエネルギー論者やテクノロジストが共有しているあの有名なグラフがありますよね。私はあのグラフにずっと取り憑かれていました。
インタビュアー:まさに部屋にいる全エフェクティブ・アクセラレーショニスト(加速主義者)たちが、間違いなく一度は見たことがあるグラフですね。
サム:そうです。あのグラフこそ、私がエネルギー分野にのめり込むようになった直接のきっかけのひとつです。長い長い人類の歴史を通じて、生活の質と、利用可能なエネルギーの量とコストが非常に強く相関しているという事実――あれは本当に驚くべきグラフです。
私にとって、あのような図表はとても説得力があるもので、だからこそエネルギー分野への執着が始まったのです。
インタビュアー:話を聞く限りでは、当初はAIとエネルギーを別個の関心領域として捉えていたけれど、今ではそれが完全に結びついているようですね。
サム:はい。当時の私にとっては、共通のベクトルというよりは「双子の関心」でした。私は「ラディカルな豊かさ(radical abundance)」という概念にとても強く惹かれていて、「未来を根本から良くするには、どの技術的レバレッジが最も有効か?」ということばかり考えていました。
その中で、AIとエネルギーが最も大きな鍵だと確信していたのです。
けれども、今ではそれが完全に融合しています。今では、「GPUを回しているだけで地球を加熱してしまうのではないか」とか、「いつ宇宙空間にGPUを移さないといけなくなるのか」といったことまで真剣に考えるようになりました。
でも、当時は本当に別々のベクトルだと思っていたんですよ。
インタビュアー:技術者たちが持つ特異な信念のひとつに、「本当に豊かさを創り出せると信じている」というものがあると思います。もし知能とエネルギーの両方が無尽蔵に使えるようになったら――それはどうなるのでしょうか?
サム:まさに、「慈悲深き機械たちに見守られる世界」ですね。
インタビュアー:(笑)私は、ヨーロッパで開催されているあのdegrowth(脱成長)カンファレンスには行ったことがないのですが、いつか行ってみたいと思っています。
サム:私も行ったことはありませんが、ぜひ一度体験してみたいですね。たとえば、暗くて寒い部屋で、誰もスマホを取り出さず、すべてがダメで、何の希望もない世界について延々と語り合う――そんな場に身を置いてみたいと思ったことはあります。
なぜなら、私は今まで一度もそういうマインドセットを持ったことがないからです。
私にとってそれは、最も共感しにくい思想運動のひとつです。もちろん、ここにいる皆さんは私の「仲間」であり「世界」でもあるわけですが、スタートアップ、サンフランシスコ、テクノロジー、AI、そして皆さんが今まさに手がけていること――そのどれもが希望に満ちています。
私は基本的に、そういう楽観的な領域に思考が自然と向かってしまう人間です。だからこそ、反対側の思想にはなかなか感情移入できません。
ただ、私はかなり確信しています。我々の側が「正しい」と。
インタビュアー:そのビジョン――つまり、テクノロジーによって他者のために豊かさを創出するという構想――に、私たちはどうやって到達すればよいのでしょうか?あなたはすでに多くのことを実現されましたが、私たちがそれをもっと加速させるには、何が必要だと思いますか?政府の役割も含まれるのでしょうか?
サム:ちょうど5年前の今週、私たちはGPT-3をAPIとしてリリースしました。当時、それはほとんど使い物にならず、正直、かなり恥ずかしいものでした。
それが今では、ほとんどすべての分野において、博士号レベルの知性を持つようになりました。
ですので、あと5年間、この成長スピードを維持できれば、それだけでもすごいことになると思います。そして同時に、そのインフラを人々に届ける体制も構築できれば、この部屋にいる皆さんが、それをもとに多種多様なニーズに応じた適応を進めることができるはずです。
私がAIのたとえとして最も好んでいるのは、「トランジスタ(半導体素子)」です。
つまり、ある種の重要な科学的発見がなされると、あとは社会と経済が勝手に回り出す。仕組みがそのまま価値を創出していく。過去の例でも、それは比較的短い期間で生活の質を劇的に引き上げる結果になりました。
私は今回の変化は、あのとき以上に急速かつ急勾配なものになると見ています。ですが、方向性としては同じ流れになるでしょう。
つまり、私たちは「すごい技術」を作り、残された科学的課題を解決し(その数はあまり多くありません)、そして皆さんが使えるインフラを整備する必要があります。
そしてその次にやるべきことは、皆さん自身が、「この魔法のような技術を使って、世界の人々が必要としているものを発見・実装する」ことです。
インタビュアー:では、2005年に戻りましょう。Y Combinatorの初期バッチです。当時、あなたはどうやってポール・グレアムのことを知ったのですか?彼のエッセイを読んでいたのですか?
サム:はい。彼にはネット上に一種のカルト的なフォロワーがいましたが、私が「サマーファウンダーズ・プログラム」(後のY Combinator)を知ったのは、当時同じ学生寮に住んでいたブレイク・ロス(Firefox開発者)がFacebookに投稿したのがきっかけでした。
それを見て「へえ、こんなものがあるのか」と思い、すぐに応募しました。
サム:そしてポールが「君は1年生だよね? 次のバッチに参加できるよ」と言ってくれました。
インタビュアー:そのとき、あなたはどんなメールを返信したのですか?
サム:ちょうどその話題が出たので、2、3日前にそのメールを掘り起こして確認したんです。なぜなら、自分の記憶が時間とともに歪んでいるような気がしたからです。
ポールの話では、私は「2年生です。参加します」とだけそっけなく返したように語られていたのですが、実際には、もっと丁寧に「すみません、ちょっと誤解があったかもしれません。実は私は2年生なんですが、もしまだ間に合うのであれば、ぜひ参加させていただきたいです」と書いていました。
インタビュアー:ということは、今あなたが座っているこの椅子――それは、2005年にあなたが座っていた立場から見れば、ちょうど3000人の中のひとりという位置づけだったわけですね。では、当時のサム・アルトマンに今何かひと言アドバイスを送れるとしたら、どんな言葉をかけますか?
サム:それは――「もっと早く教えておいてほしかった」と思うことがたくさんあります。
つまり、やってみて初めてわかることがとにかく多かったということです。あなたも体験したように、「実際にやってみないと理解できない」という感覚が確かにあります。
サム:私は、もっと早く「信念(conviction)」と「持続的な粘り強さ(resilience)」の重要性を誰かに教えてもらいたかったです。
最初のうちは誰でもエネルギーがありますし、簡単に頑張れるのですが、長期的にその精神を保ち続けるのは本当に難しいです。みんなその点についてあまり語らないのですが、それこそが最大の困難です。
最初のスタートアップがうまくいかなかったからといって、多くの人がそこで諦めてしまいます。でも、スタートアップというのはそもそも高確率で失敗するものです。
重要なのは、それでもなお継続できるかどうか――失敗を経験したうえで、そこから学び、次に進めるかどうかです。
そして、もうひとつ大事なのは、自分自身の直感に対する信頼を少しずつ育てていくことです。時間が経つにつれて、自分の意思決定や判断力が洗練されていく。その中で、自分の直感にも自信が持てるようになります。
また、自分が本当に信じていること――たとえそれが今の時代の「流行」とはズレていても――それをやる勇気を持つことも極めて大切です。
サム:最近、子どもが生まれました。
そして、すべての人から同じことを言われました。「子育ては人生で最も素晴らしいことになるよ、でも最も大変なことにもなるよ」と。
本当にその通りでした。良い部分は想像以上に素晴らしく、困難な部分は想像以上に厳しいです。
でも、それは起業にもまったく同じことが言えると思います。
起業の良い部分は、あなたが想像しているよりも遥かに良いです。そして、困難な部分は、想像しているよりも遥かに厳しいです。
ただ、それでもやる価値はあります。