中島聡氏が見つけた「AIブーム」の伸び代。「GPT-4oは小学生でも解ける問題を間違える」からこそ「世界モデルを持つLLM」に投資資金が流入する

20240827_satoshi-nakajima_eye
 

現役エンジニアはもちろん市場関係者からも注目を集めているメルマガ『週刊 Life is beautiful』より、必読記事を無料でご紹介します。著者の中島聡さんは「Windows95の父」として知られる日本人エンジニア。そんな中島さんが、「今のAIブームは一過性のものではなく、まだ二合目ぐらいで、しばらくは積極的な投資が続く」と考える理由とは?
※本記事のタイトル・見出しはMAG2NEWS編集部によるものです/原題:LLMと世界モデル、Tesla FSDの映像、Functional Unblinding、ソフトウェアの未来、Wordleパズル

プロフィール中島聡なかじま・さとし
ブロガー/起業家/ソフトウェア・エンジニア、工学修士(早稲田大学)/MBA(ワシントン大学)。NTT通信研究所/マイクロソフト日本法人/マイクロソフト本社勤務後、ソフトウェアベンチャーUIEvolution Inc.を米国シアトルで起業。現在は neu.Pen LLCでiPhone/iPadアプリの開発。

「世界モデルを持つLLM」に高まる期待。AIブームはまだ2合目、人工知能市場の伸び代大きく

GPTに代表されるLLM(大規模言語モデル)が、研究者たちの予想を上回るほどの能力を発揮した今、彼らが次に目指しているのが、LLMにWorld Model(世界モデル)を持たせることです。

「世界モデル」とは、私たちが生まれてから、体を使って得た、重力・慣性・摩擦・反射・反作用などの物理法則を含めた、「私たちが生きている世の中は、こういうものだ」という主観的なモデル(=何かを理解したり説明したりするための、シンプルにした考え方)のことです。

私たちは、上に投げられたボールは下に落ちてくることを経験則から知っていますが、それこそが「世界モデル」で、それは、人間だけでなく、犬や猫も持っています。

LLMは、与えられた文章の次の言葉を予測するように教育された人工知能なので、もっともらしい文章を作ることは得意です。

しかし、犬や人間のように、自分の体を使って物事を体験していないため、世界モデルが(人工知能が持つニューラルネットの中に)構築されていないのが弱点です。

GPT-4oが間違える問題(1)「引くと書いてあるドアを押すと?」

この弱点が良くわかる問題を二つほど作り、ChatGPT(GPT-4o)に投げかけてみました。

20240827-nakajima_01

この問題は、「引く」と書いてあるドアを反対側から押すとどうなるか、という小学生でも分かるような簡単な問題が、LLMには解けないことを示しています。LLMが教育プロセスで与えられたデータの中に、引くべきドアの反対側から押すような記述がないから、と説明することも可能ですが、やはり実際の世の中の仕組みを自らの体で経験していないために「世界モデル」を持っていないという説明の方が、より汎用的です。

print
いま読まれてます

  • 中島聡氏が見つけた「AIブーム」の伸び代。「GPT-4oは小学生でも解ける問題を間違える」からこそ「世界モデルを持つLLM」に投資資金が流入する
    この記事が気に入ったら
    いいね!しよう
    MAG2 NEWSの最新情報をお届け