つまり、物事の発展発明っていうのは掛け算で起こっていくんですよ。例えば10年ぐらい前って、AIってそんな大したことできないよねって言ってたわけですね。
それはなぜかっていうと、そもそも言葉の認識が足りませんとか、言葉が認識できたとしても、じゃあその言葉から命令に置き換えることができませんとか、じゃあ命令がわかったとしても、それを表現することができません。
みたいな話が、例えば最近ChatGPTで、ジブリ風の絵を写真をちゃんと理解して作ってくれるよねっていうのも、あれも元々はインターネット上に絵や写真がいっぱいあふれて、しかも「この写真は○○なんだよ」っていう説明が横にあるっていう、写真とテキストっていうもののデータが世の中にあふれたから、AIがテキストと絵というものを結びつけることができるようになったんですね。
実は、ここ2年ぐらいで、人間がAIに命令して作った画像の数って、ここ20年間のインターネット上にシェアされた画像より多いんですよ。ということは何かっていうと、元々インターネットに散らばっていたテキストと画像で学習していたものから、インターネットにテキストを指示して画像が出る。
その画像が4つとか出てきたときに、「これがいいな」って人間が取捨選択するわけですよね。そうすると、その4つの画像をもう1回この画像をAIがテキストにしたときに、「この画像を選んだってことは、ユーザーの入力文とこのAIが作った文章がフィットしているのがこれなんだ」っていうことを学習するから、より学習をしやすくなったわけです。
さらにそういうことをやっていると、GPUのパワーがどんどんコンピューターの速度も上がるし、コストもかけれるようになったので、やがて本当の意味で画像とテキストというものを完全に一体に学習するっていうものがChatGPTができるようになったので、あれだけ見事な画風を表現したりとか、「このキャラクターを保持したまま4コマ漫画を描いて」って言っても、その4コマ漫画の中でさほどずれない、みたいなことが起こっていくっていうふうに、1個1個の進化にみんな驚くんですけども、それって積み重ねの掛け算なんですよね。
でも大事なことって、ーーー(『尾原のアフターデジタル時代の成長論』2025年4月7日号より一部抜粋。続きはご登録の上お楽しみください、初月無料です)
この記事の著者・尾原和啓さんのメルマガ
image by: Shutterstock.com