著名エンジニアの中島聡氏が、「AIを使った映像制作ができる」ITコンサルタント氏に仕事を依頼した際、「週に2~3本の制作が限度」と言われてしまったエピソードを紹介する。時事ネタ動画を毎日配信したい中島氏は、「最低でも動画一本当たり1~2日の作業が必要」という説明に納得できなかった。そこで試しに、自ら開発した「MulmoCast」で台本・動画を自動生成してみたという。(メルマガ『週刊 Life is beautiful』より)
※本記事のタイトル・見出しはMAG2NEWS編集部によるものです
プロフィール:中島聡(なかじま・さとし)
ブロガー/起業家/ソフトウェア・エンジニア、工学修士(早稲田大学)/MBA(ワシントン大学)。NTT通信研究所/マイクロソフト日本法人/マイクロソフト本社勤務後、ソフトウェアベンチャーUIEvolution Inc.を米国シアトルで起業。現在は neu.Pen LLCでiPhone/iPadアプリの開発。
淘汰されようとしているビジネス
AIの進化によりさまざまなビジネスが淘汰されようとしていますが、まさにその典型のようなケースに遭遇したので、報告したいと思います。
少し前に書いたように、私はYoutubeチャンネルを開設すべく、準備を進めています。その過程で、知り合いを通じて「AIを使った映像制作ができるエンジニア」を紹介してもらい、ローンチに向けて作業を開始したのですが、すれ違いばかりなのです。
私が「動画制作は、生成AIを使って、可能な限り自動化したい」と言うと、アバターを使ってデモなどを作ってきてくれたのは良いのですが、かなり手作業で行っているようなのです。
最新の生成AI技術の勉強を積極的にしている点は評価できるものの、「どの技術を使えば良いコンテンツができるか」という部分にはあまり興味がないというか、自分の責任ではないと感じているようで、少しがっかりしました。
極め付けが、ビデオの配信の頻度の話になった時です。私が「時事ネタを毎日配信したい」と言うと、「最低でも動画一本当たり1~2日の作業が必要なので、最初は週に2~3本が限度」という返事が返ってきました。
私が当初から「映像制作は自動化したい」と主張し、MulmoCast(編註:マルモキャスト。中島氏が最近ベータ版をリリースしたマルチ・モーダルなプレゼンテーション・ツール)の前身であるai-podcaster(podcastの自動生成ソフト)のソースコードも渡しているにも関わらず、自動化の準備など全く進めていないことが判明したのです。
彼とのやりとりを通じて最終的に判明したのは、このエンジニアも昔からIT業界に存在する「人月工数で稼ぐITコンサルタント・ビジネス」から逃れられていない、という事実です。
私との関係も、彼にとっては「生成AIを使って動画を生成するたびに一本幾らで稼ぐビジネス」でしかなく、自動化はそのビジネスモデルに反するのです。最終的には、私自身がai-podcasterをMulmoCastに進化させて、「映像生成の自動化」を実現してしまいました。
「一般の人には難しいが技術者には簡単」な仕事はすべて消滅する
この件で明らかになったのは、これまで「映像を作る」「映像を編集する」などのITサービスを提供していた人たちの職が根こそぎなくなる、と言う事実です。
IT業界は日進月歩で、一般の人々には新しい技術を使いこなすことが難しいため、そのギャップを埋める「ITコンサルタント」なる職業が存在します。古くはウェブサイト作りから始まり、画像処理、音声処理、映像処理、データ処理など、ITコンサルタントたちは、さまざまな場面でビジネスを行ってきました。
ほとんどの場合、その作業は「一般の人には難しいが、技術者には簡単」な定型作業(創造力を必要としない作業)であり、それほど優秀ではないエンジニアにとっては、悪くないビジネスでした。
AIの急速な進化により、世界中のあらゆる「定型作業」がAIに奪われようとしており、この手の「ITコンサルタント・ビジネス」も例外ではありません。
従来型のビジネスが通用するのであれば、「生成AIを活用したアバタービデオの作成」は、ITコンサルタントたちにとって良いビジネスになったはずですが、これからは違います。
MulmoCastを開発していてつくづく思いますが、最近のAIは本当に優秀で、適切な環境さえ与えてあげれば、この手の定型作業はあっという間に、桁違いの安さでこなしてしまいます。(次ページに続く)
約5分、1ドル以下のコストで「ITコンサルタントの仕事を奪ってみた」実例
今回私が実験的に、次ページに掲載の「MulmoCastとは」の文章をChatGPTに読み込ませ、MulmoScriptというプレゼン用の中間言語でスクリプト(台本)を書くように指示したところ、あっという間に以下のスクリプトを作ってくれました。
このスクリプトをMulmoCastを使って映像化したものをYoutubeにアップロードしたので、是非ともご覧ください。
ちなみに、この映像の生成には、以下のAIモデルが活用されています。
- スクリプトの作成:gpt-4o(OpenAI, ChatGPT)
- 音声合成:gpt-4o-mini-tts(OpenAI, API)
- 画像生成:gpt-image-1 (OpenAI, API)
- 翻訳:gpt-4o(OpenAI, API)
これらのAPIを呼ぶコストは、映像一本当たり1ドル以下(150円以下)で、時間は約5分です。作業に数時間を要するITコンサルタントには出番がありません。(次ページに続く)
今回の映像の元になった「MulmoCastとは」の文章全文
1ヶ月ほど前から本腰を入れて開発をしているMulmoCastですが、ようやく、一言で「MulmoCastとは何か」を表す言葉が見つかりました。それは、
「AIと人間の協働を前提にした、マルチ・モーダルなプレゼンテーション・ツール」
です。
現在、プレゼン・ツールとして幅広く使われているのは、PowerPointとKeynoteですが、どちらも生成系AIが誕生する前に設計されたアプリケーションです。当然ですが、人間がプレゼン資料を作る(もしくはプレゼンをする)ために作られたアプリケーションです。
今後、プレゼンに限らず多くのコンテンツ制作の現場で、AIが主導的な役割を果たすことは、技術の進化を見れば容易に予測できます。そんな時代に相応しい、ai-nativeな(=自然言語を理解するAIの存在を意識した上でゼロから設計し直した)プレゼンテーション・ツールがあっても良いと思うのです。
最近のAIはかなり賢くなり、文章はもちろん、画像、映像、音楽なども作れるようになりました。しかし、AIの力を最大限に引き出すには、「AIにとって仕事をしやすい環境」を整えてあげる必要があります。MulmoCastは、そんな環境を整えるためのツールです。
MulmoCastを設計するにあたって、MulmoScriptというスクリプト言語を導入しました。これは、映画の台本、もしくはウェブ・ページのHTMLに相当するもので、AIがプレゼン資料を作る際に生成する中間言語です。たとえば、ある商品の特徴を説明するプレゼン資料を作る場合、MulmoScriptはその構成や説明の文章、表示する画像や動画などの指示を一元的に管理する台本のような役割を果たします。
MulmoScriptは、大規模言語モデルが自動生成することを強く意識したJSONベースの中間言語で、AIがこの言語を通じて人間にさまざまな情報を伝えることを可能にするために作られました。
MulmoCastを設計する上で、もう一つ強く意識したのが、多様化する情報へのアクセス方法(モード)です。従来型の全員が会議室に集まるミーティングや教室で行われる講義は、もはや少数派で、Zoomを通して行われる会議や授業、Slackを通じて行われる非同期なコミュニケーション、通勤電車の中でスマホで見る動画、運転中に聞くpodcastなど、ライフスタイルやシチュエーションにより、人々は、様々な「モード」で情報にアクセスするようになったのです。
そう考えると、これからの時代のプレゼンテーション・ツールは、スライド・デッキだけでなく、映像、ポッドキャスト、PDFドキュメントなど、さまざまなモードでの出力を可能にする「マルチ・モーダル」なプレゼンテーション・ツールである必要があるのです。
GoogleのNotebookMLには、集めた資料に基づいたpodcastを作成する機能がありますが、MulmCastを使えば、ChatGPTやClaudeを活用して、資料に基づくポッドキャストを生成することができます。さらに、スライドデッキ、漫画、映像、PDFドキュメントなど、さまざまな形式のコンテンツを生成することも可能です。
(本記事は『週刊 Life is beautiful』2025年5月27日号を一部抜粋・再構成したものです。「MulmoCastのベータ版をリリースしました」「Alconカンファレンスでのファイアーサイド・チャット」「フォートワース観光」「AIの能力を引き出す方法」「私の目に止まった記事」や読者質問コーナー(今週は13名の質問に回答)などメルマガ全文はご購読のうえお楽しみください。初月無料です ※メルマガ全体約1.6万字)
【関連】中島聡が驚いた「ChatGPTが人間の医師を超えた瞬間」AIネイティブな医療サービスが主治医と患者に笑顔をもたらす理由
【関連】中島聡が「ラピダスの大敗北」を直感する理由。TSMCになれない日本の半導体メーカーが抱える「最大の弱点」とは?
【関連】中島聡がガチでテスト、「今一番賢いローカルAI」のすごい実力。Phi-4やGemma3を知らない人、そろそろヤバいかもです
image by: MAG2NEWS