今回の映像の元になった「MulmoCastとは」の文章全文
1ヶ月ほど前から本腰を入れて開発をしているMulmoCastですが、ようやく、一言で「MulmoCastとは何か」を表す言葉が見つかりました。それは、
「AIと人間の協働を前提にした、マルチ・モーダルなプレゼンテーション・ツール」
です。
現在、プレゼン・ツールとして幅広く使われているのは、PowerPointとKeynoteですが、どちらも生成系AIが誕生する前に設計されたアプリケーションです。当然ですが、人間がプレゼン資料を作る(もしくはプレゼンをする)ために作られたアプリケーションです。
今後、プレゼンに限らず多くのコンテンツ制作の現場で、AIが主導的な役割を果たすことは、技術の進化を見れば容易に予測できます。そんな時代に相応しい、ai-nativeな(=自然言語を理解するAIの存在を意識した上でゼロから設計し直した)プレゼンテーション・ツールがあっても良いと思うのです。
最近のAIはかなり賢くなり、文章はもちろん、画像、映像、音楽なども作れるようになりました。しかし、AIの力を最大限に引き出すには、「AIにとって仕事をしやすい環境」を整えてあげる必要があります。MulmoCastは、そんな環境を整えるためのツールです。
MulmoCastを設計するにあたって、MulmoScriptというスクリプト言語を導入しました。これは、映画の台本、もしくはウェブ・ページのHTMLに相当するもので、AIがプレゼン資料を作る際に生成する中間言語です。たとえば、ある商品の特徴を説明するプレゼン資料を作る場合、MulmoScriptはその構成や説明の文章、表示する画像や動画などの指示を一元的に管理する台本のような役割を果たします。
MulmoScriptは、大規模言語モデルが自動生成することを強く意識したJSONベースの中間言語で、AIがこの言語を通じて人間にさまざまな情報を伝えることを可能にするために作られました。
MulmoCastを設計する上で、もう一つ強く意識したのが、多様化する情報へのアクセス方法(モード)です。従来型の全員が会議室に集まるミーティングや教室で行われる講義は、もはや少数派で、Zoomを通して行われる会議や授業、Slackを通じて行われる非同期なコミュニケーション、通勤電車の中でスマホで見る動画、運転中に聞くpodcastなど、ライフスタイルやシチュエーションにより、人々は、様々な「モード」で情報にアクセスするようになったのです。
そう考えると、これからの時代のプレゼンテーション・ツールは、スライド・デッキだけでなく、映像、ポッドキャスト、PDFドキュメントなど、さまざまなモードでの出力を可能にする「マルチ・モーダル」なプレゼンテーション・ツールである必要があるのです。
GoogleのNotebookMLには、集めた資料に基づいたpodcastを作成する機能がありますが、MulmCastを使えば、ChatGPTやClaudeを活用して、資料に基づくポッドキャストを生成することができます。さらに、スライドデッキ、漫画、映像、PDFドキュメントなど、さまざまな形式のコンテンツを生成することも可能です。
(本記事は『週刊 Life is beautiful』2025年5月27日号を一部抜粋・再構成したものです。「MulmoCastのベータ版をリリースしました」「Alconカンファレンスでのファイアーサイド・チャット」「フォートワース観光」「AIの能力を引き出す方法」「私の目に止まった記事」や読者質問コーナー(今週は13名の質問に回答)などメルマガ全文はご購読のうえお楽しみください。初月無料です ※メルマガ全体約1.6万字)
【関連】中島聡が驚いた「ChatGPTが人間の医師を超えた瞬間」AIネイティブな医療サービスが主治医と患者に笑顔をもたらす理由
【関連】中島聡が「ラピダスの大敗北」を直感する理由。TSMCになれない日本の半導体メーカーが抱える「最大の弱点」とは?
【関連】中島聡がガチでテスト、「今一番賢いローカルAI」のすごい実力。Phi-4やGemma3を知らない人、そろそろヤバいかもです
image by: MAG2NEWS