日々進化し続けるAIのめまぐるしいほどのスピードに驚きを隠せない昨今ですが、GoogleのNotebookLM(Googleが提供しているGeminiを用いたAIリサーチアシスタント)の「音声概要」(ファイルをまとめた概要をラジオのように語り合ってくれる機能)が日本語に対応したことが話題になっています。メルマガ『石川温の「スマホ業界新聞」』の著者でケータイ/スマートフォンジャーナリストの石川さんは、これを使ってみた感想として、本当に人間が話しているかのような自然さに驚いたとして、将来の「可能性」を感じたと述べています。
グーグルのNotebookLM、音声概要が日本語に対応—-ポッドキャスト番組の完成度に可能性を感じた
グーグルのNotebookLMの音声概要が日本語に対応した。
NotebookLMは以前、このメルマガでも取り上げたが、文書やPDF、音声ファイル、YouTube動画のリンクなどを放り込むと、そのなかから内容をまとめてくれて、チャットで答えてくれるというものだ。
筆者はインタビュー取材をする機会が多いが、同録のファイルをNotebookLMにアップすると、インタビューの概要は表示され、さらに「彼はこれについてどう言っていたっけ?」とチャットで質問をすると、それに対してキチンと答えてくれるというものだ。
これまで、インタビュー取材をした際には、最初からすべて聞き直し、テキストに起こすということをしていた。インタビュー記事を「質問」と「回答」といったように記述していく記事ならば、いままでの通りのテキスト起こしが必要だが(それもAIによるテキスト起こしで楽になっているが)、筆者のような地の文に取材対象者の発言を引用するような原稿の場合、NotebookLMで、必要なところをチャットで質問して、抜き出すので十分なのだ。
NotebookLMを使うことで、いままでよりも、かなり効率よく、原稿を書けるようになった。
そのNotebookLMにおいて「音声概要」という機能があるのだが、これは様々なファイルをまとめた概要を、男性と女性がラジオ番組のように語り合ってくれるというものだ。いままでは英語のみであったが、今週、日本語を含む50以上の言語に対応した。
実際に試してみると、これが実に自然な会話になっていてびっくりさせられる。
もちろん、サービスを開始したばかりなので、内容は結構、間違いが多い。数字が違っていたりすることはとても多い。漢字については読み方を間違えていたりもする。
内容は話半分に聞かなくてはならないのだが、ただ「あー」とか「えっと」とか、本来はできるだけ言わないほうがいいフィラーなんかも、あえて入れているのが、NotebookLMの驚くべき点だ。フィラーを入れることで、自然さが増しているのだ。
NotebookLMに関してはグーグルによるオンライン説明会が開かれたのだが、当然、今後の進化として、漢字の読み方を修正できたり、声のキャラクターが増えていくようだ。
試しに作った「ドコモMAXはどんなユーザー向けなのか」というポッドキャスト風ファイルをYouTubeに上げているが、結構なクオリティに達しているように思える。
ただ、プレスリリースをNotebookLMに読みこませるだけだと、単なるストレートニュースを紹介するだけにしかならない。
ここで、重要になってくるのが「パーソナライズ」だ。
「ドコモMAXはどんなユーザー向けなのか」というポッドキャストでは、NTTドコモが配ったプレスリリースやプレゼン資料に加えて、自分がいくつかの媒体で執筆した原稿も読み込ませている。これによって、他にはない視点が混ざったポッドキャスト番組になっている感じがしている。
単なるストレートニュースはNotebookLMによって、ポッドキャスト番組化されていくだろうが、そこにどんな視点を入れ、演出していくかという点においては、まだ人のチカラがあった方がいいような気がしてならない。
この記事の著者・石川温さんのメルマガ
image by: Robert Way / Shutterstock.com