fbpx

なぜTikTokだけが目の敵にされるのか?最先端フィルタリング能力を否定する米国議会の傲慢=牧野武文

ショートムービーが流行ることを予測した先見の明

張一鳴は、エンターテイメントの領域であれば、高い検索精度を示すアルゴリズムが開発できるのではないかと考えました。張一鳴は九九房を離れ、新たな会社を起業することを考えます。サスケハナの王瓊も賛成でした。そして、2012年3月に、張一鳴のマンションを売った資金とサスケハナの投資資金で、バイトダンスが創業されます。サスケハナは、バイトダンスへの投資で大儲けをすることになります。

このバイトダンス創業にあたって、張一鳴は大きなテーマを設定していました。スマートフォンの登場による変化に伴うものです。スマートフォンはいつでもどこでもインターネットにアクセスができるデバイスです。しかし、張一鳴はその「いつでもどこでも」ということよりも、意識の断片化が始まるということに注目をしました。

いつでもどこでもネットにアクセスできるようになると、電車の中で2時間の映画を見るようになるかというとそうはなりません。電車の中で、1分間で飛行機のチケットを買い、1分間でニュースを見て、1分間でSNSに返事を書いて、1分間でゲームを楽しんでと、時間と意識が断片化をしていくことに注目をしました。そうすると、もはや2時間の映画などというのは見られなくなり、30分のドラマでも苦痛となり、映像は1分程度の断片が好まれるようになっていく。音楽も2時間もある組曲や交響曲、1時間もあるアルバムは聞かれなくなり、3分間のポップスとなり、それすら15秒のサビだけ聞かれるようになる。

コンテンツは断片化をしていく。それに伴って、コンテンツの数は爆発的に増えます。そうなると、多くの人がどのコンテンツを選べばいいか必ず迷うことになります。つまり、張一鳴が長い間注目してきた検索アルゴリズムが重要になってくるのです。

お笑い面白画像を共有する「敲笑ジョン図」というアプリがバイトダンス最初のプロダクトでした。1ヶ月で100万人の利用者を獲得したので、無名のスタートアップとしてはまずまずの成功です。当初はこのような面白アプリを10種類ほど開発しました。バイトダンスはそういうヘンなアプリを開発する企業として知られるようになりました。

しかし、ここがUGC(User Generated Contents、ユーザー生成コンテンツ)の難しさで、「内涵段子」という、くだらない小話や動画を投稿するアプリは、内容があまりに低俗であり、コンテンツの管理運営も杜撰だとして国家広播電視総局から運営停止命令を受けてしまいました(中国ではあらゆるテレビ番組、映画、雑誌、アプリが許可制です)。

つまり、今日、米国議会が問題にしていることと共通する難しさを、バイトダンスはこの時体験しているわけです。

そこで、UGCの管理の難しさを知ったバイトダンスは、PGC(Professional Generated Contents)に注目をします。これが、ニュースキュレーションアプリ「今日頭条」(ジンリートウティアオ)で、大成功をしました。1年後には1,000万人の日間アクティブユーザーを獲得し、後に抖音、TikTokが生まれる基礎となりました。

この時、バイトダンスのエンジニアたちが学んだのがAIと機械学習でした。当時の中国にはAIに関するまともな入門書などありません。そこで、張一鳴たちは、英語情報を調べて、それを自分たちで中国語に翻訳をし、教科書をつくるところから始めました。しかし、面白いことに、教科書ができあがった頃には、エンジニアたちはもはや教科書など必要がないAIのエキスパートになっていました。この伝説の教科書は、改訂と追加が行われ、現在でも新入社員の教材として使われています。

良記事を生み出すTikTokのリコメンド機能

今日頭条が成功したのは、従来とは発想がまったく違ったリコメンドアルゴリズムが開発できたからです。一般的なリコメンドの方法は、ユーザーを属性により分類をします。どのようなコンテンツを好むかで分類をし、Aさんは犬と車のコンテンツが好きだとします。よく似たユーザーを探すと、犬と車とキャンプのコンテンツが好きなユーザーグループが見つかります。Aさんはこのグループに属してもよさそうですが、 キャンプのコンテンツはこれまであまり見ていません。ということは、Aさんにキャンプのコンテンツをリコメンドすると喜ばれる確率が高いということになります。アマゾンなどの「この商品を買った人は、こちらの商品も買っています」というリコメンド方式で、協調フィルタリングと呼ばれる手法です。

しかし、欠点は、ユーザーがどのようなコンテンツを好むかのデータが蓄積するまでリコメンドの精度があがらないというコールドスタート問題があります。

バイトダンスが今日頭条で行ったのは愚直な方法でした。ニュース記事を既存のニュースサイトから転載をしてきて、まず数百人という小さなユーザーにランダムに配信をします。そして、その購読行動を測定します。見出しだけ見て飛ばしたのか、最後まで読んだか、何度もスクロールして何度も読み直したか、読むのにどのくらいの時間をかけたかなどです。

この中で、高い評価(じっくり読んだ)というユーザーの特徴を分析し、似ているユーザーを数千人選びます。そして、配信を行い、再び購読行動を測定して、今度は数万人に配信をします。同じことを繰り返しながら、その記事を好むユーザーを探りながら配信する人数を増やしていくのです。

この手法の利点は、誰からも評判のよくない記事は、早々と数百人の段階で淘汰されてしまうということです。これにより、よく読まれる良記事のみが、しかも個人の好みに従って配信されてくることになります。

抖音、TikTokに搭載されているリコメンドエンジンも基本的な考え方は、今日頭条と共通をしています。というより、バイトダンスの中核技術はリコメンドエンジンであり、それをニュースに適用したのが今日頭条であり、ショートムービーに適用したのが抖音、TikTokなのです。

Next: 不適切映像が流れるのは不適切な映像が好きだから

1 2 3 4 5 6
いま読まれてます

この記事が気に入ったら
いいね!しよう

MONEY VOICEの最新情報をお届けします。

この記事が気に入ったらXでMONEY VOICEをフォロー