fbpx

AIで世界制覇を狙う中国が弱点をさらした“中国語”という盲点。ChatGPTの爆発で中国はAI戦争に敗北するのか?=牧野武文

3)百度独自開発であっても英語ベースになる

ただし、オープンソースを使った場合、そのことを公表するのが当たり前で、ましてや「ウチがつくりました」と言ってしまったら、大問題になります。百度は、画像生成AI部分にオープンソースを使ったとは発表していないので、独自開発なのだと思います。しかし、それでも英語ベースになるのは不思議なことではありません。

AIモデルを開発するには、学習素材=大量の教師データが必要になります。例えば画像であれば、大量の画像だけでなく、その画像に何が描かれているかタグがつけられていると、学習しやすくなります。このようなタグづけまで含めた画像データを自前で用意するというのは膨大な手作業が必要になり、開発上の大きなハードルとなります。しかし、英語圏では、このような教師データのセットが豊富に存在しています。このような教師データを利用しない手はありません。

また、どの教師データセットから学習していくかという順序も、学習効果に大きな影響を与えます。この辺りは理論化されてなく、研究者間の経験、ノウハウのようなものになっています。英語圏のデータであれば、このようなノウハウも利用しやすくなります。

そのため、英語ベースでAIモデルを構築し、そこに中国の場合であれば中国語と英語の翻訳AIをかませるというのは不思議ではないというよりも、ごく自然な発想です。

中国版ChatGPTは中国語が理解できない?

一方で、自然言語を扱うLLMの場合は、英語ベースというわけにはいかず、中国語を学習しなければなりません。本質のLLM部分は中国語の教師データを自力で収集して中国語ベースで開発し、画像生成部分は既存の英語教師データを利用させてもらって英語ベースで開発するというのは、少しもおかしなことではありません。日本で同様のAIモデルを開発する場合でも、わざわざ画像生成AIを日本語ベースで開発しようという選択は特殊な事情がない限りしないと思います。

この画像生成に関連して、中国のネットでは「文心一言は中国語の理解が苦手」ということが言われていますが、これも勘違いされている部分があります。例えば、中国語に「胸有成竹」という成語があります。胸の中に成熟した竹を持つという言葉で、しっかりした考えを持っている、大きな計画を持っているなどを意味する比喩表現です。文心一言の画像生成は、このような比喩表現が苦手です。「胸有成竹な人の絵を描いて」と命令すると、胸から竹が生えた男性の画像が出力されてきます。。

これはおそらく、「胸有成竹的男人」→「a man who has bamboo in his breast」と翻訳して、そのまま画像生成AIに渡しているのだと思われます。

本来は、LLM部分が、入力された言葉に対して、関連度の高い「大志、未来、起業家」などの言葉を補って、それから画像生成AIにわたすべきなのです。それをせずに、ただ渡していることで起きる現象です。

また、人間側が当たり前の前提にしている言葉もLLMが補う必要があります。例えば、「古い建築物、雪の情景」と中国語で入力したら、古いお寺に雪が降った風景の画像が生成されると思いますが、これをそのまま英語に直して「old architecture in snow」としたら、雪のギリシャ神殿の画像が生成されかもしれません。利用者が指定をしなくても前提になっているような「中国伝統文化」のようなキーワードを補う必要があります。

しかし、知人が教えてくれた最新状況によると、このようなおかしな画像が生成されることは減ってきているということなので、LLMが解釈をしてから画像生成をするようなアップデートが行われたのではないかと想像しています。

勘違いしてはならないのは、文心一言のLLMの中国語解釈能力が低いのではないということです。あくまでも画像生成AIへの渡し方が雑なのです。おそらく、急いで発表をするために、いろいろと間に合わなかった部分がたくさんあるのだと思います。

Next: ChatGPTでも“文心一言”でも起きる事実誤認

1 2 3 4 5 6
いま読まれてます

この記事が気に入ったら
いいね!しよう

MONEY VOICEの最新情報をお届けします。

この記事が気に入ったらXでMONEY VOICEをフォロー