中国版ChatGPT“文心一言”のできばえは?
では、文心一言のできばえ、成熟度はどの程度なのでしょうか。多くの人が気になるようで、中国でも専門家、評論家が文心一言とChatGPTの比較をたくさん行なっています。その中から出てきたのが、冒頭のご質問者が指摘する問題です。
今回は、このご質問にお答えをし、文心一言がどのようなLLMであるのかをご紹介し、そして中国企業の生成AIの現状をまとめます。
まず、ご質問者がつけてくださったリンクの先のビリビリ動画について解説をしておきます。
この動画は、文心一言の画像作成機能を使ったら、おかしなことが起きたというものです。「起重機の絵を描いて」と命令したら、鶴の画像が出てきた。「バス接続のマウスの絵を描いて」と命令したら、自動車のバスとネズミの絵が出てきたというものです。
これは、起重機→クレーン→crane(クレーン、鶴)という変換、バス接続マウス→バスとネズミ→bus and mouseという変換が行われたのではないか。つまり、画像生成AIは英語ベースになっており、米国が開発したものを使っているのではないかというものです。
ひょっとして動画の投稿者の方は、百度がズルをしたとおっしゃりたいのかもしれませんが、これは別に不自然なことではありません。
1)画像生成部分は、文心一言から見るとおまけ機能にすぎない
画像生成機能は、LLMである文心の本質(自然言語理解)ではなく、おまけ機能としてつけられているにすぎません。おそらく、GPT-4ベースのChatGPTでは画像生成機能、画像解析機能がつくという情報があったために、百度としては対抗をして画像生成機能をつけたのだと思われます。
2)画像生成AIは、オープンソース化されているものが無数にある
画像生成AIにはオープンソース化されているものがたくさんあります。実際、有名なStabel Diffisionもオープンソースになっていますし、MidJourneyも同等の性能をオープンソースで実現するOpenJourneyプロジェクトがあります。このようなオープンソースを使ったサービスやアプリもすでにたくさんあります。例えば、DiffusionBee( https://diffusionbee.com/)は、手軽に無料でStabel Diffsionを試せるアプリになっています。
ある意味、おまけ機能である画像生成部分に、このようなオープンソースを使うことは何も悪いことではありません。実際、アップルのOSはオープンソースであるUNIX系のDarwinがベースになっています。Androidはそもそもがオープンソースです。このようなオープンソースを使って、プロダクトを開発し、それを販売することは何も問題がなく、すでに多くのテック企業で当たり前のように行われています。ChatGPTですら、ベースになっているのはグーグルが開発したAIモデルTransformerであるのに、グーグル検索のライバルであるマイクロソフトと手を組んでいるほどです。
Next: 中国版ChatGPTは中国語が理解できない?