中国のAIスタートアップ企業「DeepSeek」が20日、米OpenAIの最新モデルo1に匹敵する「考える力」を持った人工知能「DeepSeek-R1」を公開した。これを実際に触り、「素晴らしいとしか言いようがありません」と絶賛するのは著名エンジニアの中島聡氏だ。同氏は「AIの進歩により、知的労働のコストが限りなくゼロに近づく現象がまさに今、私たちの目の前で起こっている」と指摘。米中のAI開発競争という文脈では“脅威”扱いされることが多いDeepSeekだが、いち技術者としては素直に評価せざるを得ない能力を秘めているようだ。(メルマガ『週刊 Life is beautiful』より)
※本記事のタイトル・見出しはMAG2NEWS編集部によるものです
プロフィール:中島聡(なかじま・さとし)
ブロガー/起業家/ソフトウェア・エンジニア、工学修士(早稲田大学)/MBA(ワシントン大学)。NTT通信研究所/マイクロソフト日本法人/マイクロソフト本社勤務後、ソフトウェアベンチャーUIEvolution Inc.を米国シアトルで起業。現在は neu.Pen LLCでiPhone/iPadアプリの開発。
【関連】中国企業「Deepseek」開発のAIに「尖閣列島はどの国の領土?」と聞いた結果…(中島聡)
中島聡が実際に触って感じた、中国製AI「DeepSeek-R1」の凄さ
先日紹介した、中国のDeepSeekが、今度はOpenAIのo1に匹敵する「考える力」を持った人工知能、DeepSeek-R1を発表しました。
各種のベンチマークで、o1と同等かそれ以上のスコアを上げています。
にも関わらず、APIのコストは、OpenAIの o1, o1-mini と比べて桁違いに安いのが特徴です。
オープンなはずのOpenAIが、パラメータ数も発表せずにクローズドな形でGPT4o、o1などの人工知能を発表しているに対して、中国のベンチャーが全てオープンな形で次々に優秀な人工知能を発表している点が、なんとも皮肉だと指摘する人もいます。
仕組みに関しても、DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning [PDF]という論文で詳しく紹介しており、AI業界全体に対する寄与もとても高く評価できます。
パソコンでも動くように小さくしたモデルもすでに公開されており、LM Studio や Ollama を使って簡単に試すことができます。私も、70Bモデルと32Bモデルの両方をOllamaを使って私のMacBook Pro(96GB メモリ)で試してみました。70Bモデルは少し遅いのですが、32Bモデルはとても快適に動きます。有名な「単語、Strawberryの中に”r”はいくつ入っているか」も問題なく解けます。
「考える力」を持ったo1をOpenAIが発表した時は、多くの人が驚くとともに、APIのコストがとても高くなることが懸念でしたが、わずか3ヶ月後に、それと匹敵するレベルのものがオープンソースでリリースされてしまったことは、素晴らしいとしか言いようがありません。