著名エンジニアの中島聡氏が、オープンソースの各種AIモデルをローカル環境(MacBook Pro)でテストしその実力を評価。それらが私たちのビジネスにどのような変化を起こすかを予測する。中島氏によれば、MicrosoftのPhi-4に代表されるSLM(小規模言語モデル)の能力がLLM(大規模言語モデル)並みに上昇することで、法人向けエンタープライズ市場では近い将来、クラウド上のAIサービスではなく、個人のパソコンや社内のAIサーバーでオープンソースなSLMを走らせるのが主流になるという。(メルマガ『週刊 Life is beautiful』より)
※本記事のタイトル・見出しはMAG2NEWS編集部によるものです
プロフィール:中島聡(なかじま・さとし)
ブロガー/起業家/ソフトウェア・エンジニア、工学修士(早稲田大学)/MBA(ワシントン大学)。NTT通信研究所/マイクロソフト日本法人/マイクロソフト本社勤務後、ソフトウェアベンチャーUIEvolution Inc.を米国シアトルで起業。現在は neu.Pen LLCでiPhone/iPadアプリの開発。
どれが一番賢い?オープンソースな言語モデルの実力をテストしてみた
このメルマガでは、法人向けエンタープライズ市場でのオープンソースな言語モデル(LLM、もしくは、SLM)の重要性の話をしてきましたが、複数の読者から「どれを使うべきか」という質問が寄せられました。
毎週のように新しい言語モデルが発表されているため、「どのモデルを使うべき」と特定することはとても困難ですが、少なくとも私が最近になって試したモデルのことは紹介できます。
比較のため、少し前に紹介した「ある満月の夜、空を見上げると、月のすぐそばに火星が見えた。その時、地球と火星の距離は遠いのか近いのか?」という問題に正しく答えられるかを調べました。
(※編註:正解は「地球と火星の距離は近い」。中島氏によると Claude 3.7 sonnet や GPT-4o、Grok 3 も間違える難しい問題だという)
【関連】中島聡が大胆予測、「コードが書けるAI」で「SIerの中抜き」が意外な進化を遂げる理由…ムダすぎて草?
r1-1776, パラメータ数:70b, 必要なメモリ:43GB
話題のDeepSeekによる「考えるモデル」です。一番大きなモデルは私のMacBook Pro(96GBのメモリ)で走らせることができないので、パラメータ数70bのものを試しています。
英語や日本語で質問しても、考える過程は中国語で行うという特徴があり、中国共産党の意向が反映されたモデルであるため、台湾問題、天安門事件などに関しては、中立的とは言い難い返事をするのが欠点です。
「地球と火星の距離」の問題に対する回答も「満月時は太陽・地球・月が一列に並び、月は背面(夜の方向)を照らされています。この状態で火星が月の近くに見える場合、火星も太陽と反対側に配置されていなければなりません。つまり、地球・火星・太陽が一列になり(「冲立」=火星が「衝」の位置)、地球と火星は比較的近い位置です。」と正しい回答を出してくれましたが、かなりの時間(数分)がかかりました。
一応、比較のためにテストしていますが、バイアスとスピードの面で、実際のサービスに使うことはないと思います。
qwq, パラメータ数:32b, 必要なメモリ:20GB
中国のIT企業、アリババによる言語モデルQwenに「考える能力」を追加したものです。これも中国製のものなので、考える過程で中国語を使うことがあります。政治的に微妙な問題に関しては、若干中国寄りですが、DeepSeekの言語モデルほど露骨なものではありません。
「地球と火星の距離」の問題に対する回答は、「満月の夜に火星が月の近くに見える場合、火星は地球から比較的近い位置にある可能性があります。しかし、正確な距離を知るためには、その時点での太陽系天体の位置を計算する必要があります。」という曖昧な答えで、正解とは言えません。
llama3.3, パラメータ数:70b、必要なメモリ:43GB
Metaの最新のモデルですが、私のMacBook上では、スピードが遅くて使い物になりません。Metaにとってのプライオリティは、大規模なモデル(llama3.1 405b)にあるのだと私は解釈しています。
「地球と火星の距離」の問題に対する回答は「近いです」というぶっきらぼうなもので、「なぜ近いのか説明して」と尋ねて初めて、「満月の夜に火星が月の近くに見える場合、地球、月、火星がほぼ一直線上に並んでいることになります。このとき、地球と火星の距離は最も短くなります。」と答えてくれました。
Phi-4, パラメータ数:14b, 必要なメモリ:9.1GB
Microsoftが、Copilot+ PCなどで走らせることを前提に開発している小規模言語モデル(SLM)です。パラメータ数が少ない割にとても優秀で、スピードも早く、日本語能力も高く、Gemma3が発表されるまで一番のおすすめでした。
「地球と火星の距離」の問題に対する回答も「火星が月のすぐそばに見える場合、この状況は通常、地球と火星が比較的近い位置にあることを示しています。これは『最接近』やそれに近い時期であり、二つの惑星間の距離が最小限になっている可能性が高いです。」と正しい回答を出してくれました。
Gemma3, パラメータ数:27b, 必要なメモリ:17GB
Googleが、最近発表したばかりの最新の小規模言語モデルです。サービスとして提供しているGeminiと同様のアーキテクチャを持ち、一世代前のGemini 1.5 Proと同等の性能だとGoogleは主張しています。
Gemma3の評価はスタートしたばかりですが、とても優秀だし、スピードにも満足しており、Phi-4とどちらを選ぶかと言われたら悩んでしまうところです。
「地球と火星の距離」の問題に対する回答は「月と火星が空で接近して見えるのは、地球から見て太陽、地球、火星がほぼ一直線に並ぶ『会合』と呼ばれる現象が起こっている時です。この時、火星は地球に最も近づき、明るく見えやすくなります。」と正確なものが短時間で得られました。
現時点の結論「MicrosoftのPhi-4とGoogleのGemma3がオススメ」
つまり、現時点では、MicrosoftのPhi-4とGoogleのGemma3がオススメです。色々と質問していると、9.1GB、17GBというメモリの中に、莫大な知識が詰まっていることに本当に感心してしまいます。
ちなみに、「地球と火星の距離」の問題は、Claude 3.7 sonnet、GPT-4o、Grok 3にも答えられない難しい問題です。OpenAIの場合、o3、GPT-4.5になってようやく答えられるようになりました。そんな難しい問題に、小規模なモデルがちゃんと答えられている点が高く評価できるのです。
【追記】私がClaude 3.7 sonnetで実験していた「300匹の小さな魚が群れをなして泳ぐ姿のシミュレーションをp5jsを使って作って。Windowを水槽に見立てて、壁にぶつからないようにして」というプロンプトを試してみたところ、Gemma3が生成したコードは不十分でまともに動きませんでしたが、Phi-4はかなり良いコードを生成し、一発で動きました。
Claudeが作ったものと比べると若干見劣りはしますが、小規模なモデルとしてはとても優秀です。(次ページに続く)
エンタープライズ市場とAI~これから起きる変化5つ
先日、知り合いから、とあるAIカンファレンスで、エンタープライズ市場とAIについて講演をして欲しいと頼まれました。話す角度は色々とありますが、ざっくりと思いついたのは、以下の5つのポイントです。
(1)ローカルAIの時代
このメルマガでも何度も触れていますが、MicrosoftのPhi-4に代表されるような、オープンソースなSLM(小規模言語モデル)の能力が、LLM(大規模言語モデル)並みに上昇した結果、特にエンタープライズ市場においては、クラウド上のAIサービスではなく、パソコンもしくは社内のAIサーバーにオープンソースなSLMを走らせるのが主流になると私は見ています。
一番分かりやすい理由は、社外秘の、もしくは、顧客のプライバシーに関わるデータをクラウド上のAIサービスに渡して処理するのはリスクが高すぎるため、というものですが、実は、実質的に推論のコストがゼロになる点が、ビジネス面ではとても大きな意味を持ちます。
当初と比べて安くなったとはいえ、クラウド・サービスは基本的に従量課金であるため、アプリケーションもそれを意識した設計にせざるを得ません。しかし、自社のパソコン・サーバーで推論を走らせることにより、実質的な価格がゼロになるのであれば、極端な話、顧客からの注文が入るたびに、オペレーターのキーストローク1つごと、カメラが捉える映像の1フレームごとに推論を走らせることが可能になり、これまでの従量課金を前提としたものとは根本的に異なる設計のアプリやAIエージェントを作ることが現実的になります。
この変化は、アプリケーションの設計上、「パラダイム・シフト」と呼んで良いほど大きな変化であるため、私たちはまだ――
(本記事は『週刊 Life is beautiful』2025年3月18日号を一部抜粋・再構成したものです。この続きはメルマガをご購読のうえお楽しみください。初月無料です ※「エンタープライズ市場とAI」約5000字、メルマガ全体約2.2万字)
【関連】【中島聡】Tesla、Nvidiaの爆上げ的中!100倍株が見つかるメタトレンド投資とは? – YouTube
【関連】【中島聡×古田貴之 特別対談Vo.1】夢の「人型ロボット」実現は目前?実は海外よりスゴい日本のAIロボット技術力!
【関連】中島聡も思わず納得!人間の知能を凌駕するASI(人工超知能)が「間もなく誕生する」シンプルかつ強力な根拠とは?
image by: MAG2NEWS