日本のAI・クラウドにビッグテック企業投資ラッシュ

日本のテック業界は、人工知能(AI)とクラウドサービスの主要な戦場となりつつあります。マイクロソフトやグーグルに続き、オラクルも日本の技術インフラへの大規模な投資を発表しました。

Tanaka Haruki
April 23, 2024

オラクルは、クラウドコンピューティングとAIソリューションへの需要が高まる中、今後、10年間で80億ドル以上を投資し、日本全国にオラクルクラウドインフラ(OCI)を拡大する予定です。

これらの取り組みには、デジタル主権や規制要件に効果的に対応するために、ローカルオペレーションを強化し、日本に拠点を置くエンジニアリングチームをサポートすることが含まれています。

オラクルの発表に加えて、他のテック大手も日本で積極的に活動を展開しています。先週、岸田文雄首相がアメリカを訪問した際、マイクロソフトは日本のクラウドコンピューティングとAIインフラを強化するために、2年間で29億ドルの投資計画を明らかにしました。この取り組みには、300万人以上の日本人をAI技術で教育することや、AIとロボティクスに焦点を当てた研究施設の設立が含まれています。

また、グーグルも、アメリカと日本の間、そして太平洋の島国とのデジタル接続を改善するために10億ドルを投資すると発表しました。これには「Proa」と「Taihei」と名付けられた2本の新しい海底ケーブルの設置が含まれ、アメリカと日本だけでなく、太平洋の島嶼国との接続も強化されることが期待されています。

さらに、OpenAIは、東京に初のアジアオフィスを設立し、日本語に特化したGPT-4の最適化バージョンを発表しました。これは、GPTバージョンが特定の国の言語に特化して初めてリリースされることになります。

Open AI:日本語に特化したGPT-4

これらの投資により、世界のテック企業がAIとクラウド技術の革新のための戦略的ハブとして日本をどれだけ重視しているかが明らかになり、日本が世界的なテクノロジー分野でさらに重要な役割を果たすようになっていることを反映しています。特に大手既存企業は、日本語専用の大規模言語モデル(LLM)を次々にリリースしております。

日本語に特化した日本国内LLM

楽天、日本語に最適化したLLM

日本の国内でもAIとクラウド市場は特に活発で、大企業間の競争が激化しています。例えば、楽天グループは、日本語に最適化された高性能な大規模言語モデル(LLM)を公開しています。このモデルは以下のような特徴を持っています。

  1. 高品質データを使用した事前学習: このLLMはMistral-7B-v0.1をベースにし、インターネット上の広範な日本語と英語のデータを用いて反復的な事前学習を行っています。このデータは内部フィルタリング機能を通じて条件に応じて選択・抽出され、メタデータを使用して情報を付加し、パフォーマンスを向上させています。
  2. 日本語に最適化された形態素分析器: このLLMは、日本語専用に設計された形態素分析器を使用しています。この分析器は自然言語で書かれた文章を適切な単位で分割して分析することが可能で、事前学習及び推論の際のテキスト処理を効率的に行います。
  3. 日本語LLMでの最高評価結果: この基盤モデルとインストラクションチューニングされたモデルは、「LM Evaluation Harness」の基準において日本語及び英語のLLMで高い評価を受けています。日本語の評価では、基本モデルが平均69.8点、インストラクションチューニングされたモデルが平均77.3点のスコアを記録しました。

サカナAI:従業員一人当たりで企業価値が最も高い

サカナAIは、東京に拠点を置くAI企業で、2023年8月に元GoogleのAI研究者であるLlion Jones氏とDavid Ha氏によって設立されました。この企業名は、日本語で「魚」を意味し、魚の群れのように個々の能力が異なるが、結合することで大きな力を発揮するAI技術を目指して名付けられました。

サカナAIは、約45億円の資金調達を成功させ、NTTグループ、KDDI、ソニーグループなど、日本の大手企業からも出資を受けています。この企業は、「進化的モデルマージ」と呼ばれる技術を使用して、異なる特性を持つ複数のモデルを統合し、高性能な日本語モデルを構築しています。

出典:CBInsights

具体的なモデルは以下の通りです:

  1. EvoLLM-JP:数学に特化した日本語の大規模言語モデルで、数学学習のサポート、問題集作成、数学論文の執筆などに利用されています。
  2. EvoVLM-JP:対話可能な日本語の画像言語モデルで、教育教材の作成や商品画像の説明文生成などに使用されています。