「Sarashina」始動で何が変わるか、ソフトバンク国産LLMが示す3つの視点と実務対応

ALLFORCES編集部

ソフトバンクSarashinaとは何か

Sarashinaは、ソフトバンクが開発する国産大規模言語モデルの一種で、日本語データを中核に据えた主権型LLMである。2025年時点で経済産業省のAI戦略が示すように、国内データ主権の確保は企業AI導入の最重要課題となっている。本稿では市場背景、技術構造、実務への示唆の3点から整理する。

観点1: 市場背景 — 国産LLM需要の構造的拡大

要点は、データ主権リスクが顕在化したことで、国産LLMへの需要が急速に高まっている点である。

IDC Japanの2025年調査によれば、日本の生成AI市場は2025年に2.3兆円規模に達し、年率28%で成長している。同時に注目すべきは、市場成長の質的な変化である。2023-2024年は試験導入・PoC中心だった国内企業のAI活用が、2025年から本番業務での全社展開フェーズへ移行しつつある。

一方で米国某生成AI企業や某大規模言語モデル企業のAPIに依存することのリスク、特に医療・金融・自治体領域での機密情報の越境移転が、経済産業省「AI事業者ガイドライン」（2024年4月公表）で明確に問題視された。同ガイドラインは、機微情報を扱うAIシステムについて「データの所在地・処理国を把握し、利用者に開示すること」を求めており、海外SaaS型LLMの無条件採用は事実上困難になりつつある。

ソフトバンクは2024年にSB Intuitionsを設立し、2025年からSarashinaシリーズの商用提供を本格化させている。NTTのtsuzumi、富士通のFugaku-LLMとともに、国産LLM三強の一角を形成しつつある状況だ。

観点2: 技術構造 — 日本語ネイティブ設計の優位性

本節の核心は、Sarashinaが日本語ネイティブ学習データと国内インフラの組み合わせで設計されている点にある。

SB Intuitionsの公式発表によれば、Sarashina2は最大70Bパラメータ規模で、学習データの過半を日本語テキストが占める。これに対しGPT-4系の日本語比率は5%未満と推定されており、日本語固有の敬語処理・業界用語理解で優位性を持つ。

Stanford HAI「AI Index Report 2025」では、英語中心モデルが日本語タスクで平均15-20%の精度低下を示すと報告されており、専門領域、特に法務・医療・行政文書では国産モデルの相対的優位が拡大している。Sarashinaは日本語固有の語彙体系を考慮したトークナイザーを採用しており、同じ文章の処理に必要なトークン数が英語ベースモデルと比較して約30%少ない。これは推論コスト・レスポンス速度の両面で実務的な差となる。

さらに学習・推論インフラは東京リージョンに集約され、データ越境のリスクを構造的に排除している。SLAも国内法準拠で締結可能であり、契約・コンプライアンス面の交渉コストが大幅に低減される。

観点3: 実務への示唆 — 移行判断の3段階フレームワーク

重要なのは、国産LLMへの移行判断が「性能比較」ではなく「データガバナンス要件」から始まる点である。

取材によると、自治体や医療機関では既に住民情報・診療記録を扱うAI活用案件で、米国系APIの利用を断念し国産LLMへ切り替える動きが2025年から顕在化している。一般的な試算では、データ主権要件を満たすための分離環境構築コストは年間3,000万-5,000万円規模となるが、Sarashinaのような国内提供型APIを採用することで、この構築コストを大幅に圧縮できる。

移行戦略の核は3段階で整理される。

第1段階は機密データ分類とリスクアセスメントだ。扱うデータを「公開可」「社内限定」「機微情報」の3レベルで分類し、AIに投入可能な範囲を明示する。この分類なしに技術選定を進めると、後工程で全面的なやり直しが発生しやすい。

第2段階はベンチマーク評価である。性能（日本語タスク精度）、コスト（トークン単価×想定処理量）、SLA（応答速度・稼働率・障害対応）の3軸で、Sarashinaを含む候補モデルを定量比較する。Gemini 2.5 Flash（入力$0.15/1M）のような海外低価格モデルとの単純なコスト比較では国産が不利に見える場面もあるが、データガバナンス要件を含めたTCOで再評価すると結果が逆転するケースが多い。

第3段階はハイブリッド運用の確立だ。一般的なドキュメント要約や翻訳タスクは海外API、機密データを含む業務は国産モデルというルーティング設計が現実解となる。読者の組織でも、すべてを国産に置き換えるのではなく、適材適所の使い分けこそが投資対効果を最大化する道筋ではないだろうか?

まとめ

結論として、Sarashinaは単なる日本語LLMではなく、データ主権時代における選択肢の戦略的拡張という本質的価値を持つ。

国産LLMへの移行は、コスト削減を主眼とする議論ではない。事業継続性・法令遵守・顧客信頼という、AI活用の前提条件を整える投資である。読者の組織では、機密データの越境リスクをどう評価し、Sarashinaのような国産LLMをどの業務領域から段階的に導入するだろうか?

あわせて読みたい

AI導入戦略のご相談を承っています

AI導入支援の経験から、実践的な戦略策定をお手伝いしています。

お問い合わせはこちら

※ 本ページのリンクにはアフィリエイトリンクが含まれます。購入によりサイト運営をサポートいただけます。

「Sarashina」始動で何が変わるか、ソフトバンク国産LLMが示す3つの視点と実務対応

ソフトバンクSarashinaとは何か

観点1: 市場背景 — 国産LLM需要の構造的拡大

観点2: 技術構造 — 日本語ネイティブ設計の優位性

観点3: 実務への示唆 — 移行判断の3段階フレームワーク

まとめ

あわせて読みたい

AI導入戦略のご相談を承っています

この記事に関連するおすすめ書籍

生成AI法務・ガバナンス

AI白書 2025 生成AIエディション

生成AIプロンプトエンジニアリング入門

📚 関連する取り組み

AI導入のご相談を承っています

他のカテゴリも読む

ソフトバンクSarashinaとは何か

観点1: 市場背景 — 国産LLM需要の構造的拡大

観点2: 技術構造 — 日本語ネイティブ設計の優位性

観点3: 実務への示唆 — 移行判断の3段階フレームワーク

まとめ

あわせて読みたい

AI導入戦略のご相談を承っています

この記事に関連するおすすめ書籍

生成AI法務・ガバナンス

AI白書 2025 生成AIエディション

生成AIプロンプトエンジニアリング入門

📚 関連する取り組み

AI導入のご相談を承っています

MCP統合時代のAI導入では何が変わるのか～200個超えるツール群から最適な3つを選ぶ方法

GPT-5.5によるサイバー対策が金融機関の現場をどう変えるのか、先行導入企業3社の事例から見える戦略

日本語対応VLM『LLM-jp-4-VL 9B』の実力、3つの性能指標から読み解く国産AIの可能性

ChatGPTシェア46%転落時代の突破口、複数LLMを組み合わせる5つの戦略型パターン

リコー独自LLMで業務改革は本当に実現するのか？3社の具体的な成功事例から学ぶ導入ガイドとコツ

複数のAIエージェント導入で生産性24倍を達成、導入成功企業3社の実装パターン完全ガイド

他のカテゴリも読む

62億円の Watson、Air Canada 訴訟、PoC 18か月停滞 — 同じ轍を踏まないために。

62億円の Watson、Air Canada 訴訟、PoC 18か月停滞 —
同じ轍を踏まないために。