AI・DXの最前線を、ビジネスの現場へ。企業のAI活 用を支援するメディアです詳しくはこちら
  • URLをコピーしました!

Databricks

「データとAIを、ひとつに。」

  • データ×AIプラットフォーム
  • 🇺🇸 サンフランシスコ
  • 📈 シリーズL

企業価値

20兆円

ARR

8,100億円

顧客数

10,000社超

Vision

データとAIの民主化——すべての組織がデータとAIの力を活用できる世界を実現する

Mission — 世界で最もシンプルなデータ+AIのオープンプラットフォームを構築する

Value — 我々はオープンであることを選ぶ。プロプライエタリな囲い込みではなく、エコシステムの成長が全員を豊かにする

Databricksとは?

何をしている会社?誰が使うの?無料で使える?Sparkと何が関係?

年間売上8,100億円

この規模のソフトウェア企業が前年比65%で伸びている——上場企業を含めても、ちょっと見当たらない成長速度です。

なぜデータ基盤の会社が、AIの収益マシンになれたのか?

Timeline

沿革

2013.06UC Berkeleyの研究者7名が創業詳細

カリフォルニア大学バークレー校のAMPLabで生まれたApache Spark——大量データを高速処理するオープンソース技術を商用化するため、Ion Stoica、Ali Ghodsi、Matei Zahariaらが起業しました。大学の研究室から始まった会社です。

2017.10MLflow発表、AI開発領域へ踏み出す詳細

データ処理だけでなく、AIモデルの開発・管理まで一気通貫で扱えるツールをオープンソースで公開。「データの会社」から「データ+AIの会社」への転換が、ここから始まります。

2020.06「レイクハウス」を提唱詳細

データの保管庫と分析基盤を一つに統合する新しい概念を打ち出し、Delta Lakeという技術で実装。業界に「そもそも分ける必要ないのでは?」という問いを投げかけました。

2023.06MosaicMLを約13億ドルで買収詳細

AI専門のスタートアップを買収し、大規模言語モデル(ChatGPTのような文章生成AI)を企業が自前で作れる環境を獲得。データ企業からAI企業への本格シフトを象徴する一手です。

2024.12ARR24億ドル突破、AI製品群が急成長詳細

年間で安定的に入る売上の見込み額が24億ドルを超え、そのうちAI関連だけで14億ドル規模に。売上の半分以上がAI絡みという構造に変わりつつあります。

2025.02シリーズL調達、企業価値1,340億ドルに詳細

累計70億ドル以上の資金を集め、非上場のまま評価額は約20兆円へ。12回もの資金調達を重ねながらIPOせず成長を続ける、異例中の異例です。

2026.02ARR54億ドル、前年比65%成長詳細

この規模のソフトウェア企業がこの成長速度を維持しているケースは、上場・非上場を問わずほぼ見当たりません。IPO準備が本格化しています。

About

Databricksを一言で

Sparkの生みの親たちが作った、データとAIの統合基盤

  • 企業のデータを集め・整理し・AIで活用するまでを1つの基盤で完結させるソフトウェア企業
  • UC Berkeleyで「ビッグデータを速く処理する方法」を研究していた7人がそのまま起業——論文の著者が会社も作った、珍しい成り立ち
  • Fortune 500の60%が導入、クラウド3社(AWS・Azure・GCP)すべてで動く中立的なプラットフォーム
  • 中核技術をオープンソースで無料公開し、囲い込みの逆を行く異端児

VS

何が違うのか?

業界の常識 vs Databricks

データもAIも1つの基盤に統合した

業界の常識

データを保管するツール、分析するツール、AIを作るツールはバラバラに使うのが普通だった。

Databricks

全部を「レイクハウス」という1つの場所にまとめた。ツールを行き来する手間がなくなる。

中核技術をオープンソースで公開した

業界の常識

作った技術は自社だけのものにして、乗り換えにくくする。

Databricks

中心の技術をタダで公開して「みんなが使う標準」を取り、その上の有料版で稼ぐ道を選んだ。

2,000億円かけてAI企業を丸ごと買収した

業界の常識

もともとのデータ製品にAI機能を後からくっつけて「AI対応」と名乗る。

Databricks

AI専門の会社MosaicMLを約2,000億円で丸ごと買収し、AIを基盤の中心に据え直した。

囲い込まず、後付けせず、分断しない。
3つの逆張りが、評価額20兆円の土台を作りました。

これらの「常識破り」を設計し実行してきたのは誰か——次は、Databricksの頭脳である経営陣を見ていきます。

Leadership

経営陣

移民の研究者、技術の発明者、AIチップの起業家——異色の3人が揃った経営チーム

👤
CEO・共同創業者

Ali Ghodsi

アリ・ゴドシ

移民の研究者が20兆円企業を率いる

イラン生まれスウェーデン育ち / KTH王立工科大学PhD / UC Berkeley AMPLab研究者 / 2013年Databricks共同創業

Apache Sparkの商用化を目指してUC Berkeleyの研究仲間7名と起業。「オープンソースで勝つ」を創業時から一貫して掲げ、中核技術を次々と無料公開する戦略で競合と差別化しました。学術研究者から、非上場のまま評価額20兆円の企業を率いるCEOに。Forbesビリオネアリストにも名を連ねています。

👤
CTO・共同創業者

Matei Zaharia

マテイ・ザハリア

Sparkを生んだ張本人がCTO

ルーマニア生まれカナダ育ち / MIT卒 / UC Berkeley PhD / スタンフォード大学准教授 / Apache Spark原論文の筆頭著者

世界中の企業が使うデータ処理の標準技術Apache Sparkを大学院時代に発明した人物です。2023年にスタンフォードからCTOとして本格復帰しました。

👤
SVP of AI

Naveen Rao

ナヴィーン・ラオ

AIチップ起業家がAI戦略を率いる

Nervana Systems創業 / Intelに約4億ドルで売却 / Intel AI部門GM / MosaicML共同創業 / 2023年Databricks参画

AIチップのスタートアップを作ってIntelに売り、次にAIモデルを企業向けに作るMosaicMLを創業。2023年のDatabricksによる約13億ドルの買収でジョインしました。

経歴
学歴KTH王立工科大学(スウェーデン)コンピュータサイエンスPhD
前職UC Berkeley AMPLab 研究員
現職Databricks CEO・共同創業者
注目ポイント

「非上場を維持する」という判断は、四半期ごとの株主への説明に追われず成長に集中するための戦略的選択です。Forbesビリオネアリスト入りを果たしながら、いまだにIPOより製品開発を優先する姿勢を崩していません。共同創業者のIon Stoica(UC Berkeley教授・現会長)とともに、学術とビジネスの両輪で会社の方向性を定めています。

経歴
学歴MIT学士 → UC Berkeley コンピュータサイエンスPhD
前職スタンフォード大学 コンピュータサイエンス准教授
現職Databricks CTO・共同創業者
注目ポイント

Sparkだけではありません。データの保管と分析を統合するDelta Lake、AIモデルの開発を管理するMLflow、データカタログのUnity Catalog——Databricksの主要な技術の多くが、この人の頭の中から生まれています。業界標準の技術を作った人物がそのままCTOにいること自体が、Databricksの技術的な正統性の証明です。

経歴
学歴ジョンズ・ホプキンス大学 神経科学PhD
前職Nervana Systems CEO → Intel AI部門GM → MosaicML 共同創業者・CEO
現職Databricks SVP of AI(Mosaic AIプロダクト群統括)
注目ポイント

AIの半導体(ハードウェア)を作り、大企業のAI部門を率い、AIモデルのスタートアップを起業した——AIの「下から上まで」を全部経験している人はそういません。Databricksの生成AI・エージェント戦略をこの人が率いているのは、データ企業がAI企業に変わるうえでこれ以上ない布陣です。

ひとこと補足

「レイクハウス」とは何か

データの倉庫が2つに分かれていた時代を、1つにまとめた発明

この記事で何度も出てくる「レイクハウス」という言葉、ちょっとここで整理させてください。
まず、企業のデータ保管には昔から2種類の倉庫がありました。ひとつは「データレイク」——あらゆるデータをとりあえず大量に放り込んでおける、安くて広い倉庫です。画像も文書もログも何でも入りますが、中身はぐちゃぐちゃ。もうひとつが「データウェアハウス」——売上表や顧客リストのように整理されたデータだけを入れる、きれいだけど高い倉庫です。企業はこの2つを別々に持ち、データをコピーして行ったり来たりさせていました。AIの学習用データを準備するだけで何週間もかかる——そんな非効率が当たり前だったんです。

Databricksが2020年に「レイクハウス」と名付けて提唱したのは、この2つの倉庫を1つにまとめるという発想です。安い倉庫(データレイク)の上に、きれいな倉庫(データウェアハウス)の信頼性を載せる。AIモデルを作るには「整理されたデータ」も「生の大量データ」も両方必要なので、倉庫が1つならコピーの手間もズレも消える。Nucleus Researchの調査では、レイクハウス導入企業が3年間で平均482%のROI(投資した金額に対してどれだけ利益が出たか)を達成したと報告されています。

ただし、正直に言うと「レイクハウス」はDatabricksが自分で作った概念・用語です。自社の製品に有利な定義になっている面があり、Nucleus Researchの調査もDatabricksの委託の可能性があります。競合のSnowflakeも似た統合路線を進めているので、「レイクハウスこそ正解」という見方はDatabricks側のストーリーとして受け取る冷静さが必要です。

Technology

コア技術とプロダクト群

レイクハウスの上に載る3つの武器——AI開発・データ管理・データ運搬

レイクハウスという「1つの倉庫」が土台にあることは前のセクションで説明しました。その土台の上で、Delta Lake、MLflow、Databricks SQLといった基盤技術が動いています。ここでは、その上にさらに載る3つの主要プロダクトを見ていきます。企業が実際にお金を払って使っている、Databricksの「稼ぎ頭」たちです。

自社データで、自分だけのAIを作る

🧬

Mosaic AI

企業向けAI開発の統合環境

企業が持つ独自のデータを使って、AIモデルを作り・調整し・実際に動かすまでを一気通貫で行える機能群です。2023年に約13億ドルで買収したMosaicMLの技術が核になっています。
adidasはMosaic AIを使い、年間200万件の製品レビューからAIで洞察を引き出す仕組みを構築し、運用コストを91%削減。Fox Sportsは「Cleatus AI」というスポーツAI助手を作り、ファンからの質問への回答成功率を2倍に向上させました。外部のAIモデルを呼び出すことも、自社専用モデルをゼロから訓練することもできる柔軟さが、AI関連の収益を年間14億ドル規模に押し上げている原動力です。

adidas運用コスト91%削減 Fox Sports回答成功率2倍

AIが触れるデータを、全部把握する

🔬

Unity Catalog

全データの「目録+鍵管理」

企業が持つデータ、AIモデル、指標の定義——これらすべてを一冊のカタログのように一元管理するガバナンス(統制)レイヤーです。
AIが社内データを使う時代には「どのデータを、誰が、どこまで使っていいか」を厳密に管理する仕組みが欠かせません。AWS・Azure・Google Cloudのどれでも動くマルチクラウド対応で、オープンソース化もされています。Delta Lakeが「データの信頼性」を保証し、MLflowが「AIモデルの履歴」を追跡し、Unity Catalogがその両方を横断的に管理する三層構造が、Databricksのガバナンスの強みです。

マルチクラウド対応 オープンソース公開済み

手作業のデータ搬送を、自動化する

📱

Lakeflow

データを自動で運ぶ配管工事

SalesforceやSAPなど社内外のシステムからデータを取り込み、整理し、レイクハウスに届けるまでを自動化するデータ運搬の統合スイートです。
医療機器メーカーのInsuletはLakeflowでSalesforceやSAPからのデータ取り込みを自動化し、リアルタイムのデータ処理速度を12倍に向上させました。地味に聞こえるかもしれませんが、AIを動かすには「きれいなデータを、必要な場所に、素早く届ける」ことが大前提。この配管がなければ、Mosaic AIもUnity Catalogも力を発揮できません。

Insulet処理速度12倍向上 データ取り込み自動化

ひとこと補足

AIが自律的に動く時代に必要なもの

AIが自分で考えて動く時代、その足元を支えるのは「信頼できるデータ」です

「AIエージェント」とは、人間がいちいち指示しなくても自分で仕事を進めるAIのこと。最近はこれが複数連携して動く「マルチエージェント」が主流になりつつあります。ただし、エージェントが参照するデータが古かったりバラバラだと、間違いも自律的に広がってしまう。DatabricksのMosaic AI Agent Frameworkは、この「信頼できるデータの上でAIを安全に動かす」ための土台です。

「どのAIが勝つか」に注目が集まりがちですが、一番確実に恩恵を受けるのは「AIを動かすインフラ」を握る企業です。AIモデルの流行は変わっても、データ基盤の需要は消えない。Databricksが前年比65%成長を維持できている理由は、まさにここにあります。

Partnerships

パートナーシップと投資家

クラウド3社すべてで動き、どこにも依存しない——この中立性が最大の武器

Databricksの面白いところは、Microsoft Azure・AWS・Google Cloudという3大クラウドのすべてで動作することです。クラウド企業にとってDatabricksは「自社の顧客が使いたがるツール」なので、どこも排除できない。むしろ自社プラットフォーム上での統合を競い合っている状況で、特にMicrosoftとは「Azure Databricks」として深く統合されています。そしてAI計算に不可欠なGPUを握るNVIDIAとも協業し、AIモデルの学習を高速化するインフラ連携を進めています。

投資家の顔ぶれも象徴的です。米国トップVCのAndreessen Horowitzが初期から支援し、Googleの親会社Alphabetも出資。2025年2月のシリーズLではJ.P. MorganやFidelityが加わり、累計調達額は70億ドル超に達しました。

NVIDIAAI基盤パートナー

GPU資源の最適化でAIモデルの学習・推論を高速化。Databricksの「AI Runtime」の根幹を支えています。

Andreessen Horowitzリード投資家

初期から複数ラウンドをリード。米国トップVCの継続的な支援が、他の投資家を呼ぶ呼び水になりました。

Alphabet(Google)戦略投資家

自社クラウド(GCP)上でDatabricksが動く競合関係にもかかわらず出資。成長ポテンシャルへの賭けです。

インサイト: 「全員と組む」が参入障壁になる

クラウド大手3社すべてと組みつつ、どこにも依存しない

クラウド大手3社すべてと組みつつ、どこにも依存しない——この中立的なポジションは、実は非常に取りにくいものです。1社に寄りすぎれば他の2社から警戒される。Databricksはオープンソース戦略でどの環境でも動く技術基盤を作り、そのうえで各クラウドと個別に深い統合を実現しています。NVIDIAとのAIインフラ連携と、Alphabet・Salesforceといった戦略投資家の支援が加わることで、「Databricksを外すと顧客が困る」というエコシステムが出来上がりつつあります。

第三者の調査と投資家の分析が示す、Databricksの「実力」と「死角」

Voices

業界の声

Nucleus Research 調査機関
レイクハウス・プラットフォームを導入した顧客は、3年間で平均482%のROIを達成。投資回収期間は平均4.1ヶ月だった。

出典: Databricks Lakehouse Customers Achieve a 482% ROI

Georgian 投資ファンド
Databricksの急成長は本物か、バブルか——その問いに対し、顧客の実績が答えを出している。Comcastは計算コストを従来の10分の1に削減した。

出典: Databricks’ Meteoric Rise: Booming Business or Bubble?

Sacra テック企業分析メディア
Databricksはデータエンジニアリング企業からAIプラットフォーム企業への転換を成功させた、数少ない企業の一つだ。一方で、Snowflakeとの競合激化、そしてAWS・Google・Microsoftが自社のデータ+AI製品を強化した場合、Databricksの中立的ポジションが揺らぐリスクも無視できない。

出典: Sacra — Databricks

高評価の数字が並ぶ一方で、Sacraが指摘するように競合と巨大パートナーの動向という死角も存在する。次のセクションでは、その死角を正面から見ていきます。

評価額20兆円の裏にある、無視できない5つの死角

⚠ Risk Assessment

知っておきたいリスク

成功の裏返しが、そのまま弱点になりうる

HIGH

Snowflakeが同じ土俵に乗ってきた

Snowflakeが生成AI機能「Cortex」を急拡大し、Apache Iceberg対応でオープン路線にもシフト。Databricksの「オープン×AI」という得意領域に正面から攻め込んでおり、機能差が縮まるほど価格競争に陥るリスクが高まります。

MID

クラウド大手が自前で作り始めている

3大クラウドすべてで動くのが強みですが、各社は自前のデータ+AI統合サービスも強化中。AWSのEMR、GoogleのBigQuery、MicrosoftのFabric——「わざわざDatabricksを使う理由」が薄れるリスクがあります。特にMicrosoftとは最も深く統合されているだけに、協調と競合の二面性がシビアです。

MID

20兆円の評価、上場で通用するか

評価額約20兆円を公開市場が受け入れるかは別問題。IPOが延期されれば、社員の株式が現金化できない状態が続きます。非上場の自由と、財務の透明性の低さは表裏一体です。

MID

AI収益の急成長はいつまで続く?

Databricksの課金は「使った分だけ払う」消費型。AIブームで利用量が急増している面もあり、エージェント市場が期待ほど伸びなければ成長率も鈍化し、20兆円の評価額を正当化しにくくなります。

MID

無料公開した技術、タダで使われるリスク

中核技術を無料公開して標準を取る戦略は最大の武器ですが、「無料のまま自力で使える」企業も多い。有料版への転換率が落ちた瞬間に「タダで配っただけ」になるリスクと隣り合わせです。

インサイト: 最大のリスクは「成功しすぎた」こと

競合が追いつく速度と、Databricks自身が進化する速度のどちらが速いか

Databricksが直面するリスクの多くは、皮肉にも成功の裏返しです。市場を作りすぎたからSnowflakeが追いかけてくる。クラウド大手に不可欠な存在になりすぎたから、内製化の動機を与えている。オープンソースを広めすぎたから、無料で使われるリスクが生まれる。最終的にDatabricksの命運を分けるのは、競合が追いつく速度と、Databricks自身がAI時代のデータ基盤を進化させる速度の、どちらが速いか。その一点に尽きます。

What’s Next

Databricksが描く未来

IPO、AIエージェント、そしてグローバル——3つの賭けが同時に動いている

リスクを直視したうえで、それでもDatabricksが描く未来には明確な方向性があります。2026年、この会社は3つの大きな変化を同時に進めようとしています。

🏦

株式上場に向けて準備中

J.P. MorganやFidelityがリード投資家に加わり、IPO準備は本格化しています。ただし上場すれば四半期ごとの業績プレッシャーにさらされる。非上場の自由を手放すかどうか——単なるタイミングではなく、経営哲学の選択です。

🤖

AI時代のインフラを取れるか

Lakebase、Lakewatch、Genie Code、AI Runtime、Quotient AI買収——怒涛の新製品が向かう先は「AIエージェントが自律的に動く完全な環境」の構築。Databricks Oneではビジネスユーザーまでカバーする設計に舵を切りました。

🌎

海外への本格進出

英国・アイルランドに8.5億ドルの投資を発表し、ロンドンに欧州の拠点を開設。カナダではProtected B(政府の機密データを扱える安全基準)に対応したサーバーレス環境を整備するなど、規制が厳しい地域への展開も本格化しています。

インサイト: IPOは「データ企業」ではなく「AIプラットフォーム企業」として迎える

AI関連の収益が全体の26%以上を占め、比較対象はSnowflakeからAIプラットフォーム企業群へ

DatabricksがもしIPOに踏み切るなら、それは「データ基盤企業の上場」ではなく「AIプラットフォーム企業の上場」になるでしょう。AI関連の収益が全体の26%以上を占めるまでに成長しており、公開市場での比較対象がSnowflakeではなくAIプラットフォーム企業群にシフトする可能性があります。一方で、70億ドル以上を調達済みで資金に困っていない以上、「最適なタイミング」を自分で選べる立場にある——これ自体が、他社にはない贅沢な強みです。

バラバラだったデータ基盤とAI開発を「一つの場所」に統合する——この一点にこだわり続けてきたことが、ARR8,100億円・前年比65%成長という異常な数字の正体です。
UC Berkeleyの研究室から生まれたApache Sparkを起点に、レイクハウスという新しい概念を自ら作り出し、業界の標準にしてしまった。オープンソースで技術を無料公開しながら、その上の有料版で稼ぐ——直感に反するこのモデルが、企業ITの常識を変えました。

強さの源泉は、技術力・経営力・エコシステムの三拍子が揃っていることです。Sparkを発明したMatei ZahariaがCTOにいて、AIチップからプラットフォームまで経験したNaveen RaoがAI戦略を率い、CEO Ali Ghodsiが非上場のまま20兆円企業を成長させ続けている。ただし、この成功こそが最大の変数でもあります。クラウド大手3社は味方であると同時に潜在的な競合であり、SnowflakeはAI領域で真正面から攻め込んできています。

AIエージェント時代のデータ基盤を握れるか、IPOで公開市場の評価に耐えられるか——Databricksの次の章は、これまでの13年間で最もスリリングなものになるはずです。

Takeaway

この記事のポイント

  • ARR8,100億円・前年比65%成長——この規模のソフトウェア企業でこの伸び率は、上場・非上場を問わずほぼ前例がない
  • 「レイクハウス」という概念を自ら作り、業界標準にした。データの保管と分析を1つにまとめる発想が、AI時代のインフラになりつつある
  • 中核技術をオープンソースで無料公開し、業界標準を取ってから有料版で稼ぐ——囲い込みの逆を行くモデルが武器
  • Sparkの発明者がCTO、AIチップ起業家がAI部門トップ、UC Berkeley教授が会長。技術の「生みの親」が経営の中枢にいる稀有な布陣
  • 最大のリスクはAWS・Azure・Google Cloudが味方から競合に変わること。パートナーと潜在的な敵が同じ顔ぶれという緊張関係が、20兆円企業の最大の変数

— 読了お疲れさまでした。この企業の最新動向は、AI産業通信で随時更新します。


編集部コラム

「オープンにすることで勝つ」は本当に続くのか

AIブームの中で、みんなが注目するのはChatGPTを作ったOpenAIやAnthropicのような「モデルを作る企業」です。でも、ゴールドラッシュで一番確実に儲かったのは金を掘った人ではなく、ツルハシを売った人だった——という有名な話があります。Databricksはまさにそのツルハシ屋のポジションにいます。どんなAIモデルが流行っても、そのモデルを動かすには「整理された大量のデータ」が必要で、そのデータ基盤を握っているのがこの会社です。しかもオープンソースで業界標準を取るという、囲い込みの真逆を行く戦略で勝ってきた。

ただし、一つ気になることがあります。競合のSnowflakeがApache Icebergへの対応を進め、オープン路線に舵を切り始めました。「オープンであること」自体がDatabricksだけの武器ではなくなる時代が、もう見え始めています。データ基盤を握りながらAIプラットフォームへの転換にも成功した企業は実はほとんどいない——その希少なポジションをどこまで守れるか。編集部としては、モデルより基盤を握っている側の方が長期的には強いと見ていますが、「勝ち確」とは言い切れない緊張感がこの会社の面白さだと思っています。

AI産業通信 編集部

Company Data

基本情報

正式名称Databricks, Inc.
設立2013年6月
代表者Ali Ghodsi(CEO・共同創業者)
本社サンフランシスコ、カリフォルニア州
従業員数約6,000名
累計調達額約1兆円(70億ドル以上)
推定企業価値約20兆円(1,340億ドル)
主要投資家Andreessen Horowitz / Tiger Global / Alphabet / Salesforce Ventures / J.P. Morgan / Fidelity
公式サイトhttps://www.databricks.com
  • URLをコピーしました!
  • URLをコピーしました!
目次

For Business

AI導入・DX推進の
ご相談を承ります

戦略策定から技術選定・導入支援まで、
AI産業の最新知見をもとに、貴社の事業成長を支援します。