はじめに
データ分析のニーズが多様化する中、BI(Business Intelligence)ツールはますます進化しています。その中でも近年注目を集めているのが "BI as Code" という概念です。BI as Codeとは、コードベースでデータレポートを構築・管理する手法を指し、SQLやMarkdownといった記述言語を活用して柔軟でスケーラブルな分析環境を提供します。このトレンドの背景には、データエンジニア/アナリストが効率的にコラボレーションできる環境への需要が高まっていることがあります。Evidenceは、このBI as Codeを体現する新興BIツールであり、データドリブンな意思決定を支援するプラットフォームです。
一方で、Codatumも異なるアプローチを採用しながら、BI as Codeの要素を備えています。Codatumはコードを基盤としつつも、技術者と非技術者の両方に配慮した直感的な操作性を重視した次世代型のBIツールです。本記事では、両ツールがどのようにBI as Codeを体現しているのかを掘り下げ、それぞれの特徴と適性を比較します。
Evidenceについて
Evidenceは、コードベースで高品質なデータレポートを構築するためのオープンソースBIツールです。公式サイトでは “従来のBIツールが抱える「動作が遅い」「設定が煩雑」といった課題を解決し、ニューヨーク・タイムズのデータジャーナリズムのように洗練されたデータレポートを提供することがミッション”と掲げています。(参考記事) また、Evidenceはデータエンジニア/アナリストをターゲットにする傾向にあり、具体的には以下のようなユーザーに対して強みを発揮します。
データエンジニア/アナリスト:高度なカスタマイズやデータドリブンなアプローチを求めるプロフェッショナル。
個人または小規模な技術チーム:独自のワークフローを構築し、GitやIDEを活用した効率的な開発を進めたいユーザー。
「BI as Code」のトレンドを採用したい組織:最新の技術と高性能なコードドリブンなデータレポートを重視する企業。
このアプローチにより、Evidenceはコードドリブンのワークフローやプログラム的な操作を通じて、従来型BIツールにはない柔軟性とパフォーマンスを提供しています。
Evidenceの特徴
技術者に馴染みのある環境: GitやCI/CDツールとの統合をサポートしており、既存のソフトウェア開発プロセスに組み込みやすい設計です。また、ローカル環境にインストールすることで、チームが慣れ親しんだIDE(例えばVS Code)を利用してレポート作成が行えます。
高度なカスタマイズ性: SQLとMarkdownを活用したコードベースの操作により、動的なレポート生成や高度なカスタマイズを可能にします。ループや条件分岐を用いた記述により、データドリブンな動的コンテンツの生成が容易です。また、特殊なcomponents記法を利用して、カードやチャートを組み合わせたダッシュボード風のレイアウトや柔軟な可視化が実現できます。
セットアップの簡便さ: Evidenceは、ローカル環境に数分でセットアップ可能であり、データエンジニア/アナリストがすぐに作業を開始できます。このシンプルな導入プロセスは、小規模なチームにも適しています。
Evidecneの強み
技術者との親和性の高い設計: Evidenceは、GitやIDE、CI/CDツールに慣れた技術者にとって非常に扱いやすい設計になっています。従来のBIツールと異なり、技術者が日常的に使用するツールと同じ環境で分析プロジェクトを進められます。
コードドリブンなカスタマイズ性: 特徴で挙げたcomponents記法や条件付きロジックの柔軟性は、特定のビジネスニーズに応じたレポートを動的に生成するための強力なツールとなります。
分析プロセスの一貫性と透明性: コードで全てのプロセスを記述するため、プロジェクト全体の変更履歴や再現性を確保できます。
高速な固定データセット分析: EvidenceはParquet形式のデータ処理を採用しており、静的データの分析において特に高いパフォーマンスを発揮します。
Evidenceの課題
リアルタイム共同編集の欠如: EvidenceはGitを介したデータ共有を前提としているため、即時のコラボレーションや変更の反映が難しいです。そのため、複数ユーザー間でのリアルタイムな共同編集ができません。
技術者依存が高い設計: Evidenceは、IDEやGitなどのツールに精通しているユーザーを前提に設計されており、これらに慣れていないユーザーにとっては活用が難しい課題があります。
コードベースの操作性: コードベースでの操作が中心であるため、GUIに慣れているユーザーには直感的でないと感じる場合があります。
作成者と消費者(閲覧者)の明確な分断: Evidenceは作成者と消費者を明確に分ける設計になっているため、消費者が分析結果の修正や深掘りを求める際には、作成者への依頼が必要になります。この点が意思決定のスピード低下につながる可能性があります。
データサイズと更新頻度の課題: EvidenceはParquet File形式で事前にデータを保存する仕組みのため、静的なデータセットの分析には向いていますが、大規模データやリアルタイムデータの取り扱いには適していません。
Evidenceは、高速な固定データセット分析や高度なカスタマイズ性を求める小規模な技術チームには非常に効果的です。一方で、データのリアルタイム性や柔軟なコラボレーションを重視する場面では、技術者以外の参加が難しく、作成者への依存度が高まることで意思決定のスピードに課題が生じる場合があります。
EvidenceとCodatumの大まかな違い
Evidenceは、データエンジニア/アナリストなどの高度なデータ人材を主な対象としています。コードドリブンの設計は技術者には魅力的ですが、非技術者には敷居が高いです。一方で、Codatumはチームでのコラボレーションや非技術者の利用も想定しており、直感的な操作性やリアルタイム性が重視されています。
学習コスト
Evidence:環境のセットアップにコストがかかり、componentの記法(syntax)を覚える必要があります。
Codatum:AIアシスト機能や直感的なインターフェースが備わっているため、初心者でも扱いやすい設計です。
コラボレーション
Evidence:主に個人作業に適しており、データの共有はGitベースで行います。
Codatum:同時編集やコメント通知機能を備えており、分析者以外も参加しやすいノートブック形式です。これにより、効率的なチームコラボレーションを実現します。
ダッシュボード機能
Evidence:専用のダッシュボードUIはありませんが、Notebook内で
を使用することで、ダッシュボード風のレイアウトを作成できます。これにより、カードやチャートなどを柔軟に配置し、データを視覚的に整理できます。
Codatum:リアルタイムでデータを可視化でき、非技術者でも扱いやすい設計です。柔軟なカスタマイズやリアルタイム更新が可能なため、チーム全体で迅速な意思決定をサポートします。
エディタの違い
Evidence:Evidenceはローカル環境で動作し、公式サイトではVS Codeを推奨しています。高度なカスタマイズが可能であり、技術者にとっては馴染みやすい選択肢です。
Codatum:Codatumは完全オンラインの共同エディタを採用しており、特別なセットアップは不要です。リアルタイムでの共同編集が可能で、複数のメンバーが同時に作業を進めることができます。
データのリアルタイム性
Evidence:Parquet File形式によりデータを事前に保存するため、高速なクエリが可能です。ただし、新鮮なデータの更新には制限があるため、大規模データのリアルタイム分析には不向きです。
Codatum:Datawarehouseに直接接続し、リアルタイム分析が可能です。これにより最新データを扱えますが、クエリの実行には一定の時間がかかります。
機能比較
機能カテゴリ | 機能詳細 | Codatum | Evidence |
エディタ機能 | エディタタイプ | 最新のBlock-based | Code-editor(vs codeなど) |
データセット検索 | 👌 | 👌 | |
SQL分割・参照 | 👌 | 👌 | |
ファイル管理方法 | チームスペース・多階層フォルダ | Git, File-base | |
ダッシュボードUI | 可視化機能 | 👌 | 👌 |
共有機能 | 外部ゲスト共有 | 👌 | ❌ |
グローバルパブリッシュ | 👌 | 👌 | |
権限管理 | 👌 | ❌ | |
データソース | 対応範囲 | ❌ BigQueryのみ(今後拡大予定) | 👌 多数対応 |
最新データの反映 | リアルタイム読み込み(DWHに直クエリ) | Build時に事前読み込み(DuckDB/Parquet形式) | |
扱えるデータ量 | 大規模データ(DWH直接接続) | サーバーに読み込める量のデータ量 | |
クエリの実行 | クエリの速度 | ❌ (DWHの速度に依存) | 👌 (事前読み込み済みなので速い) |
クエリの実行される場所 | BigQuery上で実行 | サーバー上でDuckDBを通じて実行 | |
モデリング | SQLモデリング | 👌 | ❌ |
メタデータ管理 | 👌 | ❌ | |
AIアシスト | 機能範囲 | 👌 | 👌 (vs-codeで可) |
提供形態 | 形式 | SaaS | Self-hosting (SaaSも存在) |
Evidenceは、データエンジニアやアナリスト向けに設計された高度なカスタマイズ性を備えたツールです。小規模な技術チームや、固定されたデータセットを効率的に分析するニーズに適しています。一方で、リアルタイム性を重視したい場合や、技術者以外も含めた柔軟なチームコラボレーションが求められる場面では、課題が顕著になります。このため、Codatumのような直感的な操作性とチーム全体でのリアルタイムなデータ活用を支援するツールとの選択は、使用目的や対象ユーザーによって大きく異なるといえます。
どちらを選ぶべき?CodatumとEvidenceの選び方
Codatumを選ぶべき人
Codatumは、データ分析を効率化し、幅広いユーザー層に対応できる次世代型のBIツールです。以下のようなユーザーに最適です:
非技術者を含むチームでデータ分析を進めたい人
直感的なBlock-based UIやAIアシスト機能により、SQL初心者や非技術者でも簡単に利用可能。
チーム全体でのデータ共有や意思決定をスムーズに行える環境を提供。
複数人でプロジェクトを進行する必要がある人
チームスペースや多階層フォルダの管理機能で、複数人での共同作業が効率的。
詳細な権限管理機能を活用し、社内外のコラボレーションを安全かつ柔軟に実現。
データを外部とも共有したい人
White Label Embed機能や外部ゲスト共有機能を使い、顧客やパートナーとデータをシームレスに共有可能。
リアルタイム共有性を重視する人
Notebookのリアルタイム共同編集機能により、即時のフィードバックやコラボレーションが可能。
最新の大規模データ処理が必要な人
多様なデータソースからリアルタイムに情報を取得し、状況に応じた分析が必要な場合。
Evidenceを選ぶべき人
Evidenceは、コードドリブンの柔軟性を活用して、カスタマイズ性を重視する技術者向けのBIツールです。以下のようなユーザーに最適です:
コードドリブンのワークフローを重視する方
SQLやMarkdownを駆使して、データ分析やレポート作成をプログラム的に管理したい。
Gitを活用したバージョン管理で、データプロジェクトの変更履歴や共同作業を効率的に運用したい。
CI/CDの統合により、分析プロセスの自動化や継続的なデプロイメントをスムーズに進めたい。
コードベースの設計で、高いカスタマイズ性とデータの再現性を確保したい。
プロジェクト全体をコードで管理し、長期的なデータの一貫性を維持したい人
個別ニーズに特化した高度なカスタマイズを求める人
条件分岐や動的処理を含む複雑なロジックを、データレポートや可視化に直接組み込みたい方
チームの汎用的な分析ではなく、個別プロジェクトに最適化されたレポートを作成したい。
高速な固定データセット分析が必要な人
データ更新頻度が低く、既存データを素早く分析したい。
実行環境のメンテナンスができる人
サーバーを運用することができる人
分析がローカルから出ない人
まとめ
CodatumとEvidenceは、それぞれ異なる方法でBI as Codeの理念を体現しています。Evidenceは、SQLやMarkdownを基盤としたコードドリブンの設計により、データ分析プロセスの透明性や再現性を実現します。このアプローチは、データエンジニア/アナリストのような技術者にとって親和性が高く、高度なカスタマイズが可能です。ただし、リアルタイム性や非技術者が参加するチームでの利用には課題が残ります。
一方、Codatumは、コードの柔軟性を活かしながらも、ブロックベースのインターフェースやAIアシスト機能により、技術者と非技術者が同じプラットフォーム上で効率的に作業できる環境を提供します。また、リアルタイムなデータ編集や共同作業の機能に優れ、チーム全体の迅速な意思決定を支援します。
どちらのツールが適しているかは、チームのニーズ次第です。BI as Codeをどのように活用したいかを明確にし、それぞれのツールの特長を踏まえて選択しましょう。