DWH(データウェアハウス)とは?DBやBIとの違いについても解説

最終更新日 : 2020-06-18 Box

ここではDWH(データウェアハウス)について紹介していきます。企業活動においては膨大なデータが日々発生し、利用されています。それらのデータは極めて貴重なものであり、今すぐにその貴重さが分かるものもあるでしょうが一方ではそうではなく、数か月とか数年たってから見返してみて初めて何か重要なことに気付ける場合もあります。

このような目的のためにはデータを安全確実に保存しておくことが欠かせません。DWH(データウェアハウス)とはまさにその目的のために用いられるもので、ウェアハウスとは倉庫という意味ですから、いわばデータ倉庫とでも呼ぶことができます。普段使わなくなったものでも、後々必要かもしれないから大事に保存しておくといったイメージです。

DWH(データウェアハウス)とは?

DWH(データウェアハウス)とは、企業活動において発生する様々なデータを、その場で即座に利用するのではなく後々の目的のためにしっかりと保存しておくための仕組みのことです。ウェアハウスが倉庫のことだとは言っても、あくまでデータですから決して物流倉庫のようなものではなく、データを安全確実に保存しておけるサーバーのことと思ってもらえば良いでしょう。

小規模なものであればそれこそサーバー1台あれば十分なこともあります。ただ、データには実体がなくてもサーバーはそうではありませんから、多くのサーバーを管理しているDWH(データウェアハウス)はある意味で外見上も物流倉庫的な、頑丈な建物であったりすることはあります。

DWH(データウェアハウス)とデータベースの違い

DWH(データウェアハウス)がサーバーのこととすると、データベースとの違いは何なのかと思われるかもしれません。これは利用目的によって区別できます。データベースはあくまで日常利用のためですが、DWH(データウェアハウス)は保存が目的という違いがあります。

DWH(データウェアハウス)の定義

さて、DWH(データウェアハウス)はデータ倉庫のようなものと説明しましたが、これはあくまでイメージを分かりやすく説明したものであり、専門的にはより詳細な定義があります。

DWH(データウェアハウス)の定義とは、サブジェクトごとに保管すること、データを統合すること、データが時系列であること、それにデータを消さないことの4つの条件を満たしたものを指します。

これらを満たして初めて、後々必要になったときに適切に利用できるためのデータ倉庫の要件を満たしていると言えます。それぞれの定義についてより詳しく紹介していきましょう。

サブジェクトごとに保管する

サブジェクトとは内容のことです。データを内容ごとに保管するというのは、内容ごとでない保管の仕方にはどのようなものがあるかを考えれば分かりやすいかもしれません。

内容ごとでない保管とは例えば目的ごとの保管が挙げられます。営業部で利用するデータ、人事部で利用するデータ、経理部で利用するデータといったように部署ごとに保管するのはまさに目的ごとに分けた保管と言えるでしょう。DWH(データウェアハウス)ではそうではなく、目的が別であっても同じ内容のデータ、例えば顧客データとか売上データといったものは一つにして保管するという特徴があります。

データを統合する

サブジェクトごと、つまり内容ごとに保管するためには、一般的にデータを統合する必要があります。わざわざ説明するまでもない常識的なことに思えるかもしれませんがそんなに簡単な話ではありません。部署が違って利用システムが違えば一般的にデータの形式やラベル名も異なるのが普通です。

例えば顧客データを考えてみますと、ある部署のシステムでは顧客名というラベルで管理されている一方、別の部署では取引先というラベルで管理されているかもしれません。これは同じ意味だと人間には容易に判断できますが、コンピューターには容易なことではありませんから、人の手を介してうまく統合する必要があります。

データが時系列である

DWH(データウェアハウス)の目的を考えた場合、時系列にデータが残されているということも重要です。これは最新のデータだけでなく過去のデータも全て残されているということを意味します。

データベースとの大きな違いの一つと言っても良いかもしれません。日常利用目的であれば最新のデータだけあれば十分で過去のデータは特に必要なく、過去の古いデータに基づいて誤った仕事の進め方をしてしまうのを避けるためにはむしろ過去のデータに不用意にアクセスできてしまわないようにするほうが良い場合さえありますが、DWH(データウェアハウス)の場合はそうではありません。

データを消さないこと

データが時系列であることと似たような意味合いがありますが、基本的に一度集めたデータは消さないという点も重要なポイントです。後々有用になるかもしれないという意味で保存しておくわけで、不用意に消してしまっては目的が果たせなくなってしまいます。

もちろん、変化の早い今の時代において、10年も20年も前のデータには何の意味もないと考えられるような場合もあるでしょうし、実際問題として保存のためのサーバーにはコストもかかります。そういう理由からデータを消すことも無きにしも非ずですが、原則的には消さないということです。

BI(ビジネスインテリジェンス)とは

DWHというと付き物のように出てくる用語としてBI(ビジネスインテリジェンス)があります。インテリジェンスとは直訳すると情報のことですが、単なる情報ではなく、情報を活用して実際の経営判断をサポートすることといった意味合いで用いられることが多いです。

得られた情報に基づき分析した結果、次はこれくらいの予算でこのようなキャンペーンを展開するのが効果的と考えられます、などと提案するといったことがまさにBIに該当します。経営においては当然ながら非常に重要な意味合いを持ち、優秀なBIを持つ企業が発展していくと言えるでしょう。

DWHとBIの違い

DWHはもちろん基本的にはデータを保存すること、またはそのためのサーバーを指すものであり、その意味では経営判断を直接サポートするBIとは異なります。ですが、何のためにDWHを行うのかと考えれば、まさか趣味のために行うようなはずがなく、最終的にはBIに活用するためであるはずです。

一方でBIのためにはDWHから得られたデータも非常に重要でしょうが、必ずしもそれだけに頼るとは限りません。社会情勢などそもそもDWHには含まれない情報を元にBIが行われることもあるからです。

つまり、BIの中にはDWHが含まれているけれども、DWHとは関係のないBIもあるというのが両者の違いというか、両者の関係性になります。

DWHの活用例

DWHの活用ですが、例えば顧客がどのような行動を取ることが多いのかを見極めることで効果的なマーケティングにつなげることができます。仮に、商品Aを購入した顧客は同時に商品Bを購入することが多く、また後日商品Cを購入していることが多いとDWHから分かったとしましょう。

当然、商品Aを扱う店舗には商品Bを決して切らさないようにしておくとか、商品Aの陳列棚にはBも売れていますといったポップを立てることが考えられますし、顧客管理ができていれば商品Aを購入した人には時期をみながらCを勧めるメールマガジンやダイレクトメールを送ることが考えられるでしょう。

この他にも店舗ごとの違いを分析して販売員のトレーニングに活かすなど、様々な活用が考えられます。

DWHまとめ

企業活動において発生するデータを保存しておくDWHについて紹介してきました。最近、ビッグデータという言葉が一つの流行りのようになっていますが、これも適切にデータを保存していて初めて達成できることです。

膨大なデータを分析すれば、今まで見えていなかったような思わぬ傾向が明らかになることも多々あり、それを活用することで効率的な企業活動につなげることも可能です。DWHはマーケティング活動に利用されることが多いですが、決してそれだけではありません。

製造工場のデータから生産管理に応用することもあるでしょうし、人事データから人材獲得とか人材教育に応用するようなことも考えられ、企業活動全般において役立つ可能性が十分にあります。

Twitter Facebook Bing