データレイク(Data Lake)

データレイクとは、データの大きさ・容量に関わらず、すべての構造化データ、半構造化データ、非構造化データを保存できる一元化された保管場所のことです。

従来の「データウェアハウス」では、目的に応じてデータを加工し、あらかじめ絞られたデータのみを蓄積していたのに対し、「データレイク」では、データをそのままの形で保存できるため、事前にデータを分析・加工する作業(データプレパレーション 作業)が不要です。また、蓄積されたデータが加工・選定されていないため、分析時にデータ不足になることなく幅広い分析ニーズに応えることが可能です。