先說說數據倉庫和數據挖掘的關系,再說說數據庫與數據倉庫的關系
數據倉庫與數據挖掘的聯系
(1) 數據倉庫為數據挖掘提供了更好的、更廣泛的數據源。
(2) 數據倉庫為數據挖掘提供了新的支持平臺。
(3) 數據倉庫為更好地使用數據挖掘這個工具提供了方便。
(4) 數據挖掘為數據倉庫提供了更好的決策支持。
(5) 數據挖掘對數據倉庫的數據組織提出了更高的要求。
(6) 數據挖掘還為數據倉庫提供了廣泛的技術支持。
數據倉庫與數據挖掘的差別
(1) 數據倉庫是壹種數據存儲和數據組織技術, 提供數據源。
(2) 數據挖掘是壹種數據分析技術, 可針對數據倉庫中的數據進行分析。
1、數據庫:是壹種邏輯概念,用來存放數據的倉庫,通過數據庫軟件來實現。數據庫由很多表組成,表是二維的,壹張表裏面有很多字段。字段壹字排開,對數據就壹行壹行的寫入表中。數據庫的表,在於能夠用二維表現多維的關系。如:oracle、DB2、MySQL、Sybase、MSSQL Server等。
2、數據倉庫:是數據庫概念的升級。從邏輯上理解,數據庫和數據倉庫沒有區別,都是通過數據庫軟件實現存放數據的地方,只不過從數據量來說,數據倉庫要比數據庫更龐大德多。數據倉庫主要用於數據挖掘和數據分析,輔助領導做決策;
區別主要總結為以下幾點:
1.數據庫只存放在當前值,數據倉庫存放歷史值;
2.數據庫內數據是動態變化的,只要有業務發生,數據就會被更新,而數據倉庫則是靜態的歷史數據,只能定期添加、刷新;
3.數據庫中的數據結構比較復雜,有各種結構以適合業務處理系統的需要,而數據倉庫中的數據結構則相對簡單;
4.數據庫中數據訪問頻率較高,但訪問量較少,而數據倉庫的訪問頻率低但訪問量卻很高;
5.數據庫中數據的目標是面向業務處理人員的,為業務處理人員提供信息處理的支持,而數據倉庫則是面向高層管理人員的,為其提供決策支持;
6.數據庫在訪問數據時要求響應速度快,其響應時間壹般在幾秒內,而數據倉庫的響應時間則可長達數幾小時