- 相關(guān)推薦
電子商務(wù)師考試內(nèi)容:數(shù)據(jù)倉(cāng)庫(kù)
傳統(tǒng)的數(shù)據(jù)庫(kù)技術(shù)是單一的數(shù)據(jù)資源,即數(shù)據(jù)庫(kù)為中心,進(jìn)行從事事務(wù)處理到?jīng)Q策分析等各種類(lèi)型的數(shù)據(jù)處理工作。近年來(lái),隨著計(jì)算機(jī)應(yīng)用,網(wǎng)絡(luò)計(jì)算,開(kāi)始向兩個(gè)不同的方向拓展,一是廣度計(jì)算,一是深度計(jì)算,廣度計(jì)算的含義是把計(jì)算機(jī)的應(yīng)用范圍盡量擴(kuò)大,間時(shí)實(shí)現(xiàn)廣泛的數(shù)據(jù)交流,互聯(lián)網(wǎng)就是廣度計(jì)算的特征,另一方面就是人們對(duì)以往計(jì)算機(jī)的簡(jiǎn)單數(shù)據(jù)操作,提出了更高的要求,希望計(jì)算機(jī)能夠更多的參與數(shù)據(jù)分析與決策的制定等領(lǐng)域。下面yjbys考試網(wǎng)小編為大家講述了電子商務(wù)師考試內(nèi)容:數(shù)據(jù)倉(cāng)庫(kù),供參考。
經(jīng)過(guò)數(shù)十年的發(fā)展,在企業(yè)的數(shù)據(jù)庫(kù)中已經(jīng)保存了大量的日常業(yè)務(wù)數(shù)據(jù),并且傳統(tǒng)的業(yè)務(wù)系統(tǒng)一般也是直接建立在這種事務(wù)處理環(huán)境上的。隨著技術(shù)的進(jìn)步,人們逐漸認(rèn)識(shí)到,在目前的計(jì)算機(jī)處理能力上,事物處理和分析處理具有極不相同的性質(zhì),直接使用事務(wù)處理環(huán)境來(lái)支持決策是行不通的。
事務(wù)處理環(huán)境不適宜DSS(決策支持系統(tǒng))應(yīng)用的原因主要有以下五條:
(1)事務(wù)處理和分析處理的性能特性不同
在事務(wù)處理環(huán)境中,用戶(hù)的行為特點(diǎn)是數(shù)據(jù)的存取操作頻率高而每次操作處理的時(shí)間短;在分析處理環(huán)境中,用戶(hù)的行為模式與此完全不同,某個(gè)DSS應(yīng)用程序可能需要連續(xù)幾個(gè)小時(shí),從而消耗大量的系統(tǒng)資源。將具有如此不同處理性能的兩種應(yīng)用放在同一個(gè)環(huán)境中運(yùn)行顯然是不適當(dāng)?shù)摹?/p>
(2)數(shù)據(jù)集成問(wèn)題
DSS需要集成的數(shù)據(jù)。全面而正確的數(shù)據(jù)是進(jìn)行有效分析和決策的首要前提,相關(guān)數(shù)據(jù)收集得越完整,得到的結(jié)果就越可靠。當(dāng)前絕大多數(shù)企業(yè)內(nèi)數(shù)據(jù)的真正狀況是分散而非集成的。造成這種分散的原因有多種,主要有事務(wù)處理應(yīng)用分散、“蜘蛛網(wǎng)”問(wèn)題、數(shù)據(jù)不一致問(wèn)題、外部數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。
(3)數(shù)據(jù)動(dòng)態(tài)集成問(wèn)題
靜態(tài)集成的最大缺點(diǎn)在于,如果在數(shù)據(jù)集成后數(shù)據(jù)源中數(shù)據(jù)發(fā)生了變化,這些變化將不能反映給決策者,導(dǎo)致決策者使用的是過(guò)時(shí)的數(shù)據(jù)。集成數(shù)據(jù)必須以一定的周期(例如24小時(shí))進(jìn)行刷新,顯然,事務(wù)處理系統(tǒng)不具備動(dòng)態(tài)集成的能力。
(4)歷史數(shù)據(jù)問(wèn)題
事務(wù)處理一般只需要當(dāng)前數(shù)據(jù),在數(shù)據(jù)庫(kù)中一般也是存儲(chǔ)短期數(shù)據(jù),且不同數(shù)據(jù)的保存期限也不一樣,即使有一些歷史數(shù)據(jù)保存下來(lái)了,也被束之高閣,未得到充分利用。但對(duì)于決策分析而言,歷史數(shù)據(jù)是相當(dāng)重要的,許多分析方法必須以大量的歷史數(shù)據(jù)為依托。沒(méi)有歷史數(shù)據(jù)的詳細(xì)分析,是難以把握企業(yè)的發(fā)展趨勢(shì)的。DSS對(duì)數(shù)據(jù)在空間和時(shí)間的廣度上都有了更高的要求,而事務(wù)處理環(huán)境難以滿(mǎn)足這些要求。
(5)數(shù)據(jù)的綜合問(wèn)題
在事務(wù)處理系統(tǒng)中積累了大量的細(xì)節(jié)數(shù)據(jù),一般而臺(tái),DSS并不對(duì)這些細(xì)節(jié)數(shù)據(jù)進(jìn)行分析:在分析前,往往需要對(duì)細(xì)節(jié)數(shù)據(jù)進(jìn)行不同程度的綜合。而事務(wù)處理系統(tǒng)不具備這種綜合能力,根據(jù)規(guī)范化理論,這種綜合還往往因?yàn)槭且环N數(shù)據(jù)冗余而加以限制。
要提高分析和決策的效率和有效性,分析型處理及其數(shù)據(jù)必須與操作型處理及其數(shù)據(jù)相分離。因此,必須把分析型數(shù)據(jù)從事務(wù)處理環(huán)境中提取出來(lái),按照 DSS 處理的需要進(jìn)行重新組織,建立單獨(dú)的分析處理環(huán)境,數(shù)據(jù)倉(cāng)庫(kù)正是為了構(gòu)建這種新的分析處理環(huán)境中出現(xiàn)的一種數(shù)據(jù)存儲(chǔ)和組織技術(shù)。著名的數(shù)據(jù)倉(cāng)庫(kù)專(zhuān)家W.H.Inmon在其著作《Building the Data warehouse》 一書(shū)中給予如下描述:數(shù)據(jù)倉(cāng)庫(kù)(Data Warehouse)是一個(gè)面向主題的(Subject Oriented)、集成的(Integrate)、相對(duì)穩(wěn)定的(Non –Volatile)、反映歷史變化(Time Variant)的數(shù)據(jù)集合,用于支持管理決策。
根據(jù)數(shù)據(jù)倉(cāng)庫(kù)概念的含義,數(shù)據(jù)倉(cāng)庫(kù)擁有以下四個(gè)特點(diǎn):
(1)面向主題。操作型數(shù)據(jù)庫(kù)的數(shù)據(jù)組織面向事務(wù)處理任務(wù),各個(gè)業(yè)務(wù)系統(tǒng)之間各自分離,而數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)是按照一定的主題域進(jìn)行組織。主題是一個(gè)抽象的概念,是指用戶(hù)使用數(shù)據(jù)倉(cāng)庫(kù)進(jìn)行決策時(shí)所關(guān)心的重點(diǎn)方面,一個(gè)主題通常與多個(gè)操作型信息系統(tǒng)相關(guān)。
(2)集成的。面向事務(wù)處理的操作型數(shù)據(jù)庫(kù)通常與某些特定的應(yīng)用相關(guān),數(shù)據(jù)庫(kù)之間相互獨(dú)立,并且往往是異構(gòu)的。而數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)是在對(duì)原有分散的數(shù)據(jù)庫(kù)數(shù)據(jù)抽取、清理的基礎(chǔ)上經(jīng)過(guò)系統(tǒng)加工、匯總和整理得到的,必須消除源數(shù)據(jù)中的不一致性,以保證數(shù)據(jù)倉(cāng)庫(kù)內(nèi)的信息是關(guān)于整個(gè)企業(yè)的一致的全局信息。
(3)相對(duì)穩(wěn)定的。操作型數(shù)據(jù)庫(kù)中的數(shù)據(jù)通常實(shí)時(shí)更新,數(shù)據(jù)根據(jù)需要及時(shí)發(fā)生變化。數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)主要供企業(yè)決策分析之用,所涉及的數(shù)據(jù)操作主要是數(shù)據(jù)查詢(xún),一旦某個(gè)數(shù)據(jù)進(jìn)人數(shù)據(jù)倉(cāng)庫(kù)以后,一般情況下將被長(zhǎng)期保留,也就是數(shù)據(jù)倉(cāng)庫(kù)中一般有大量的查詢(xún)操作,但修改和刪除操作很少,通常只需要定期的加載、刷新。
(4)反映歷史變化。操作型數(shù)據(jù)庫(kù)主要關(guān)心當(dāng)前某一個(gè)時(shí)間段內(nèi)的數(shù)據(jù),而數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)通常包含歷史信息,系統(tǒng)記錄了企業(yè)從過(guò)去某一時(shí)點(diǎn)(如開(kāi)始應(yīng)用數(shù)據(jù)倉(cāng)庫(kù)的時(shí)點(diǎn))到月前的各個(gè)階段的信息,通過(guò)這些信息,可以對(duì)企業(yè)的發(fā)展歷程和未來(lái)趨勢(shì)做出定量分析和預(yù)測(cè)。
整個(gè)數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)是一個(gè)包含四個(gè)層次的體系結(jié)構(gòu)。
數(shù)據(jù)源是數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的基礎(chǔ),是整個(gè)系統(tǒng)的數(shù)據(jù)源泉。通常包括企業(yè)內(nèi)部信息和外部信息。內(nèi)部信息包括存放于RDBMS中的各種業(yè)務(wù)處理數(shù)據(jù)和各類(lèi)文檔數(shù)據(jù)。外部信息包括各類(lèi)法律法規(guī),市場(chǎng)信息和競(jìng)爭(zhēng)對(duì)手的信息等等。
數(shù)據(jù)的存儲(chǔ)與管理是整個(gè)數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的核心。數(shù)據(jù)倉(cāng)庫(kù)的真正關(guān)鍵是數(shù)據(jù)的存儲(chǔ)和管理。數(shù)據(jù)倉(cāng)庫(kù)的組織管理方式?jīng)Q定了它有別于傳統(tǒng)數(shù)據(jù)庫(kù)。同時(shí)也決定了其對(duì)外部數(shù)據(jù)的表現(xiàn)形式。要決定采用什么產(chǎn)品和技術(shù)來(lái)建立數(shù)據(jù)倉(cāng)庫(kù)的核心,則需要從數(shù)據(jù)倉(cāng)庫(kù)的技術(shù)特點(diǎn)著手分析。針對(duì)現(xiàn)有各業(yè)務(wù)系統(tǒng)的數(shù)據(jù),進(jìn)行抽取、清理,并有效集成,按照主題進(jìn)行組織。數(shù)據(jù)倉(cāng)庫(kù)按照數(shù)據(jù)的覆蓋范圍可以分為企業(yè)級(jí)數(shù)據(jù)倉(cāng)庫(kù)和部門(mén)級(jí)數(shù)據(jù)倉(cāng)庫(kù)(通常稱(chēng)為數(shù)據(jù)集市)。
OLAP服務(wù)器:對(duì)分析需要的數(shù)據(jù)進(jìn)行有效集成。按多維模型予以組織,以便進(jìn)行多角度、多層次的分析,并發(fā)現(xiàn)趨勢(shì)。其具體實(shí)現(xiàn)可以分為:ROLAP、MOLAP和HOLAP。ROLAP基本數(shù)據(jù)和聚合數(shù)據(jù)均存放在RDBMS之中; MOLAP基本數(shù)據(jù)和聚合數(shù)據(jù)均存放于多維數(shù)據(jù)庫(kù)中;HOLAP基本數(shù)據(jù)存放于RDBMS之中,聚合數(shù)據(jù)存放于多維數(shù)據(jù)庫(kù)中。
前端工具主要包括各種報(bào)表工具、查詢(xún)、數(shù)據(jù)分析工具、數(shù)據(jù)挖掘工具以及各種基于數(shù)據(jù)倉(cāng)庫(kù)或數(shù)據(jù)集市的應(yīng)用開(kāi)發(fā)工具。其中數(shù)據(jù)分析工具主要針對(duì)OLAP服務(wù)器,報(bào)表工具、數(shù)據(jù)挖掘工具主要針對(duì)數(shù)據(jù)倉(cāng)庫(kù)。
數(shù)據(jù)倉(cāng)庫(kù)組織和管理數(shù)據(jù)的方法與普通數(shù)據(jù)庫(kù)不同。主要表現(xiàn)在三個(gè)方面:
(1)它依據(jù)決策要求,只從數(shù)據(jù)庫(kù)中抽取那些需要的數(shù)據(jù),并進(jìn)行預(yù)處理,使系統(tǒng)獲得特定的數(shù)據(jù)格式。
(2)數(shù)據(jù)倉(cāng)庫(kù)是多維的,即數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)的組織方式有多層的行和列。
(3)它支持決策處理,不同于普通的事務(wù)處理。
數(shù)據(jù)倉(cāng)庫(kù)需要以下數(shù)據(jù)庫(kù)技術(shù)的支持:
(1)并行/分布式數(shù)據(jù)庫(kù)技術(shù)。數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)量很大,一般要達(dá)到 GB 級(jí),有的甚至要到TB 級(jí)。對(duì)于處理如此大規(guī)模的數(shù)據(jù),使用并行/分布式技術(shù)對(duì)提高運(yùn)行效率是很有幫助的。
(2)高性能的數(shù)據(jù)庫(kù)服務(wù)器。傳統(tǒng)數(shù)據(jù)庫(kù)的應(yīng)用是操作型的,而數(shù)據(jù)倉(cāng)庫(kù)的應(yīng)用是分析型的,它需要有高性能的數(shù)據(jù)庫(kù)服務(wù)器配合工作,對(duì)DBMS核心的性能也有更高的要求。
(3)數(shù)據(jù)庫(kù)互操作技術(shù)。數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)來(lái)源多種多樣,可能來(lái)自數(shù)據(jù)庫(kù),也可能來(lái)自文件系統(tǒng)。即使都來(lái)自數(shù)據(jù)庫(kù),這些數(shù)據(jù)庫(kù)也往往是異構(gòu)的。為了從這些異構(gòu)數(shù)據(jù)源中定期抽取、轉(zhuǎn)換和集成所需要的數(shù)據(jù)存人庫(kù)中,異構(gòu)數(shù)據(jù)源之間的互操作技術(shù)是必需的。
數(shù)據(jù)倉(cāng)庫(kù)技術(shù)是近幾年發(fā)展起來(lái)的,很多企業(yè)都建立了數(shù)據(jù)倉(cāng)庫(kù)。但企業(yè)數(shù)據(jù)倉(cāng)庫(kù)的建設(shè)是以現(xiàn)有企業(yè)業(yè)務(wù)系統(tǒng)和大量業(yè)務(wù)數(shù)據(jù)的積累為基礎(chǔ)。數(shù)據(jù)倉(cāng)庫(kù)不是靜態(tài)的概念,只有把信息及時(shí)交給需要這些信息的使用者,供他們做出改善其業(yè)務(wù)經(jīng)營(yíng)的決策,信息才能發(fā)揮作用,信息才有意義。而把信息加以整理歸納和重組,并及時(shí)提供給相應(yīng)的管理決策人員,是數(shù)據(jù)倉(cāng)庫(kù)的根本任務(wù)。
【電子商務(wù)師考試內(nèi)容:數(shù)據(jù)倉(cāng)庫(kù)】相關(guān)文章:
電子商務(wù)師考試內(nèi)容10-16
電子商務(wù)師考試內(nèi)容:EDI的標(biāo)準(zhǔn)07-30
電子商務(wù)師考試內(nèi)容:電子商務(wù)全新的商務(wù)模式06-29
電子商務(wù)師考試內(nèi)容:計(jì)算機(jī)網(wǎng)絡(luò)08-22
電子商務(wù)師考試《電子商務(wù)師》知識(shí)點(diǎn)09-11
電子商務(wù)師試題08-24
電商改革:電子商務(wù)師到中國(guó)電子商務(wù)師10-21
對(duì)于電子商務(wù)師的了解07-18
電子商務(wù)師的培訓(xùn)心得08-23
電子商務(wù)師高級(jí)試題11-06