Sammendrag
Temaet for oppgaven har vært datavarehus eksemplifisert ved
implementasjon av en database og et datavarehus på denne i Oracle.
Oppgavens mål var å se på størrelse og responstider på databasen
versus datavarehuset; hvem tar størst plass, og hvem er det raskest og
spørre mot?
Kildefilene i oppgaven er fra Nasjonalbiblioteket og inneholder
informasjon om til sammen 51 517 artikler som ble gitt ut i årene 2000
til 2002.
Datavarehus er integrerte data fra flere kilder lagret i en
multidimensjonal modell. Hovedmålet med datavarehus er at det skal
være et verktøy til hjelp for beslutningsstøtte. Denne teknologien
skal hjelpe bedrifter til å ta raskere og bedre avgjørelser.
Teorien sier at datavarehus har større lagringsplass, mer
funksjonalitet og raskere responstider enn transaksjonsorienterte
databaser.
I implementeringseksempelet i denne oppgaven var det ikke spesielt
lønnsomt å implementere et datavarehus i tillegg til databasen. Her
tar spørringene uansett bare noen få millisekunder. Det er først når
forskjellen i responstid mellom databasene og datavarehuset blir noen
sekunder eller mer at man vil merke nytten av et datavarehus. Dessuten
er ikke datavarehuset betydelig raskere å spørre mot enn
databasen. Det skyldes først og fremst at databasen inneholder veldig
få nullverdier. I et tilfelle der databasen er mer komplisert og
inneholder flere nullverdier, ville det vært mer lønnsomt med et
datavarehus. Da ville forskjellen i responstidene vært betydelig
større. Databasen tar størst lagringsplass. Den er på 72,5 MB, mens
datavarehuset er på 42,6 MB. Indekser er hovedgrunnen til at de bruker
så stor plass.