PENGERTIAN DATAWAREHOUSE
Nama :
1. Fairuz
Rahman
(1501153721)
2. Arvin
Tobias
(1501150625)
3. Kevin
Samantha
(1501155802)
4. Charles
(1501149232)
datawarehouse adalah suatu sistem komputer untuk mengarsipkan dan menganalisis data historis suatu organisasi seperti data penjualan, gaji, dan informasi lain dari operasi harian. Pada
umumnya suatu organisasi menyalin informasi dari sistem operasionalnya (seperti
penjualan dan SDM) ke gudang data menurut jadwal teratur, misalnya setiap malam
atau setiap akhir minggu. Setelah itu, manajemen dapat melakukan kueri kompleks dan analisis (contohnya penambangan
data, data mining) terhadap informasi tersebut tanpa membebani sistem yang
operasional.
Datawarehose sering di integrasikan
dengan berbagai system apliskasi untuk mendukung laporan dan analisa data
dengan menyediakan history data yang menyediakan infrastruktur bagi DSS dan EIS
Data warehouse bukan merupakan
basis data operasional, melainkan basis data yang berisi data dalam
dimensi waktu tertentu yang sangat berguna untuk keperluan evaluasi,
analisis dan perencanaan yang dilakukan oleh pihak manajemen dalam sebuah
perusahaan. Meskipun demikian, belum banyak perusahaan yang mengembangkan
dan menerapkan data warehouse serta memanfaatkannya guna menunjang berbagai
hal penting didalam organisasi atau institusi.
Perencanaan
arsitektur pada pengembangan data warehouse ini meliputi arsitektur logical
dan arsitektur fisik.
Arsitektur
logical berupa rancangan tahapan alur data dari sumber
data sampai menjadi data pada data warehouse, sedangkan arsitektur fisik berupa gambaran konfigurasi
teknis dari data warehouse tersebut.
KOMPONEN
DATAWAREHOUSE
Data
Source
Untuk
membangun suatu datawarehouse yang baik data yang didapatkan harus teralokasi
dengan baik. Ini melibatkan OLTP saat ini dimana informasi ‘dari hari ke hari’
tentang bisnis yang berjalan, tentunya dengan data historis periode sebelumnya,
yang mungkin telah dikumpulkan dalam beberapa bentuk sistem lain. Sering kali
data yang terbentuk bukan terbentuk database relasional, sehingga membutuhkan
banyak upaya untuk mengambil data yang diinginkan.
Design
Datawarehouse
Proses
perancangan datawarehouse sangat berhati-hati untuk memilih jenis query yang
digunakan dalam datawarehouse. Tahapan ini sangat memerlukan pemahaman yang
baik tentang skema database yang ingin dibuat, dan haruslah selalu aktif untuk
berkomunikasi dengan pengguna. Desain adalah proses yang tidak dilakukan satu
kali, melainkan berulang-ulang agar model yang dimiliki stabil. Tahap ini harus
dilakukan secara berhati-hati karena model akan diisi dengan data yang
jumlahnya sangat banyak, yang salah satunya dari beberapa model adalah model
yang tak dapat diubah.
Akuisi
data
Proses
perpindahan data dari sumbernya (source) ke datawarehouse. Proses ini proses
yang menggunakan banyak waktu dalam proyek datawarehouse, dan dilakukan dengan
software yang dikenal dengan ETL (extract,transform,load) Tools. Sekarang sudah
hamper lebih kurang 60 tool yang tersebar diranah maya. Waktu yang dibutuhkan
untuk akuisisi data bisa mencapai berbulan-bulan bahkan bertahun-tahun.
Perubahan
data tangkapan
Pembaharuan
data periodik datawarehouse dari sistem transaksi menjadi rumit karena harus
diidentifikasi dari sumber data yang selalu up to date. Ini disebut dengan ‘perubahan
data capture’. Ini merupakan tahapan khusus, dan sudah cukup banyak
software yang beredar untuk mengatasinya. Seperti Replication Server,
Publish/Subscribe, Triggers and Stored Procedures, dan Database log Analysis.
Pembersihan
Data
Ini
biasanya dilakukan dengan akuisisi data, kalau dalam ETL ini terdapat pada
bagian ‘T’. Datawarehouse yang berisi data tidak benar tidak hanya tak berguna,
tapi juga menyesatkan. Ide dibalik pembuatan datawarehouse adalah untuk
memudahkan pengambilan keputusan, jika keputusan yang besar yang ditunjang oleh
data yang tidak valid maka perusahaan mengalami resiko yang amat besar pula.
Pembersihan
data suatu proses rumit yang memvalidasi dan bila perlu mengoreksi data sebelum
masuk kedalam datawarehouse. Pembersihan data dapat juga disebut sebagai “data
scrubbing” atau“penjamin kualitas data”, proses ini harus dilakukan
secara berhati-hati dan dilakukan keseluruhan terutama datawarehouse yang
diambil dari perangkat yang sudah tua.
Data
Aggregation
Termasuk
proses tansformasi, datawarehouse dirancang untuk menyimpanan yang amat detil dari
tiap transaksi, untuk beberapa tingkat aggregate(ringkasan).
Keuntungan jika data diringkas yaitu query khusus dalam datawarehouse berjalan
lebih cepat. Kekurangannya adalah informasi yang didapat kurang, karena
ringkasnya data yang ada pada datawarehouse. Ini harus berhati-hati karena
keputusan tidak dapat dibatalkan tanpa membangun kembali datawarehouse dan
mencocokan dengan datawarehouse lain (atau sumber data lain). Paling aman
digunakan oleh perusahaan yang amat besar, yang mampu membangun datawarehouse
tingkat detail yang tinggi dengan biaya yang besar pula.
3
Model Datawarehouse
Enterprise
Datawarehouse
Semua
informasi yang dikumpulkan berupa subjek, yang mencakup seluruh organisasi
perusahaan.
Data
Mart
Sebagian
data dari bagian perusahaan yang mempunyai nilai bagi pengguna. Ruang
lingkupnya lebih spesifik, seperti data Penjualan atau marketing saja.
Virtual
Warehouse
Memantau
melalui data operasional pada database. Suatu ringkasan dari data yang
fleksibel, mengurangi biaya untuk pengguna yang membutuhkan. Karena tersedianya
data yang siap disajikan tidak hanya untuk beberapa pengguna didalam
perusahaan, akan tetapi perusahaan lain yang membutuhkan data tersebut dapat
mudah untuk memperolehnya.
Keuntungan
Datawarehouse
Datawarehouse
menyediakan model data yang bervariasi, dan tidak bergantung pada satu sumber
data saja. Hal ini memudahkan pimpinan perusahaan/manager membuat laporan dan
menganalisa.
Saat
me-load data ke dalam datawarehouse, data yang tidak konsisten akan diketahui
dan secepatnya dirubah. Mendukung proses pembuatan laporan, agar keputusan yang
diambil adalah keputusan yang benar sesuai data.
Keamanan
informasi didalam datawarehouse terjamin, karena datawarehouse selalu digunakan
dan dimonitor oleh pengguna datawarehouse tersebut.
Dalam
membuat laporan tidak membuat proses transaksi yang ada menjadi lambat, karena
datawarehouse terpisah dengan database operasional.
Datawarehouse
menyediakan berbagai macam bentuk laporan yang terbaru.
Kerugian
Datawarehouse
Datawarehouse
tidak cocok untuk data yang tidak struktur.
Data
perlu di extract, diubah, dan di load ke datawarehouse, sehingga membutuhkan
waktu (delay) kerja untuk datawarehouse yang belum terbentuk.
Semakin
lama masa hidup bisnis yang menggunakan datawarehouse, maka semakin banyak
biaya yang dikeluarkan oleh perusahaan untuk memodifikasi teknologi
datawarehouse atau perawatan berjalan datawarehouse.
Jika
data yang diambil lambat, maka data yang dimiliki di datawarehouse tidak
berkulitas/ sehingga laporan tidak optimal.
No comments:
Post a Comment