|
Akhirnya..... penting neh buat reference ...aaarrgghhhh....
----- Original Message ----- From: djoni
yang pas. 1. Kalau yang dimaksud adalah notasi data model dalam bentuk diagram,maka kotak (notasi untuk table) berisi daftar nama column (didalam relational database, yang benar adalah column, tidak ada field) yang terhubung satu dengan yang lain dengan garis biasa (diujungnya tidak ada simbol apapun, misalnya crowsfoot) adalah "notasi khas" untuk dimensional data warehouse. Alasannya, khususnya untuk star, hanya ada satu macam hubungan, yaitu antara dimension dengan fact-nya yang selalu one-to-many, maka cukup garis saja. Untuk snowflake, tergantung jenisnya, tetapi hampir selalu juga one-to-many dari outer ke inner dimension (outer adalah yang jauh dari fact table). Kalau bikin diagramnya pakai data modeling tool, maka gunakan saja one-to-many relationship. IMHO, cukup diatas kerta, atau paling-paling Visio, daripada beli/belajar tool, karena dimensional data model sangat sederhana. Di bisnis cukup besar, setingkat Telkom misalnya, jumlah dimension table max 20 - 25. Kalau lebih dari itu, modelnya kemungkinan ada kesalahan. Fact table biasanya lebih sedikit. Dan, sekali lagi, relationship hanya ada satu macam, tidak seperti ERD (normalized data model) yang hampir selalu seperti benang ruwet atau sarang laba-laba tau bakmi italia. 2. Kalau yang dimaksud adalah denormalisasi dari data source ke dimensional data warehouse, maka jawabannya: tidak (belum) ada standard. Source to target matrix, yang akan saya postingkan contohnya merupakan salah satu cara (dikantor saya pakai MS Excel sheet untuk mendokumentasikannya) untuk mendefinisikan data flow termasuk transformasi yang terjadi dalam perjalanan data dari sumber hingga masuk ke data warehouse. Denormalisasi adalah salah satu jenis transformasi. Kalau sedang punya kasus, bisa kita pakai untuk contoh. Saya tunggu. djoni |
| Leave a Comment: |