ประเด็นที่ต้องพิจารณา ของ คลังข้อมูล

  • ในการรวมฐานข้อมูล อาจมีปัญหาว่าฐานข้อมูลแต่ละอัน อาจถูกออกแบบจากผู้ออกแบบหลายๆ คนทำให้มี schema แตกต่างกันไป (schema ในที่นี้หมายถึงการออกแบบ REA model ว่าจะมีกี่ตาราง แต่ละตารางเชื่อมกันอย่างไร มีอะไรเป็น primary key, foreign key เป็นต้น) ปัญหาใหญ่ก็คือจะนำฐานข้อมูลที่มีความแตกต่างกันมารวมกันได้อย่างไร
  • เมื่อรวมกันแล้วต้องการให้ schema ของคลังข้อมูลมีลักษณะแบบไหน. การออกแบบคลังข้อมูลโดยทั่วไป มักจะออกแบบตรงข้ามกับฐานข้อมูลอย่างสิ้นเชิง
    • การออกแบบฐานข้อมูลเรามักต้องการให้มี schema ที่ปรับปรุงได้ง่ายๆ (เพราะเราต้องประมวลผลบ่อย) คือในแต่ละตารางมี primary key น้อยๆ และมีตารางจำนวนมากเชื่อมต่อกัน นั่นคือใน REA model มักจะมีหลาย ๆ ตาราง
    • ในคลังข้อมูลเราต้องการให้เรียกข้อมูลที่ต้องการดู (query) ง่ายๆ และรวดเร็ว นอกจากนั้นเราไม่ค่อยได้แก้ไขปรับปรุงคลังข้อมูล จึงมักออกแบบให้มีตารางน้อยๆ schema ที่นิยมใช้ในคลังข้อมูลคือ star schema (ดู Fig. 15-7)