قاعدة البيانات الموزعة DDBMS

abecfg

في السنوات الحديثة أضحت قواعد البيانات الموزعة مجالا هاما من مجالات معالجة المعلومات والتي يتوقع لها زيادة الأهمية بمعدلات سريعة في المستقبل. ويستبعد هذا النموذج كثير من المعوقات التي يمكن في نماذج قواعد البيانات التي سبق توضيحها وبذلك يمكن لنموذج قاعدة البيانات الموزعة من أن يتواءم مع التنظيمات المركزية لكثير من المنظمات المعاصرة. وتعرف قاعدة البيانات الموزعة بأنها: ((قاعدة بيانات متكاملة تبني على قمة شبكة كمبيوتر بدلا من كمبيوتر واحد، وتخزن البيانات التي تكون قاعدة البيانات في مواقع Sites مختلفة في شبكة الكمبيوتر. كما أن برامج التطبيق التي تشغل بواسطة أجهزة الكمبيوتر يمكنها الوصول إلى البيانات في مواقع مختلفة منها.

ماهي قاعدة البيانات الموزعة DDBMS : Distirbuted Database Mangment System

تُعرّف بأنها قاعدة البيانات التي لا تكون اجهزة التخزين فيها موصولة إلى وحدة معالجة مشتركة كـ وحدة المعالجة المركزية في الحاسب الآلي . قد تكون مخزنة في اجهزة متعددة وتتواجد في نفس المكان الطبيعي او قد تكون اختفت عبر شبكة من الأجهزة المتصلة . على عكس الأنظمة الموازية حيث تكون المعالجات مترابطة بشكل قوي و تمثل قاعدة بيانات وحيدة , قاعدة البيانات الموزعة تحتوي على عدة مواقع عمل متناثرة لا تتواجد في نفس المكان فعليا. مجموعة البيانات كمثال في قاعدة البيانات قد يتم توزيعها على عدة مواقع فعلية. قاعدة البيانات الموزعة قد تتواجد في خادم شبكة الإنترنت , إنترانت او اكسترانت مشتركة او في اي شبكة اخرى داخل الشركة. النسخ المكررة و الموزعة من قاعدة البيانات تساهم في تحسين أداء قاعدة البيانات بالنسبة للمستخدم النهائي. لضمان مواكبة قاعدة البيانات الموزعة للتحديثات يوجد هنالك عمليتين: التكرار (Replication)و الإستنساخ (Duplication). التكرار يضمن إستخدام برمجيات متخصصة في البحث عن التحديثات في قاعدة البيانات الموزعة. عندما يتم إيجاد تحديث او تغيير فإن إجراء التكرار تعمم التغيير على كل قواعد البيانات. إجراء التكرار قد يكون معقد جدا و يستهلك الكثير من الوقت بناء على حجم و عدد القواعد الموزعة. و قد تحتاج هذه العملية إلى الكثير من الوقت و المصادر الحاسوبية. الإستنساخ من جهة أخرى ليس بالأمر المعقد. الإستنساخ ببساطة يحدد قاعدة بيانات معينة و يعينها كنسخة أصلية و من ثم يقوم بإستنساخها. إجراء الأستنساخ عادة يتم بعد مرور وقت معين. هذا للتأكد من أن كل مكان موّزع يضم نفس البيانات . في هذا الإجراء, التغييرات مسموحة فقط في قاعدة البيانات الأصلية. وهذا لضمان عدم الكتابة على البيانات المحلية . إستخدام أي إجراء من هذين الإجرائين يضمن حداثة البيانات في كل المواقع التي وزعت فيها قواعد البيانات. إلى جانب تكرار و تجزئة (Fragmentation) قاعدة البيانات الموزعة فأنه يوجد هناك الكثير من تقنيات تصميم قواعد البيانات الموزعة المختلفة. على سبيل المثال, تقنيات قاعدة البيانات الموزعة في الحكم الذاتي و المزامنة و اللامزامنة . تطبيق هذه التقنيات يتوقف بدرجة أساسية على إحتياجات العمل و مدى حساسية المعلومات التي ستخزن في هذا النوع من قواعد البيانات و كذلك على الميزانية المخصصة لضمان سرية المعلومات و صحتها.

يستطيع مستخدم قاعدة البيانات الموزعة الوصول لها من خلال:
التطبيقات المحلية : التطبيقات التي لا تحتاج إلى بيانات من مواقع اخرى.
تطبيقات عامة: التطبيقات التي تحتاج إلى بيانات من مواقع أخرى. قاعدة البيانات الموزعة لا تتشارك في الذاكرة الرئيسية او القرص الصلب.

يمكننا تميز نوعين من قواعد البيانات الموزعة:
1. قواعد البيانات الموزعة المتجانسة Homogeneous: والتي يكون فيها قواعد البيانات ونظام إداراتها المتواجدة في جميع المواقع Sites متشابهة كأن تكون جميعها أكسس Access أو بارادوكس Paradox أو فوكس برو Fox Pro وما شابه من أنظمة قواعد البيانات التقليدية.
2. قواعد البيانات الموزعة المتغايرة Heterogeneous: والتي يكون فيها قواعد البيانات ونظام إداراتها مختلف عن بعضها البعض، كأن تكون في بعض المواقع أكسس Access وفي بعضها الأخر بارادوكس Paradox وفي مواقع آخرى فوكس برو Fox Pro وهكذا.
في بعض الأحيان يعتبر الإختلاف في نسخة الإصدار Version لنظام إدارة قاعدة البيانات المتواجدة في المواقع (مع وجود نفس النوع من قواعد البيانات في هذه المواقع) سبباً كافياً لأعتبار أن قاعدة البيانات الموزعة متغايرة. تزداد صعوبة إدارة قاعدة البيانات الموزعة مع إزدياد درجة التغاير كوجود أكثر من نوع من قواعد البيانات ووجود أكثر من نسخة من نظام إدارة قواعد البيانات في هذه المواقع، وتكمن الصعوبة في الجزئية الخاصة بمعالجة وتنفيذ العمليات Transactions والتي تقتضي إلى تجزيء العملية الواحدة لمجموعة من العمليات المصغرة وتنفيذها على قواعد البيانات المختلفة وذلك لجلب أجزاء البيانات المخزنة فيها ودمجها وتقديمها للمستخدم كبيانات متكاملة Integrated Data وهذا ما يجسد مبدأ شفافية البيانات Data Transparency.
يبين الشكل (1) مخطط توضيحي لقاعدة بيانات موزعة حيث نلاحظ أن كل موقع يمتلك قاعدة بيانات مستقلة، في حين ترتبط هذه المواقع عبر شبكة ربط، يمكن أن تكون هذه الشبكة عبارة عن شبكة محلية( Local Area Network LAN) أو شبكة موسعة( Wide Area Network WAN).
fg
بينما يبين الشكل (2) بنية قاعدة البيانات الموزعة ولكن من وجهة نظر المستخدم، نلاحظ من هذا الشكل أن المستخدم العادي لا يمكنه رؤية الأماكن الحقيقي لتواجد البيانات الموزعة على المواقع المكونة للشبكة، في حين أنه يراها قاعدة بيانات واحدة ويمكنه التعامل معها مباشرة دون معرفة التوزيع الفيزيائي لها (مبدأ شفافية البيانات Transparency Data).
q

يمكننا تلخيص وذكر أهم المكونات الواجب تواجدها في قواعد البيانات الموزعة بالمكونات التالية:

  • معالج الاستعلامات الموزعة Distributed Query Processing
  • إدارة عمليات Transaction الموزعة Distributed Transaction Management.
  • إدارة نظام الأمن الموزع Distributed Security Management.
  • إدارة النسخ المماثلة الموزعة Distributed Replication Management.
  • إدارة الدليل الموزع Distributed Directory Management.
  • إدارة عمليات استرجاع قاعدة البيانات الموزعة Distributed Database Recovery Management

مميزات قواعد البيانات الموزعة :

  • اذا تعطلت إحدى المواقع الموجودة على الشبكة فلن تتعطل القواعد الموجودة على المواقع الاخرى .
  • التحديث يتم آلياً و آنياً لكل القواعد الموجودة في كل المواقع .
  • لا توجد قاعدة بيانات مركزية وإنما قاعدة بيانات مجزأة على كل المواقع .
  • إدارة البيانات الموزعة بمستويات مختلفة من الشفافية مثل شفافية الشبكة وشفافية التجزئة وشفافية النسخ المتماثل، الخ.
  • زيادة الموثوقية والتوافر.
  • قابلية التوسع بسهولة .
  • تعكس بناء المنظمة – اجزاء قاعدة البيانات توجد في أقسام المؤسسة المعنية بها.
  • الإستقلالية المحلية او إستقلالية الموقع- كل قسم يستطيع التحكم في البيانات المتعلقة به.
  • حماية البيانات القيّمة: في حال حدوث كارثة ما كالحريق مثلا فإن البيانات لا توجد في مكان واحد فقط بل موزعة على مواقع مختلفة.

عيوب قواعد البيانات الموزعة :

    المساوئ الرئيسية لأنظمة قواعد البيانات الموزعة هي التعقيد المضاف والضروري لضمان التنسيق الملائم للمواقع, هذا التعقيد يأخذ الأشكال الآتية:

  • كلفة تطوير البرمجيات.
  • امكانية أكبر للأخطاء
  • زيادة جهد المعالجة (زيادة الجهد في معالجة الاستفسارات والمعاملات).
  • الاسترداد من الفشل هو أكثر تعقيداً مما موجود في الأنظمة المركزية.
  • يعتمد أداء قاعدة البيانات بشكل كبير على أداء الشبكة.
  • السيطرة على سلامة البيانات أكثر صعوبة.