البيانات الضخمة Big Data<br />نال مصطلح البيانات الضخمة Big Data ترحيب كبير على مستوى المؤسسات و المنظمات و الشركات والدول. فقد اطل علينا هذا المصطلح اطلالة مثيرة و ساحرة كونه يمثل تحدي معرفي يجعلنا ننظر بدهشة الى نتائج تحليل تلك البيانات. والسؤال المطروح و الذي يشغل بال المختصيين هو: هل تستطيع البيانات الضخمة ان تنتج لنا نظريات جديدة أو تنقض نظريات أساسية موجودة تغير من فهمنا لعالمنا ؟<br /> <br />تقوم العديد من المؤسسات اليوم بجمع وتخزين وتحليل كميات هائلة من البيانات. يشار إلى هذه البيانات عادة باسم "البيانات الضخمة" بسبب حجمها والسرعة التي تصل بها و الاشكال المتنوعة التي تأخذها. فقد خلقت البيانات الضخمة جيلاً جديداً من ادارة البيانات التي تدعم اتخاذ القرار.<br />تشير البيانات الضخمة إلى المجموعات الكبيرة والمتنوعة من المعلومات التي تنمو بمعدلات متزايدة. ويشمل حجم المعلومات والسرعة التي يتم بها إنشاء وجمع هذه المعلومات، وتنوع اشكال البيانات التي تتم تغطيتها. حيث أن البيانات الكبيرة غالباً ما تأتي من مصادر متعددة وتصل بتنسيقات متعددة. <br /><br />الثلاثة (V) والتي تمثل الحجم Volume والسرعة Velocity والتنوع Variety و الموضحة في أدناه تمثل الابعاد الثلاثة للبيانات الضخمة. <br />تمثل الـ (V) الاولى الحجم و الذي يشير الى البيانات ذات الاحجام الكبيرة و التي تتراوح احجامها بين التيرابايت Terabyte الى الزيتابايت zettabyte. فيما تشير الـ (V) الثانية الى السرعة مما يعني تدفق البيانات بسرعة كبيرة و في وقت قصير. هذا بالاضافة الى ان هذه البيانات لها القدرة على تحديث نفسها بشكل تلقائي مما يتطلب ان تكون المعالجة في الوقت الحقيقي الـ real time . و اخيرا فان الـ (V) الثالثة تعني التنوع مما يعطي انطباع ان البيانات تاتي من مصادر متنوعةكما ان البيانات يمكن ان تكون من مصدرداخلي أوخارجي. لابد من الاشارة هنا الى ان البيانات يمكن أن تأتي بتنسيقات متعددة مثل بيانات تسجيل الدخول للمستخدمين و التي يتم تسجيلها من تطبيقات مختلفة ، والبيانات المهيكلة مثل جدول قاعدة البيانات ، والبيانات شبه المهيكلة مثل بيانات XML ، والبيانات غير المهيكلة مثل النصوص والصور ، الفيديو ، الصوت ، الخ.. <br />في ظل ظهور مصطلح البيانات الضخمة فان المؤسسات تستقبل بيانات إضافية من بيئتها التشغيلية بسرعة متزايدة و بكميات كبيرة و باشكال متنوعة. و من امثلة هذه البيانات:<br /><br />• بيانات الويب Web data. مثل عرض صفحات الويب وعمليات البحث وقراءة المراجعات والشراء عبر الانترنيت الخ..<br />• البيانات النصية مثل البريد الإلكتروني والأخبار و المستندات وما إلى ذلك.<br />• الوقت والموقع مثل الـ GPS والهاتف المحمول وكذلك اتصال Wi-Fi و هذا مما يجعل معلومات الوقت والموقع مصدرًا متناميًا للبيانات.<br />• الشبكة الذكية وبيانات الاستشعار.<br />• بيانات الشبكة الاجتماعية. ضمن مواقع الشبكات الاجتماعية مثل Facebook و Instagram ، حيث من الممكن إجراء تحليل الارتباطات للكشف عن شبكة مستخدم معين.<br /><br />يعطي الرسم أدناه تحليلًا بسيطًا لكيفية تنظيم عملية اتخاذ القرار و استخلاص الحل الامثل للزبون. الصندوق الأحمر يمثل الحل نفسه و توجد على الجانب الأيسر ، مصادر البيانات المختلفة التي تغذي النظام. يتم بعد ذلك معالجة وتحليل البيانات بوقت قريب جداً من الزمن الحقيقي. <br />و أخيرًا ، تقدم البيانات للزبائن في بشكل مفيد ويمكن فهمه بسهولة.<br />تشير الاعتبارات المستقبلية للبيانات الضخمة إلى تحليل البيانات و اتخاذ القرار في الوقت الحقيقي real time ، والاستفادة الكاملة من تنوع مصادر البيانات والتفكير فيها بطرق جديدة. <br /><br />