الإحصاء و علوم الحاسب: زواج المصالح المشتركة والمستقبل المشرق
تعاقب
على الإنسانية مجموعة من الثورات والتغيرات في نمط الحياة ، فقد إنتقلت من مجتمعات
الصيد إلى مجتمعات زراعية ، ومن ثم الإنتقال إلى الثورة الصناعية ، وبعدها
دخلت الإنسانية نمط التكنولوجيا من خلال الثورة المعلوماتية. حالياً نعيش ثورة
بيانات فريدة لم يسبق لها مثيل على مر التاريخ ، حتى أنه يقال أن ماتم جمعه في
عامي 2013 و 2014م من البيانات يفوق ماتم جمعه خلال التاريخ البشري كاملاً. هذا
الكم الهائل والضخم من البيانات توفر نتيجة التطور التقني المتمثل في إنتشار
الأنترنت في كافة المعمورة من خلال الشبكات اللاسلكية (WIFI)
من جهة ، وإنتشار الأجهزة الذكية (Smart Phones)
من جهة أخرى. تشير الدراسات أن 6% فقط من البيانات المتوفرة حالياً مصدرها الكتب ،
و 94% من البيانات رقمية تم جمعها من خلال التقنيات الحديثة ،90% منها جُمعت في الثلاث
سنوات الأخيرة. هذا الكم الكبير والهائل من البيانات أسال لعاب الإحصائيين ، والذين
فيما مضى كانوا يعانون من شح البيانات وتشتتها و صعوبة جمعها ، و كان جل إهتمامهم
ينصب على أختيار عينة ، والتأكد فيما إن كانت تلك العينة ممثلة للواقع.
كان
الظهور الأول لمصطلح "علم البيانات" في مؤتمر في اليابان عام 1996م ،
وكان هناك تشكيك من البعض بأنه مجرد أسم تجميلي للإحصاء ، ولكن مع مرور الأيام
وإنتشار الحواسيب الشخصية والأجهزة الذكية ، أصبحت البيانات تحاصرنا من كل مكان ،
وأصبح التعامل معها واقع نعيشه ، حتى أن البعض أصبح يطلق عليها النفط الجديد (The new
oil). في عام 2005م تم تسجيل مصطلح "علم
البيانات" رسمياً في المجلس الوطني للعلوم بأمريكا ، و في 2007م تأسس
مركز أبحاث الداتالوجي وعلم البيانات في الصين وأصدر ورقة علمية
تعرّف علم البيانات بأنه صنف جديد ومغاير عن العلوم الطبيعية والإجتماعية. في
نوفمبر 2014م نشر عالم البيانات فينسنت جرانفيل في موقع (www.datasciencecentral.com)
معدل نمو الاهتمام بعلم البيانات في الفترة من جولاي 2012 الى سبتمبر 2014 كما
توضح الصورة أدناه ، وكانت النتيجة نمو الإهتمام بمعدل 300٪.
يعرف
جوش ويلز عالم البيانات بأنه ذلك الشخص الذي يفهم في الإحصاء أكثر من متخصصي
الحاسب ، ويفهم في الحاسب أكثر من متخصصي الإحصاء ، هذا التعريف يدل ضمنياً بأن
هذا العلم متعدد ويجمع بين أكثر من مجال كما يؤكد ذلك فرانك لو ، في تعريفه لعلم
البيانات بأنه علم يجمع بين الرياضيات والتقنيات الكمية و الهندسة ، واستراتيجيات
العمل والمعرفة الجوهرية لأي موضوع تعمل عليه. ذلك التزاوج بين الإحصاء وعلوم
الحاسب الذي ذكره ويلز أنتج لنا ما يعرف اليوم بعلم البيانات (Data
Science) ، والذي يعني بكل مايرتبط بالبيانات ،
ابتداءً بجمعها وترتيبها ومروراً بتحليلها وإنتهاءً بإستخراج النتائج وتفسيرها
والتنبؤ بالمستقبل من خلالها. بينما ينصب إهتمام الحاسوبيين على معالجة البيانات
من خلال القدرات الهائلة للحواسيب في التخزين ، وتوفر حزمة أدوات وخوازميات لتعليم
الآلة (Machine Learning Algorithms) لتحليل البيانات ، قدم الإحصائيون خدمات جليلة من خلال إصلاح
البيانات و تفسيرها وتكريس كم هائل من النظريات الإحصائية لخدمة تحليل البيانات
وتفسير نتائجها.
يذكر برنارد مار في مقال له نشره في نهاية 2015م ، بأن
البيانات التي تم تحليلها وإستخدامها تمثل أقل من 0.5% من جميع البيانات المتوفرة
، مما يعني أن هناك مايقارب 99.5% من البيانات مهمل ، والتي ربما تحوي بين طياتها
الكثير من الذهب المخفي. أخيراً ، يرى جاك ما مؤسس متجر علي بابا الإلكتروني
الشهير بأن الثلاثين سنة القادمة ستشهد تغييرات كبيرة وأن أهم وظائف المستقبل
ستكون تلك الوظائف المتعلقة بالبيانات الضخمة وتحليلها.
Comments
Post a Comment