كيف تُغير البيانات الضخمة وتحليلها طريقة فهم المدن؟

يكاد لا ينقطع الحديث عن العلاقة بين المدن والبيانات ولاسيما ما يُطلق عليها البيانات الضخمة. وتُؤمن الكثير من شركات التكنولوجيا والمدن وعددٌ مُتزايد من خبراء التخطيط الحضري بصدق وعود البيانات في حل مُختلف المشكلات الحضرية من خلال مجالات مثل الشرطة التنبؤية وتحسين حركة المرور وتعزيز كفاءة استهلاك الطاقة.

ويتمثل أكبر الأدوار المُحتملة للأنواع الجديدة من البيانات في مُساعدة الباحثين وصُناع السياسات على تحسين فهمهم لكيفية نمو المدن والأحياء السكنية وتطورها، لكن فقط حال تنفيذ ذلك بالطريقة الصحيحة.

استخدامات مثُيرة للاهتمام للبيانات الجديدة

يتزايد إقبال الباحثين على الاستعانة بالبيانات من مصادر الإنترنت مثل “جوجل” و”تويتر” و”يلب”؛ بهدف التوصل إلى رؤى جديدة للمدن والتغير الحضري. واستخدم عالما الاجتماع روبرت سامبسون وجاكلين هوانج صورًا من خدمة “جوجل ستريت فيو” لبحث دور العرق في تحول الأحياء السكنية وعملية الاستطباق Gentrification أو احتلال الطبقات الأغنى مناطق سكنية تخص الطبقات الأقل دخلًا.

وبالمثل، استخدمت دراسة أجراها “مركز أبحاث الاقتصاد المكاني” في المملكة المتحدة الصور المصحوبة بوسوم للمواقع الجغرافية في موقع “فليكر” من أجل تحديد المستويات الحضرية في مدينتيّ لندن وبرلين. واستعانت الكثير من الدراسات الحديثة ببيانات التنقل من خدمات مثل “أوبر” و”ليفت”، كما تُستخدم بيانات من مواقع العقارات مثل “زيلو” Zillow و”تروليا” Trulia لتحليل اتجاهات أسعار المساكن في الأحياء السكنية والمدن والمناطق الحضرية.

واستفادت دراسات أخرى من مراجعات الأماكن في موقع “يلب” لدراسة عملية الاستطباق والأنماط غير المُتكافئة للاستهلاك الحضري. واعتمدت إحدى الدراسات على مُراجعات “يلب” لتسليط الضوء على العلاقة بين الطبقات والعرق في منطقة بروكلين في مدينة نيويورك. ووظفت دراسة أخرى أجرتها منظمة “المكتب القومي للأبحاث الاقتصادية” الأمريكية غير الربحية بيانات “يلب” في التعرف على تأثير الفصل الإثني والعرقي على مستويات الاستهلاك في مدينة نيويورك.

كما اسُتخدمت بيانات “تويتر” في عرض التفضيلات الإقليمية وأنماط السلوك. واعتمدت عليها دراسة أجراها “معهد أوكسفورد للإنترنت” لرسم مسار تدفق المحتوى والأفكار عبر الإنترنت عبر الثقافات المختلفة. وتستخدم مُدونة “فلوتينج شيب” Floating Sheep للخرائط بيانات من “تويتر” و”جوجل” و”ويكيبيديا” لرسم خرائط متنوعة تتناول انتشار البيتزا والبولينج والحشائش.

ومن بين أحدث المحاولات في هذا الشأن دراسة لفريق من الباحثين الإيطاليين جمعوا فيها بيانات من “فورسكوير” و”أوبن ستريت ماب” ومصادر أخرى لاختبار صحة أفكار عالمة الاجتماع الحضري الأمريكية الكندية جاين جاكوبز حول أسباب ازدهار المناطق الحضرية وتراجعها في ست مدن إيطالية، ومنذ ستينيات القرن العشرين حظيت أفكار جاكوبز بشعبية واسعة لكنها افتقرت إلى أدلة تجريبية تُؤيدها.

وأكدت الدراسة صحة الكثير من نظريات جاكوبز حول أهمية إنشاء أحياء صغيرة، وتوفير أغراض مختلفة للمنطقة الواحدة لجذب السكان في أوقات مختلفة من اليوم، وتيسير المشي لزيادة التفاعل بين السكان، والكثافة العالية للعمال المهرة، وتوفير المساحات الحضرية العامة.

وبالإضافة إلى البيانات الواردة من مواقع الإنترنت، تسمح بيانات الأقمار الاصطناعية بإمكانية جمع بيانات منهجية وقابلة للمُقارنة في المدن العالمية. واستخدمت دراسات عدة بيانات الأقمار الاصطناعية في فهم الناتج الاقتصادي للمدن والمناطق الحضرية في مختلف أنحاء العالم.

وفي عام 2012 اعتمدت دراسة لمجلة “أمريكان إيكونوميك ريفيو” على انبعاثات الأضواء في صور الأقمار الاصطناعية كأدلة على التنظيم المكاني والحجم الاقتصادي للمدن العالمية. وعلى الرغم من خضوع البيانات لقيود كبيرة، فإنها تُوفر على الأقل تقديرات تقريبية للحجم الإجمالي والنطاق الاقتصادي للمدن حول العالم.

تعريف دقيق للبيانات الضخمة

لا تصلح البيانات الضخمة لوصف جميع البيانات المُستقاة من المصادر الجديدة، ويُشير اسم البيانات الضخمة ضمنًا إلى كميات هائلة من المعلومات. ويُقسم ماكس ناثان، من “كلية لندن للاقتصاد”، البيانات الضخمة الحقيقية إلى ثلاث فئات أساسية تشمل: بيانات الإنترنت من مواقع مثل “تويتر” و”جوجل” و”يلب” والبيانات التجارية الأخرى، والبيانات الواردة من الحكومة وتجمعها المدن والبلدات، وأخيرًا التعداد والبيانات ذات الصلة.

وتُعد دراسة “نيستا” NESTA أو “المؤسسة الوطنية للعلوم والتكنولوجيا والفنون” غير الهادفة للربح في عام 2014 مثالًا مُناسبًا، واعتمدت على بيانات من شركة “جروث إنتيليجنس” Growth Intelligence البريطانية للبرمجيات المُوجهة للأعمال، واستهدفت رسم خريطة لأنماط شركات المعلومات والتكنولوجيا في المملكة المتحدة.

ومن بين الأمثلة الأخرى دراسة حديثة حللت بيانات ملايين من طلبات الخدمات عبر الرقم الهاتفي 311 في الولايات المتحدة، وتبحث في نزاعات السكان من الأعراق والإثنيات المُختلفة في المناطق السكنية.

ووفقًا لناثان، يُمكن تحديد البيانات الضخمة من خلال أربع كلمات تبدأ جميعها بحرف “في” V هي: التنوع، والحجم الذي يُقدر بملايين ومليارات الملاحظات، والسرعة عبر بيانات الوقت الحقيقي، والصدق عبر البيانات الخام الأولية.

وفي كثيرٍ من الأحيان تحتاج البيانات الضخمة الفعلية إلى أساليب تحليل البيانات مثل تعلم الآلة من أجل مُعالجتها واستخلاص المعاني من هذا القدر الضخم من المعلومات. ومثلًا يستخدم مشروع Livehoods Project الذي تُنفذه حاليًا كلية علوم الحاسب في “جامعة كارنيجي ميلون” تقنية تعلم الآلة لتحليل ثمانية عشر مليون تسجيل للوجود في الأماكن من موقع “فورسكوير”، ويسعى المشروع إلى تحديد نسيج ثماني مدن مختلف وسماتها.

وفي حال اسُتخدمت البيانات الضخمة على النحو المُناسب يُمكنها مُساعدة الباحثين في إدراك البُنى الحضرية والأنماط التي قد لا تكشفها البيانات والأساليب التقليدية من تلقاء نفسها. وتُقدم دراسة حديثة نموذجًا جيدًا على استخدام البيانات الضخمة، وأجراها باحثون من جامعة هارفارد” و”معهد ماساتشوستس للتكنولوجيا” لصالح “المكتب القومي للأبحاث الاقتصادية”.

واستخدمت الدراسة الرؤية الحاسوبية من أجل فهم الفوراق الجغرافية في الدخل وأسعار المساكن. وعلى الرغم من تناول الدراسة لأفكارٍ متنوعة، إلا أن أكثر أجزائها إثارةً للاهتمام قد يكون استخدامها “جوجل ستريت فيو” في التنبؤ بمستويات الدخل وأسعار المساكن في مدينتيّ نيويورك وبوسطن بين عاميّ 2007 و2014.

وربطت الدراسة 12200 صورة لمدينة نيويورك وأكثر من 3600 صورة لبوسطن مع بيانات “مسح المجتمع الأمريكي” لمتوسط دخول الأسر وقيمة المنازل بين عاميّ 2006 و2011. وفحصت الدراسة تاليًا إلى أي مدى تجتذب السمات المادية الإيجابية التي تُظهِرها الصور مثل الحجم والمساحات الخضراء السكان الأكثر ثراءً وتُنبئ بمستوى الدخل وأسعار المساكن.

وخلصت الدراسة إلى أن “بمقدور الصور التنبؤ بالدخل على مستوى مجموعة المساكن وبجودة أفضل كثيرًا من العرق والتعليم. وذكرت الدراسة أن أحد الأغراض الرئيسية للبيانات الضخمة يتمثل في تيسير فهم دور المناطق الجغرافية الأصغر في الاقتصادات الحضرية التي يصعب اكتشافها من خلال بيانات التعداد التقليدي. ورأى الباحثون أن البيانات الضخمة تُعطي بعض الأمل في أن “جوجل ستريت فيو” والتنبؤات المُشابهة ستسمح بفهمٍ أفضل لأنماط الغنى والفقر حول العالم.

قيود استخدام البيانات الضخمة في دراسة المدن

بينما قد يسمح استخدام البيانات الضخمة بتطوير مُلاحظة ما يجري في المدن والنظريات عن تطورها، يحث عددٌ مُتزايد من الباحثين على توخي الحذر في توظيفها. ونظم “معهد رادكليف للدراسات المتقدمة” في “جامعة هارفارد” ورشة عمل حول ثورة البيانات الضخمة والنظرية الحضرية، وشارك فيها أربعون من أبرز علماء الاجتماع الحضري ومستخدمي البيانات.

وحدد النقاش ستة مشكلات رئيسية تتعلق بالبيانات الضخمة ومنها نوعية البيانات ومُلاءمتها، واستخدام الأساليب الجديدة في التحليل، ومسائل ترتبط بالخصوصية والأمن. وبحسب ما تضمن مُلخص ورشة العمل: “يُعد تطوير نظرية تتوافق مع الطرق والبيانات الجديدة أمرًا بالغ الأهمية، وغالبًا ما يتم تهميشه. تمضي الهندسة ونظرية التحكم (أي البيانات الضخمة دون نظرية) على نحوٍ جيد عند وجود نتائج يُمكن قياسها أي سياسة بسيطة لتصويبها، وتوافر وقت لرد الفعل السريع يكفي لتنفيذ هذا التصويب في الوقت المُناسب. في المدن تُستخدم هذه العملية لتحسين تقديم الخدمات، لكن هذه النظرية لا تتناسب مع النظم المُعقدة التي تتضمن آجالًا زمنية طويلة كما هو الحال مع مُعظم النظم الاجتماعية”.

وبعبارة أخرى، تكون البيانات الضخمة وتحليلات البيانات الجديدة جيدة فقط بمقدار الأسئلة المطروحة والنظريات المُقدمة لفهمها على نحوٍ أفضل. وبصرف النظر عما قد تبدو عليه من قوة، فإن مصادر البيانات الجديدة وأساليب التحليل لا تُعد بديلًا حقيقيًا للمنطق البشري الدقيق حيال المدن. وتكمن القوة الحقيقية لهذا النهج في استخدام الإجابات الجديدة في اختبار رؤى النظرية الحضرية وتعميقها، على أمل أن تُسهِم في نهاية المطاف في تعميق فهم “الجينوم الحضري” المضمر في الأحياء السكنية والمدن والمناطق الحضرية.

المصدر

مصدر الصورة