ما هي عيوب مواقع البيانات المفتوحة؟ وما السبيل إلى إصلاحها؟

تحتوي المواقع الحكومية على الإنترنت ومواقع البيانات المفتوحة تحديدًا الكثير من المعلومات المفيدة، لكن يصعب في أغلب الأحيان الوصول إليها أو الانتفاع منها بسبب سوء التنظيم والتصميم وغياب التوافق مع محركات البحث، ويعني ذلك أن مجرد نشر البيانات لا يكفي وحده لتحقيق أهداف البيانات المفتوحة، بل الأهم توفيرها في صور تسمح للجمهور العام بسهولة فهمها وتحليلها والاستفادة منها.

وكتب الأستاذ المساعد في فنون الإعلام والعلوم في “معهد ماساتشوستس للتكنولوجيا”، سيزار أيه. هيدالجو، مقالًا في مدونة مجلة “ساينتفيك أمريكان” العلمية، تناول فيه بعضًا من المشكلات التي تُعاني منها مواقع البيانات المفتوحة الحكومية وكيفية علاجها.

واستهل هيدالجو مقاله بمثالٍ لمتجر مركزي ضخم خزن السلع المختلفة في صناديق مُتماثلة الشكل تمامًا؛ فتحتوي بعض الصناديق على التفاح وأخرى على مواد للتنظيف وغيرها على الحبوب. وبطبيعة الحال فسيكون التسوق في مثل هذا المتجر مهمة بالغة الصعوبة والإزعاج. وقال هيدالجو أن تصميم أغلب مواقع البيانات المفتوحة، وعادةً ما تكون مواقع حكومية تُتيح بيانات التعداد ومعلومات اقتصادية وغيرها للاستخدام وإعادة النشر مجانًا، قريب الشبه إلى حدٍ كبير بطريقة تنظيم ذلك المتجر.

وخلال السنوات القليلة الماضية طورت الكثير من الحكومات في مختلف أنحاء العالم مواقع للبيانات المفتوحة منها الولايات المتحدة الأمريكية وفرنسا والمملكة المتحدة. ويُقدم أغلبها البيانات كمجموعة من الوصلات تقود إلى جداول أو وصلات إلى مواقع أخرى يصعب فهمها.

وفي أفضل الحالات تُقدِم البيانات من خلال “واجهة برمجة التطبيقات” API، وهي لغات بسيطة للاستفسار عن البيانات تتطلب معرفةً بأساسيات البرمجة. ولذلك فإن فهم ما يُوجد داخل كل مجموعة بيانات يتطلب تنزيلها وفتحها واكتشاف محتوياتها بطريقة تصعب على المستخدمين، وبالتالي فإن مقارنة مواقع البيانات المفتوحة بالمتجر الضخم ذي التنظيم السيء لا تُعد مبالغة أو مخالفة للواقع.

ويتفق المشاركون في تطوير مواقع البيانات المفتوحة على إخفاق الاتجاه الراهن والحاجة إلى توفير خيارات جديدة، وهو أمر لا يصعب إثباته، بل تكفي لتأكيده نظرة على مواقع البيانات المفتوحة التي يُعاني أغلبها تصميمًا سيئًا. ولا يتعلق التصميم السيء بالناحية الجمالية، وحتى من هذه الناحية تقل هذه المواقع عن المستوى المتوسط، وإنما يُقصد بالتصميم نموذج المفاهيم الذي تستخدمه المواقع في تنظيم البيانات وعرضها للمستخدمين، وتُركز أغلبها على إتاحة المزيد من البيانات دون أن تُولي اهتمامًا مُماثلًا بتحسين طريقتها في عرض البيانات.

وتُعد بعض عيوب التصميم في مواقع البيانات المفتوحة واضحة إلى حدٍ كبير، ومنها تواري مجموعات البيانات الأكثر أهمية أو تلك التي يُرجح أن تكون أكثر فائدةً عن واجهة الموقع وكذلك عدم تنظيمها على النحو الصحيح. وبالعودة إلى المُقارنة مع المتجر المركزي، ففيه لا تبدو الصناديق متشابهة تمامًا فقط، ولكن أيضًا تُخزن وفق ترتيب وصولها.

وهناك مشكلات أخرى مهمة يُواجهها تصميم مواقع البيانات المفتوحة وإن كانت أقل وضوحًا من سابقتها. وأولها تقديم معظم المواقع للبيانات وفقًا للطريقة التي تُجمع بها بدلًا من طريقة استخدامها. وفي أكثر الأحيان يبحث المستخدمون عن بيانات تتعلق بمكان معين أو صناعة أو تخصص وظيفي أو مُؤشر عام مثل الدخل وعدد السكان، وغالبًا ما يحتل مصدرها كالوكالة أو الوزارة التي تمتلكها مرتبةً ثانوية، بل قد تكون غير مهمة للمستخدم، وإن كان هذا ليس الوضع دائمًا.

وتتمثل مشكلة أخرى غير واضحة في تصميم مواقع البيانات المفتوحة، وقد تفوق غيرها أهمية، في أن أغلب المواقع تدفن البيانات في ما يُعرف باسم “الويب الخفي” أو “الويب العميق” Deep Web، وهو جزء من شبكة الإنترنت لا تصل إليه محركات البحث العادية، ولا يُمكن تصنيفه وفهرسته على النحو المناسب.

ويتكون الويب السطحي من نصوص وصور ومقاطع فيديو تُجيد محركات البحث فهرستها وتنظيمها وإرشاد الباحثين إليها. وفي المُقابل، تعجز محركات البحث عن معرفة أن الرقم الذي يبحث عنه المستخدم يُوجد في الصف رقم 17354 من ملف بصيغة “قيم مفصولة بفواصل” CSV، يقع ضمن ملف مضغوط يرتبط بصفحة تحمل وصفًا سيئًا داخل موقع للبيانات المفتوحة.

وفي بعض الحالات قد يقود النقر على زر الاختيار وتحديد عدة خيارات ضمن قائمة مُنسدلة إلى الحصول على الرقم أو المعلومة المطلوبة، لكن هذا لا يُساعد محركات البحث؛ إذ لا يُمكن لعناكب أو برامج البحث استكشاف القوائم المُنسدلة. وتتطلب الإتاحة الحقيقية للبيانات جعلها قابلة للبحث، وبالتالي توفيرها على سطح الويب بدلًا من أعماقه الخفية.

وربما لا يكون حل ذلك يسيرًا، لكن العلاج يبدأ بالتعامل الجدي مع مسألة تصميم المواقع. وقال هيدالجو أن ذلك ما قام به منذ أكثر من خمسة أعوام بإنشاء محركات التمثيل البصري للبيانات في “معهد ماساتشوستس للتكنولوجيا”، وجسد موقع “داتا يو إس أيه” DataUSA أحدث تمثيل لهذه المبادئ في التصميم.

ويعتمد هيدالجو تعريفًا بسيطًا للتصميم باعتباره اكتشاف الأشكال التي تُنجز الوظيفة المطلوبة على النحو الأفضل. وفي حال حققت الجمال فيُعد هذا إضافة، لكن عادةً ما يكون التصميم الجيد مُرضيًا من الناحية الجمالية؛ إذ أن الأشكال التي تفي بالمهام على النحو الأفضل إما أن تُعبر عن براعة البساطة أو غموض التعقيد. وفيما يتعلق بمواقع البيانات المفتوحة فالمطلوب هو توفير أدوات تجعل من البيانات مفهومة للبشر، وكذلك لمحركات البحث التي يستخدمها البشر في استكشاف الويب.

وكان الحل إنشاء مواقع تضم مجموعات بيانات متنوعة وتُحولها إلى قصص، ويُؤلف موقع “داتا يو إس أيه” بين مجموعات بيانات من “مسح المجتمع الأمريكي” و”مكتب إحصاءات العمل” و”مكتب التحليل الاقتصادي” ووزارة التعليم ومجموعات أخرى لإنشاء ملفات تجمع بين النصوص والرسوم البيانية الآنية حول كل ولاية ومقاطعة ومنطقة حضرية ومكان وصناعة وتخصص مهني وتخصص دراسي.

وتُساعد الرسوم البيانية والتمثيل البصري للبيانات في موقع “داتا يو إس أيه” المستخدين على فهم ما يُوجد داحل كل مجموعة بيانات، أو داخل كل صندوق بالعودة إلى مثال المتجر المركزي. وإذا ما أراد المستخدم الإطلاع على ما يُوجد داخل كل صندوق، يُمكنه تنزيل البيانات مُباشرةً أو الوصول إليها من خلال “واجهة برمجة التطبيقات”.

وفضلًا عن إمكانية قراءة المستخدمين للنصوص في موقع “داتا يو إس أيه”، يتطلع الموقع إلى محركات البحث، وجرت الاستعانة في كتابته بالخوارزميات للمساعدة في إبراز الأرقام الأساسية الأكثر أهمية في مجموعات البيانات على سطح الويب ومنها الحدود القصوى والدنيا والمتوسطات.

ويقود ذلك إلى التساؤل عن فرص نجاح هذا الأسلوب. وكتب هيدالجو أن التجربة تُظهِر نجاحه الواضح والجلي. ولفت إلى “مرصد التعقيدات الاقتصادية” The Observatory of Economic Complexity أو OEC، وهو موقع طورته مجموعة من الباحثين في “معهد ماساتشوستس للتكنولوجيا” ويتضمن بيانات عن التجارة الدولية، كانت دون الموقع ستُدفن في أعماق “الويب الخفي”.

وتستقبل النسخة 3.0 من “مرصد التعقيدات الاقتصادية” نصف مليون زائر شهريًا؛ نظرًا لتقديمه الإجابات الأولى عن أسئلة تتعلق مثلًا بأهم صادرات الأرجنتين والصادرات الصينية. ومن خلال التركيز على تحويل البيانات إلى قصص بدلًا من إخفاءها وراء القوائم المُنسدلة، ظهرت بيانات التجارة الدولية إلى سطح الويب، ويتوافق الموقع جيدًا مع محركات البحث وآلياتها.

ويسعى “داتا يو إس أيه 1.0” إلى أداء المهمة نفسها بالنسبة لبعضٍ من أهم مجموعات البيانات في الولايات المتحدة. ويُبرز الموقع بيانات متنوعة مثل تكاليف التعليم، والأجور، وبيانات حول رحلات التنقل، وانتشار الأمراض، والأصول اللغوية والثقافية لمواطني الولايات المتحدة والسكان من المولدين خارجها.

وبالرجوع مُجددًا إلى القياس مع تنظيم السلع في المتاجر، فإن موقع “داتا يو إس أيه” رتب مجموعة من الصناديق في ممرات وفقًا لموضوعها بحيث يحمل كل صندوق عنوانًا ومعلومات عن محتوياته. وكتب هيدالجو: “نأمل أن نجعل تجربة تسوق البيانات ممتعةً بدلًا من أن تكون مزعجة. ومن خلال القيام بذلك نزيد من سهولة استخدام صحفيي البيانات والمحللين والمعلمين والطلاب للبيانات العامة”. وعلاوةً على ذلك، أتاح “داتا يو إس أيه” إمكانية إدراج الرسوم البيانية، بما يسمح للجمهور ببناء قصصهم الخاصة سواءً أداروا مدونة شخصية أو صحيفة رئيسية.

واختتم هيدالجو مقاله بالقول: “بعد كل شيء، ينبغي ألا يقتصر هدف البيانات المفتوحة على إتاحة البيانات، ولكن تشجيع فهمنا للأنظمة التي تصفها هذه البيانات. ومن أجل بلوغ ذلك علينا التأكد ألا ننسى أن التصميم جزءٌ مما يلزم لتمهيد الأساسات غير العملية للويب العميق”.

مصدر الصورة