هل تنجح الخوارزميات في كتابة الخطابات السياسية؟

غالبًا ما تكون الخطابات السياسية المُميزة التاريخية قليلة وتفصل بينها فترات مُتباعدة، بعكس الخطابات العادية التي تُلقى في النقاشات البرلمانية، وتتشابه فيما بينها على نحوٍ لافت. وكثيرًا ما يتبع هذا النوع الأخير شكلًا موحدًا، ويُكرر حججًا مُتماثلة، ويستخدم العبارات نفسها للدلالة على انتماء سياسي أو رأي مُعين.

وبينما يتولى المساعدون المؤتمنون غالبًا كتابة الخطابات السياسية، يدفع تشابها الملحوظ في البنية والحجج للتساؤل عما إذا كان بمقدور خوارزمية أو برنامج آلي كتابتها. وحاول فالنتين كاسرينج، خريج كلية المعلومات وعلوم الحاسب في “جامعة ماساتشوستس، أمهرست” الأمريكية الإجابة على السؤال من خلال تطوير خوارزمية تعتمد على تكنولوجيا تعلم الآلة، وتدريبها على كتابة خطابات سياسية تُحاكي الخطابات الحقيقية.

واعتمدت دراسته على فكرة واضحة، واستخدمت قاعدة بيانات تتألف مما يقرب من أربعة آلاف جزء من خطب سياسية ألقيت في ثلاثة وخمسين نقاشًا في الكونجرس الأمريكي؛ بغرض تدريب الخوارزمية على إعداد خطابات أخرى.

وتألفت هذه الخطب من أكثر من خمسين ألف جملة، وضمت كل جملة في المتوسط ثلاث وعشرين كلمة. وصنف كاسترينج الخطب تبعًا لانتماءها إلى الحزب الديموقراطي أو الجمهوري، وكذلك بحسب موقفها المؤيد أو المعارض لقضية معينة.

وبعد تجربة أساليب مختلفة للتحليل، استقر كاسترينج على نموذج n-grams في علم اللغويات الحاسوبية، ويُشير إلى سلسلة متجاورة من عناصر الحديث مثل الكلمات أو العبارات. وحلل كاسترينج النصوص أولًا بحسب الصفة النحوية لكل كلمة وما إذا كانت اسم أم فعل أم صفة ونحو ذلك.

وبعدها بحث كاسترينج في مجموعات تتألف من ستة عناصر (6-grams)، ومدى احتمال أن تظهر كلمة أو عبارة بالنظر إلى العناصر الخمسة التي سبقتها. وقال أن هذا الأسلوب سمح بتحديد سريع جدًا لجميع الكلمات التي قد ترد بعد الكلمات الخمس السابقة، ومدى احتمال ظهور كل منها.

وأعقب ذلك توليد الخطابات السياسية، وتبدأ بتحديد نوع الخطاب المطلوب وما إذا كان مُعبرًا عن الحزب الديموقراطي أم الجمهوري. ومن ثم تبحث الخوارزمية في قاعدة بيانات للعناصر الستة لتتوصل إلى مجموعات تتألف كل منها من خمسة عناصر لاستهلال أحد الخطابات.

وتختار الخوارزمية أحد المجموعات التي تتألف من خمسة عناصر عشوائيًا، ثم تختار الكلمة التالية من بين جميع الاحتمالات الممكنة للكلمات التي تليها. وبعدها تتنبأ بالخطاب كلمة بعد أخرى حتى نهايته. كما أن الخوارزمية تعرف احتمالات ورود موضوع معين في الخطاب، وبالتالي تختار بقية الموضوعات استنادًا على التعرف على الموضوعات التي يحتويها الخطاب بالفعل وتحديد مدى جودة تناولها.

وحققت الخوارزمية نتائج مُثيرة للاهتمام، ولاسيما أنها اعتمدت فقط على تدريب على الأجزاء المكونة للحديث وتحليل مجموعات الكلمات في قاعدة بيانات الخطابات السياسية.

وقيّم كاسترينج الخطابات التي أعدتها الخوارزمية تبعًا للصحة النحوية وبنية الخطاب ومحتواه والانتقالات بين الجمل، وتوصل إلى جودة أداءها على وجه العموم، وكتب: “على وجه التحديد الصواب من الناحية اللغوية والانتقالات بين الجمل كانا جيدين جدًا في أغلب الخطابات”.

وعلى الرغم من هذه النتائج الجيدة، إلا أن كاسترينج استبعد تحقيق هذه الخوارزمية نجاحًا كبيرًا في كتابة الخطابات السياسية. واقترح استخدامها في إنتاج أنواع أخرى من النصوص كالقصص الإخبارية من خلال تزويدها بقصص أخرى حول نفس الحادثة. وأتاح كاسترينج الشفرة المصدرية Source Code للخوارزمية في موقع”جيت هَب” GitHub لاستضافة مشروعات البرمجيات، وأبدى ترحيبه بتعديلها وتوسيعها ومحاولة استخدامها وأفكار لتحسينها.

المصدر

مصدر الصورة