انطلقت قبل أيام قليلة بطولة #كأس_العالم 2018 لكرة القدم التي تستضيفها #روسيا، وهي واحدة من أكثر الأحداث الرياضية انتشارًا في التاريخ، كما أنها أكثر شعبية حتى من الألعاب الأولمبية، وبالتالي يعتبر أمر التنبؤ بالفائزين المحتملين من أكبر الاهتمامات.
وتمكنت تقنيات التعلم الآلي من التنبؤ بما يمكن أن تؤول إليه الأحداث اعتماداً على بيانات وإحصائيات سابقة، وقد توقع الباحثون النتيجة بعد محاكاة بطولة كأس العالم بأكملها 100 ألف مرة.
وفيما سبق كانت إحدى الطرق لقياس النتائج المحتملة هي الاطلاع على احتمالات شركات المراهنات. حيث تستخدم هذه الشركات إحصائيين محترفين لتحليل قواعد البيانات الشاملة للنتائج بطريقة تحدد احتمالات النتائج المختلفة لأي مباراة. وبهذه الطريقة تستطيع مكاتب المراهنات تقديم احتمالات حول جميع المباريات التي ستلعب في بطولة كأس العالم، بالإضافة إلى وجود احتمالات تخص الفائزين المحتملين.
وبعد الجمع بين كل الاحتمالات من شركات المراهنات المختلفة كان أفضل تقدير يقترح أن المرشح الأفضل للفوز ببطولة كأس العالم 2018 هي البرازيل بنسبة 16.6%، تليها ألمانيا بنسبة 12.8%، ثم إسبانيا بنسبة 12.5% حسبما ذكر تقرير مجلة MIT Technology review.
ولكن في السنوات الأخيرة طور الباحثون تقنيات التعلم الآلي التي لديها القدرة على التفوق على الأساليب الإحصائية التقليدية في التنبؤ. فما الذي تتوقعه هذه التقنيات الجديدة كنتيجة محتملة للفائز ببطولة كأس العالم 2018؟
الإجابة تأتي نتيجة عمل الباحث أندرياس غول وبعض زملائه في جامعة دورتموند التقنية في ألمانيا حيث استخدموا مزيجًا من تقنيات التعلم الآلي والإحصاءات التقليدية ليقوموا بإنشاء نموذج يُسمى الغابة العشوائية Random-Forest لتحديد الفريق الأوفر حظًا للفوز بالنسخة الـ 21 للمونديال، معتمدين في ذلك على محاكاة بطولة كأس العالم 100 ألف مرة.
واستخدم غرول وزملاؤه هذا الأسلوب لتصميم نموذج بطولة كأس العالم 2018 حيث صمموا نتائج كل مباراة من المرجح أن تلعبها الفرق واستخدموا هذه النتائج لبناء المسار الأكثر احتمالًا في البطولة.
احتمالات الفوز بكأس العالم وأفضل الفرص لألمانيا واسبانيا
وبدأوا مع مجموعة واسعة من العوامل المحتملة التي قد تحدد النتيجة، وتشمل هذه العوامل الاقتصادية مثل الناتج المحلي الإجمالي وتعداد السكان، وترتيب الفيفا FIFA للفرق الوطنية، بالإضافة إلى خواص الفرق نفسها مثل متوسط أعمار اللاعبين، وعدد اللاعبين المحترفين في الفريق الذين لعبوا في دوري أبطال أوروبا، وما إلى ذلك. ومن المثير للاهتمام أن نموذج الغابة العشوائية يسمح لفريق البحث بتضمين محاولات تصنيف تجريبية أخرى مثل التصنيفات المستخدمة من قبل شركات المراهنات.
وبعد إضافة كل هذه المعلومات للنموذج تبين أن أكثر العوامل المؤثرة على النتيجة هي تصنيفات الفرق التي تم إنشاؤها بطرق أخرى سواء التي قدمتها شركات المراهنات أو الفيفا وغيرهم.
وتشمل العوامل الهامة الأخرى إجمالي الناتج المحلي وعدد لاعبي دوري الأبطال في الفريق. وتشمل العوامل غير المهمة تعداد سكان البلد، وجنسية مدرب الفريق وما إلى ذلك.
وتختلف التوقعات التي تم التوصل إليها من خلال هذه العملية عن غيرها من الطرق الهامة. وكبداية تختار طريقة الغابة العشوائية #إسبانيا باعتبارها الفائز الأكثر احتمالًا بنسبة 17.8%.
المانيا خسرت أمام المكسيك بهدف ولكن العلم يرشحها للمونديال بشرط الوصول إلى ربع النهائي
ومع ذلك هناك عامل كبير في هذا التنبؤ وهو هيكل البطولة نفسها. فإذا تمكنت #ألمانيا من تخطي مرحلة المجموعات من المنافسة فمن المرجح أن تتعرض لمواجهة قوية في دور الـ 16.
وبسبب ذلك تحسب طريقة الغابة العشوائية فرص ألمانيا في الوصول إلى الدور ربع النهائي بنسبة 58%. على النقيض من ذلك فإنه من غير المحتمل أن تتعرض إسبانيا لمواجهة قوية في الدور الـ 16، وبالتالي فإن لديها فرصة بنسبة 73% للوصول إلى الدور ربع النهائي.
وإذا وصل كلاهما إلى الدور الربع النهائي، فإن فرصتيهما متساوية في الفوز. ويقول فريق البحث: "إسبانيا مفضلة قليلاً على ألمانيا، ويرجع ذلك إلى حقيقة أن ألمانيا تملك احتمال أكبر للمغادرة في دور الـ 16".
وأضاف الفريق بعد تجريب كافة الاحتمالات 100 ألف مرة: "وفقًا لدورة البطولة الأكثر احتمالاً، إذا نجحت ألمانيا في الوصول إلى الربع النهائي فإنه من المرجح فوز المنتخب الألماني بكأس العالم 2018 بدلاً من المنتخب الإسباني".