Le jeu de données d'entraînement contient ~14 000 réponses et celui de test contient ~1000 réponses à un sondage.
L’objectif du challenge est de développer un modèle d’apprentissage automatique capable de prédire le taux d'alphabétisation des populations en Afrique et dans le monde pour l'année 2010 à partir de données historiques de sondages.
Fichiers disponibles pour téléchargement
-
Train.csv - contient la variable à prédire 'target'. Il s'agit des données que vous utiliserez pour entraîner votre modèle.
-
Test.csv - Similaire au jeu d’apprentissage (Train.csv), mais sans la colonne "target". Vous utiliserez ce fichier pour tester votre modèle.
-
SampleSubmission.csv - c’est un exemple de ce à quoi votre fichier de soumission devrait ressembler pour être correctement scoré sur la plateforme. L'ordre (index/indice) des lignes n'a pas d'importance mais chaque ID doit être correct.
-
VariableDefinitions.txt - il s'agit d'un fichier texte qui contient les définitions des variables