Le leaderboard public semble trompeur?
En construisant le modèle j'obtiens 0.9143 pour la validation croisée locale mais 0.9220 sur le leaderboard public! Un piège pour le dernier jour (private leaderboard)?
Espérant que ça puisse attirer l'attention des uns. Bon courage à tous pour la suite.
la regle des 40% et 60 % dans info peut etre
Oui c'est vrai il y a effectivement
Moi c'est plutôt l inverse le score est parfois beaucoup moins de celle de la validation croisé en local
Ah oui? Vous avez quoi comme score de validation croisée?
moi de meme, j'ai 0.9575 mais je me retrouve a 0.9145
Certaine fois j était à 90 je me suis retrouvé à 77 c'est souvent quand je fais une grosse feature selection mais actuellement je suis à 92 mais ça donne 90 ici
😂Je pensais être le seul
95 en validation croisé ?
Ah , oui bizarrement
Une idée ?
Je crois comprendre le probleme
Moi je dis qu'ils ont un problème de data drift avec leur test set là. Ils ont même pas fait un mélange avant de sampler pour avoir le test😹 . (d'apres moi)
quoi?vous avez essayer de faire une comparaison des distributions?
@KodjoDjehouty Votre notebook ainsi que toutes mes soumissions de ce matin donnent un score de 54, suis-je le seul dans ce cas ?
C'est bizarre. Peut être vous soumettez juste le random, ou bien le fichier de soumission initiale (donné par les organisateurs)?
Il s'agit bien de de votre code et du fihcier csv généré.