Documentation officielle
Règles du challenge
Lisez attentivement cette page avant de soumettre vos prédictions.
Description du projet
Contexte et dataset
Ce challenge porte sur la détection d'intrusion réseau. L'objectif est de construire un modèle capable de classifier chaque flux réseau dans l'une des 10 catégories — trafic normal ou famille d'attaque. Les données proviennent d'un dataset produit par le Cyber Range Lab de l'Université de New South Wales (Australie), reconnu dans la littérature de recherche en cybersécurité.
Les 10 classes
Label entier à prédire pour chaque flux
| Label | Classe | Description | % train |
|---|---|---|---|
| 0 | Normal | Trafic réseau bénin, aucune activité malveillante | 36.09% |
| 1 | Generic | Attaque générique visant à briser un chiffrement par blocs | 22.85% |
| 2 | Exploits | Exploitation de vulnérabilités connues dans des logiciels | 17.28% |
| 3 | Fuzzers | Envoi de données aléatoires pour provoquer des comportements inattendus | 9.41% |
| 4 | DoS | Attaque par déni de service visant à rendre un service indisponible | 6.35% |
| 5 | Reconnaissance | Collecte d'informations sur la cible avant une attaque (scan de ports) | 5.43% |
| 6 | Analysis | Analyse de fichiers et ports pour infiltrer un réseau | 1.04% |
| 7 | Backdoor | Installation d'une porte dérobée permettant un accès persistant | 0.90% |
| 8 | Shellcode | Injection de shellcode utilisé comme charge utile dans des exploits | 0.59% |
| 9 | Worms rare | Vers informatique capable de se propager automatiquement entre hôtes | 0.07% |
Durée, paquets src/dst, octets échangés, TTL, charge bits/s, jitter, fenêtre TCP, temps inter-paquets, métriques de connexion agrégées.
proto133 valeurs uniquesservice13 valeursstate11 valeursCritères de classement
Comment le score est calculé et les équipes classées
Macro F1-Score
Le classement est déterminé par le Macro F1-Score — la moyenne non pondérée des F1-Scores des 10 classes. Chaque classe contribue équitablement, quelle que soit sa fréquence.
Un modèle qui ignore les classes rares (Worms, Shellcode) sera fortement pénalisé même s'il classe correctement les classes majoritaires.
F1-Score Worms — classe 9
En cas d'égalité sur le Macro F1, le classement est déterminé par le F1 de la classe Worms (26 exemples dans le test set). C'est l'indicateur le plus direct de la qualité du traitement du déséquilibre.
Moyenne pondérée par taille de classe. Moins sévère sur les classes rares.
Trompeuse seule : ~78% accessibles sans traiter les classes rares.
Capacité de détection et fiabilité des prédictions sur les 10 classes.
Ordre de tri du leaderboard
Le score retenu est celui de la meilleure soumission validée de chaque équipe.
Règles de soumission
Format du fichier, contraintes et données disponibles
Format du fichier CSV
Exemple attendu
0,4
1,0
2,1
3,9
...
idtest_public.csvlabelContraintes techniques
Données disponibles
train.csv
180 371 flux — features + Label (0–9)
validation.csv
38 651 flux — features + Label (0–9)
test_public.csv
38 651 flux — features uniquement
sample_submission.csv
Exemple au format attendu