Le Funathon est un évènement de formation organisé par le SSP Lab. L'idée est simple : s'inspirer du format d'un hackathon, enlever le format compétitif, et créer ainsi un format permettant à tout agent du service statistique public et de ses partenaires proches de découvrir, se confronter, pratiquer, apprendre ou se perfectionner en datascience sur un cas d'usage, dans un esprit collaboratif et non compétitif.
Le Funathon vise ainsi tous les agents – du curieux débutant, à l’expert en science des données, en passant par celles et ceux qui ont déjà reçu une formation mais qui n’ont pas l’occasion de pratiquer, partant du principe que si un agent n’est pas confronté régulièrement à un cas d’utilisation de ses nouvelles connaissances, celles-ci risquent de se perdre progressivement.
La première édition du Funathon a eu lieu le 21 et 22 juin 2021 et a réuni environ 150 agents, inscrits au préalable auprès de leur responsable formation et souvent réunis en équipe. Cette première édition a tourné autour de l'utilisation des données d'Airbnb, 8 sujets plus ou moins guidés étant proposés, avec chaque fois des notebooks (en R et en Python) permettant d'entrer dans le sujet (l'ensemble du materiel est disponible ici)
En 2022, une nouvelle édition a eu lieu les 20 et 21 juin, tournant cette fois autour de la thématique de l'environnement, et du changement climatique. Cette fois encore, 9 sujets ont été proposés, chaque fois accompagnés de notebooks d'explication (en R et en Python). Ceci a notamment permis de travailler sur l'extraction de données de Twitter, l'analyse textuelle des données du grand Débat, la réalisation d'analyses graphiques autour de la montée des eaux, l'analyse des données issues de la base Ademe sur les logements, le machine learning à partir des données de la météo, les données satellites, l'utilisation de Fasttext, d'Elastic Search, 3 Master class ont également été proposées sur (i) la pertinence d'utiliser Python quand on connait R ; (ii) une initiation à Elastic ; (iii) L'utilisation du deep learning pour classifier des données issues d'images satellites. L'ensemble du materiel associé, et les différents liens vers les master class, sont présents dans le repo ci-après : https://git.lab.sspcloud.fr/ssplab/2022-06-funathon