Récupérer un jeu de données (dataset en anglais) n'a pas toujours été aussi simple. D'ailleurs la data a été et est toujours le nerf de la guerre dans l'informatique de demain. Dans le domaine de la stratégie, de l'IA, scientifique et des statistiques, les données sont au coeur de chacun de ses systèmes. Mais comment trouver une source de données ?
Par où commencer lorsque l'on a besoin d'un jeu de données ?
Supposez que vous commenciez un business dans la vente automobile de marque Française. Vous allez constituer votre jeu de données avec les éléments suivants :
Sur ces mêmes jeux de données vous allez commencer à effectuer des analyses:
Mais avant même d'aller jusque là, imaginez un instant devoir passer en revue tout le stock disponible et les fiches complètes de chaque véhicules afin d'avoir un point de départ: la donnée sur laquelle viendront les analyses dans un second temps. Tout ceci est long et fastidieux...
C'est là qu'entre en jeu des sources de données existantes qui vont vous prémarcher une partie du travail. 🦥
Certains fournisseurs vous donnent immédiatement accès à leur stock que vous pourrez copier et coller chez vous histoire de gagner du temps... Mais dans bien des domaines vous serez livrer à vous même, contraint de commencer à partir de rien et de construire tout une base avec ces éléments.
Conscient de tout le travail que cela demande, certaines communautés se forment autour de la données et proposent même de s'échanger des jeux de données pour éviter à tout un chacun d'avoir à se farcir des heures de saisie.
J'ai nommé kaggle.com
Site de référence sur lequel vous pourrez trouver énormément de listes en tout genre:
Pour cela, penchez vous du côté des datasets.
Développeur passionné depuis plus de 20 ans, j'ai une appétence particulière pour les défis techniques et changer de technologie ne me fait pas froid aux yeux.
Nous utilisons des cookies sur ce site pour améliorer votre expérience d'utilisateur.