Sur Data Driven 101, on s’intéresse aux applications pratiques de la data dans toute leur diversité avec un objectif : démystifier ce concept.
Marc Sanselme di... Voir plus
Sur Data Driven 101, on s’intéresse aux applications pratiques de la data dans toute leur diversité avec un objectif : démystifier ce concept.
Marc Sanselme di... Voir plus
Épisodes disponibles
5 sur 23
Épisode 21 : Édouard d'Archimbaud (CTO @ Kili Technology) : L'annotation de données
Edouard d'Archimbaud ingénieur en machine learning et CTO fondateur de Kili Technology , est l’invité de l’épisode 21 de #DataDriven101. Il nous parle des difficultés liées à l'annotation de données pour le machine learning et explique pourquoi la qualité de la donnée est essentielle pour obtenir des modèles fiables.
Garbage in -> Garbage out !
Mots clés :
Dataset: un ensemble de données qui est utilisé pour entraîner, tester et évaluer des modèles de machine learning.
Métadonnées: des données qui décrivent les caractéristiques des données, telles que leur format, leur source, leur qualité et leur provenance.
Batch: un ensemble de données qui est traité en même temps, souvent divisé en lots plus petits pour faciliter l'annotation et le traitement.
Plateforme d'annotation: une plateforme logicielle conçue pour faciliter l'interaction entre les humains et les données, permettant de visualiser, de naviguer et d'annoter des données de manière efficace et précise.
28/05/2023
33:23
Épisode 20 : Coralie Betbeder-Déchelette ( Data Lead @ Joko) : Data et Shopping
Coralie Betbeder-Déchelette, Data Lead chez Joko est l’invité de l’épisode 20 de #Datadriven101.
Elle nous parle de data model, de bilan carbone et de l'importance de la culture de l'entreprise en matière de données, et comment cela peut affecter l'impact de l'équipe data sur le reste de l'entreprise.
Mots clés :
Monitoring: l'observation et l'analyse régulière des performances d'un système ou d'un processus afin de détecter tout écart par rapport aux objectifs et de prendre des mesures correctives si nécessaire.
Taux de Churn: le taux de désabonnement d'un produit ou service. Il est calculé en divisant le nombre de clients ayant résilié leur abonnement par le nombre total de clients.
Data Warehouse: un système de stockage de données qui permet de regrouper des données provenant de diverses sources en un seul endroit afin de faciliter la gestion et l'analyse des données.
Data model : Modèle de données qui représente la structure des données d'un système.
SQL : acronyme de Structured Query Language, langage informatique utilisé pour communiquer avec les bases de données relationnelles.
21/05/2023
29:44
Épisode 19 : Victor Cluzel ( Administrateur de l'Insee @ Cour des comptes ) : La data à la cour des comptes
Victor Cluzel, administrateur de l'Insee détaché à la Cour des comptes, est l’invité de l’épisode 19 de Data Driven 101. Il nous parle du rôle de la data science à la Cour des comptes et des défis liés à l'utilisation des données dans ce contexte.
Mots clés :
Collégialité : Processus par lequel un groupe de personnes (généralement des magistrats) examine, valide ou modifie les rapports rédigés par les rapporteurs. Ce processus garantit que les rapports sont justes et précis avant d'être soumis aux administrations concernées.
Crawling : Technique utilisée pour naviguer automatiquement sur le web et récupérer des informations sur les sites web, leurs liens et leurs relations.
Clustering : Méthode d'analyse de données qui consiste à regrouper des objets similaires en fonction de certaines caractéristiques ou mesures de similarité
Computer vision : Il s'agit d'un domaine de l'IA qui se concentre sur l'acquisition, l'analyse et la compréhension d'images ou de vidéos pour permettre aux machines de traiter et d'interpréter visuellement le monde qui les entoure.
RGPD (Règlement Général sur la Protection des Données) : Le RGPD est un règlement de l'Union Européenne qui vise à renforcer la protection des données personnelles des citoyens européens
Data mining (extraction de données) : C'est le processus d'analyse de grands ensembles de données pour en extraire des informations cachées, des tendances ou des modèles
Big Data : Il s'agit d'ensembles de données si volumineux, variés et complexes qu'ils nécessitent des approches et des outils de traitement avancés pour être analysés et exploités.
Data Lake : vaste référentiel centralisé de données brutes provenant de diverses sources et stockées sous leur format natif.
Peer learning : ou apprentissage par les pairs en français, est une méthode d'enseignement et d'apprentissage dans laquelle les participants apprennent les uns des autres en partageant leurs connaissances, compétences et expériences.
14/05/2023
34:54
Épisode 18 : Victor Azria (Global Data Director @ JCDecaux) : Les panneaux d’affichages face à la data
Victor Azria , Global Data Director chez JCDecaux est l’invité de l’épisode 18 de Data driven 101.
Il nous parle de l'utilisation des données chez JCDecaux et nous explique comment la division data a été créée pour répondre aux défis posés par la transformation de l'écosystème des médias et l'arrivée d'acteurs émergents dans le domaine du marketing digital.
Mots clés
KPI (Key Performance Indicator) : Un indicateur clé de performance est une mesure quantifiable utilisée pour évaluer la réussite d'une entreprise ou d'un projet par rapport à ses objectifs.
DevOps : Une approche de développement logiciel qui intègre étroitement le développement et les opérations informatiques pour améliorer la collaboration et la communication.
Heatmap : Représentation graphique des données où les valeurs individuelles sont représentées par des couleurs, généralement utilisée pour visualiser des données complexes ou volumineuses.
Data marketplace : Plateforme où les fournisseurs de données peuvent vendre ou échanger des ensembles de données avec d'autres organisations ou individus.
Forecast (prévision) : Estimation ou prédiction de futurs événements ou tendances basée sur des données historiques ou des analyses statistiques.
Data Warehouse: un système centralisé et structuré de stockage et de gestion des données provenant de différentes sources.
Dashboard: un panneau de visualisation qui présente les indicateurs clés de performance (KPI) et d'autres informations utiles pour les utilisateurs.
Dataviz : abréviation de "data visualization", c'est la représentation visuelle des données pour faciliter leur compréhension et leur interprétation.
MOA (Maîtrise d'Ouvrage) : il s'agit de la partie prenante d'un projet qui définit les besoins, les objectifs et les exigences fonctionnelles, et qui assure le suivi et la validation du projet.
07/05/2023
41:19
Épisode 17 : Alexandre Haag (Tesla, Audi et Ford) : La voiture autonome
Alexandre Haag est l’invité de l’épisode 17 de Data Driven 101.
Après 10 ans dans la robotique, il a travaillé 8 ans dans le monde de la conduite autonome, notamment chez Tesla & Argo.AI (Audi et Ford).
Aujourd'hui, il lance son projet FutuRail, visant à développer des trains autonomes pour offrir un meilleur service de transport ferroviaire et réduire les émissions de CO2.
Il nous parle de sa vision du monde de la voiture autonome, du travail dans une entreprise comme Tesla, des méthodes de travail d'Elon Musk et des différences USA/europe.
Mots clés
Loi de Moore : Prédiction selon laquelle le nombre de transistors sur un microprocesseur doublera environ tous les deux ans, augmentant ainsi la puissance de calcul. (définition de chatGPT)
Dataset : Ensemble de données structurées, généralement utilisé pour l'analyse, la modélisation ou la formation d'un algorithme.
Motion planning : Processus de détermination des mouvements et des actions nécessaires pour qu'un objet ou un robot atteigne un état ou une position spécifique.
Sur Data Driven 101, on s’intéresse aux applications pratiques de la data dans toute leur diversité avec un objectif : démystifier ce concept.
Marc Sanselme dirige Scopeo, agence de R&D en Data Science et Machine Learning.
Dans ce podcast, il reçoit des professionnels de fonctions et d’horizons variés pour nous parler de leurs aventures, leurs succès, leurs échecs, leurs espoirs, leurs techniques, leurs astuces, leurs histoires et leurs convictions.
Réalisation et montage : Clémence Reliat