PodcastsBusinessBig Data Hebdo

Big Data Hebdo

Vincent Heuschling, Alexander Dejanovski, Jérôme Mainaud, Nicolas Steinmetz
Big Data Hebdo
Dernier épisode

231 épisodes

  • Big Data Hebdo

    Episode 229 : La fin de la récréation dans l'IA

    22/05/2026 | 44 min
    Dans cet épisode On décortique les vraies tensions de l'IA en 2026 : la surchauffe des modèles, l'inflation des commits, les hallucinations, et pourquoi la productivité 10x est un mythe.

    Au menu :
    AI Slop → Qualité réelle
    Les projets open source (curl, Linux) reconnaissent enfin que la qualité des contributions IA s'améliore.

    L'explosion des commits (275M/semaine)
    Plus de volume != plus de valeur. Le vrai coût? La vérification humaine (invisible dans les P&L).

    Hallucinations LLM
    Claude 3.5: 25% | GPT-4o: 89% | DeepSeek: 96%
    Même les meilleurs modèles hallucinent. La supervision humaine reste non-négociable.

    Modèles ouverts vs propriétaires
    Qwen 3.6 (35B paramètres, sur laptop) rivalise avec Opus 4.7. La géopolitique jouera.

    Innovations pour réduire les coûts
    TurboQuant (Google) + Sub-Quadratic Sparse Attention = inférence moins coûteuse.

    Dremio racheté par SAP (fermeture T3 2026)
    Impact: culture open source vs écosystème propriétaire = choc attendu. Bonne nouvelle pour Starburst.

    Chapitres
    00:00:00 -  Intro
    00:03:23 - La fin de la récréation dans l'IA
    00:36:08 - Dremio racheté par SAP
    00:39:00 - Semantic Layers 

    Le BigdataHebdo
    Le BigdataHebdo est le podcast Francophone de la Data et de l'IA.
    Retrouvez plus de 200 épisodes https://bigdatahebdo.com
    Rejoignez la communauté sur le Slack https://join.slack.com/t/bigdatahebdo/shared_invite/zt-a931fdhj-8ICbl9dbsZZbTcze61rr~Q
  • Big Data Hebdo

    Episode 228 : Enregistrement à Devoxx Paris 2026

    11/05/2026 | 1 h 20 min
    Cet épisode spécial du Big Data Hebdo, enregistré à Devoxx Paris, on donne la parole aux auditeurs ! 
    On parle des dernières news de chez Clever Cloud avec quentin Adam,
    On parle aussi de ce que l'IA change dans nos vies de développeurs, avec notament le tout "as code" 
    Jérôme nous fait part de ses aventures dans le monde java avec Schematron  pour parser des factures electroniques... 
    Stéphane Walter comme a son habitude nous relate les conférences auxquelles il a pu assister à Devoxx, avec notament des choses intéressantes du côté des objects connectés 

    ## Le BigdataHebdo
    Le BigdataHebdo est le podcast Francophone de la Data et de l'IA.
    Retrouvez plus de 200 épisodes https://bigdatahebdo.com
    Rejoignez la communauté sur le Slack https://join.slack.com/t/bigdatahebdo/shared_invite/zt-a931fdhj-8ICbl9dbsZZbTcze61rr~Q
  • Big Data Hebdo

    Episode 227 : Starburst et Trino avec Victor Coustenoble

    18/03/2026 | 45 min
    Dans cet épisode du Big Data Hebdo, Vincent Heuschling et Nicolas Steinmetz accueillent Victor Coustenoble pour une discussion sur Trino, Starburst. Découvrez l'historique, les cas d'usage, et les différenciateurs de ces moteurs SQL distribués, ainsi que leur impact sur la fédération de données et la gouvernance.

    ## au menu :
    Historique de Trino et Presto
    Cas d'usage de Trino dans le monde réel
    Différenciateurs de Starburst et Trino
    Architecture et déploiement de Trino
    Fédération de données et Data Mesh
    Intégration avec cloud et on-prem
    Fonctionnalités avancées de Starburst
    Contributions open source et communauté 
    ## Chapitres

    00:00 Introduction au Big Data Hebdo
    01:18 Présentation de Victor Coustenoble et de Starburst
    03:49 Comprendre Trino et son historique
    12:12 Fonctionnement de Trino et cas d'usage
    23:17 Clients et déploiement de Trino et Starburst
    25:47 Gestion des connexions et du cache dans Starburst
    28:50 Fonctionnalités premium de Starburst
    30:35 Développements et contributions à Trino
    32:48 Évaluation des alternatives à Snowflake et BigQuery
    34:11 Déploiement hybride et souveraineté des données
    35:57 Évolution du concept de Data Mesh
    38:59 Préparation à l'ère agentique et intégration des data products

    ## Le BigdataHebdo
    Le BigdataHebdo est le podcast Francophone de la Data et de l'IA.
    Retrouvez plus de 200 épisodes https://bigdatahebdo.com
    Rejoignez la communauté sur le Slack https://join.slack.com/t/bigdatahebdo/shared_invite/zt-a931fdhj-8ICbl9dbsZZbTcze61rr~Q
  • Big Data Hebdo

    Episode 226 : Starlake.AI avec Hayssam Saleh

    20/02/2026 | 55 min
    Vincent Heuschling reçoit Hayssam Saleh, créateur de **Starlake**, une plateforme data open source française née de la factorisation de projets clients depuis 2017-2018. L'épisode intervient dans un contexte de consolidation du marché (rachat de DBT et de SQLMesh par Fivetran), qui invite à challenger les solutions établies.

    Starlake se distingue par une approche **entièrement déclarative** (YAML + SQL natif, sans Jinja) couvrant toute la chaîne data engineering : ingestion, transformation, orchestration et qualité des données. L'outil s'appuie sur les moteurs sous-jacents des plateformes cibles (Snowflake, BigQuery, Spark) et génère automatiquement les DAGs pour les orchestrateurs du marché (Airflow, Dagster, Snowflake Tasks).

    Parmi les fonctionnalités marquantes : le **data branching** (branches de données à la manière de Git), l'inférence automatique de schémas YAML à partir de fichiers sources, un **transpiler SQL** multi-plateformes, et l'extraction du lineage depuis du SQL brut sans annotation. L'intégration récente de **DuckLake** ouvre la voie à des architectures on-premise souveraines à coût maîtrisé (sous 300 €/mois sur OVH, Scaleway, Clever Cloud).

    Le modèle économique repose sur le support, la formation, et le consulting : Starlake s'installe dans le cloud du client, avec mise à jour automatique gérée par l'équipe, sans accès aux données.

    **Chapitres**
    **00:00:27** – Introduction : consolidation du marché data (rachat de DBT et SQLMesh par Fivetran) et présentation de l'épisode
    **00:03:13** – Hayssam et la genèse de Starlake : parcours Spark/Scala, POC à 4 000 formats de fichiers (2017-2018)
    **00:09:51** – Architecture et philosophie : load, transform, orchestration unifiés en déclaratif (YAML + SQL natif, pas de Jinja)
    **00:00:18:18** – Starlake vs DBT : différences philosophiques, composabilité, fonctionnalités 100 % open source
    **00:00:22:20** – Data branching, Starlake Labs (pipe syntax, transpiler SQL, lineage) et expérience développeur (DuckDB local, UI point-and-click)
    **00:36:35** – Modèle open source et économique : licence Apache, support, formation, marketplace cloud souveraine
    **00:43:42** – DuckLake : alternative on-premise/cloud souverain (OVH, Scaleway, Clever Cloud) et comment contribuer / démarrer

    **Le BigdataHebdo**
    Le BigdataHebdo est le podcast Francophone de la Data et de l'IA.
    Retrouvez plus de 200 épisodes https://bigdatahebdo.com
    Rejoignez la communauté sur le Slack https://join.slack.com/t/bigdatahebdo/shared_invite/zt-a931fdhj-8ICbl9dbsZZbTcze61rr~Q
  • Big Data Hebdo

    Episode 225 : La guerre des agents SDK

    04/11/2025 | 54 min
    Dans cet épisode du BigData Hebdo, Vincent Heuschling et Paul Peton explorent les dernières annonces d'OpenAI, d’Anthropic et de Google concernant les agents AI et leur monétisation. Au programme les SDK, les workflows, etc...

    **A retenir dans cet épisode**
    - Les dernières annonces d'OpenAI, Anthropic, et Google.
    - Les agents ont de l’argent, il commencent à être monétisés.
    - OpenAI vise à concurrencer Google et l'App Store d'Apple.
    - Les SDK sont essentiels pour le développement d'agents AI.
    - La capacité de prise de décision des agents est cruciale pour leur efficacité.
    - La tarification des gros modèles AI est démesurée.
    - Les navigateurs AI soulèvent des questions éthiques.
    - La connectivité des agents est un enjeu majeur.

    **Le BigdataHebdo** Le BigdataHebdo est le podcast Francophone de la Data et de l'IA.
    Retrouvez plus de 200 épisodes https://bigdatahebdo.com
    Rejoignez la communauté sur le Slack https://join.slack.com/t/bigdatahebdo/shared_invite/zt-a931fdhj-8ICbl9dbsZZbTcze61rr~Q
Plus de podcasts Business
À propos de Big Data Hebdo
Toute l'actualité du Bigdata et surtout de sa communauté francophone dans un podcast.
Site web du podcast

Écoutez Big Data Hebdo, Investir avec Xavier ou d'autres podcasts du monde entier - avec l'app de radio.fr

Obtenez l’app radio.fr
 gratuite

  • Ajout de radios et podcasts en favoris
  • Diffusion via Wi-Fi ou Bluetooth
  • Carplay & Android Auto compatibles
  • Et encore plus de fonctionnalités