Toute l'actualité du Bigdata et surtout de sa communauté francophone dans un podcast.
…
continue reading
DataOops : savoir-faire et compétences réunies autour des sujets données et DevOps. On y parle : - databases & performances : techniques d'optimisations, bonnes et mauvaises pratiques, détections des problèmes et même de hardware et de cloud - modélisations des données : les différents types de modélisation et leur spécificités. - devops : des bases du devops aux éléments les plus pointus et bien sur les liens entre les 3 domaines Retrouves nous sur https://www.dataoops.org pour plus de détails.
…
continue reading

1
Episode 54 : des nouvelles de DuckDB, des vecteurs chez les principales databases, no/low-code vs code
1:00:11
1:00:11
Riproduci in seguito
Riproduci in seguito
Liste
Like
Like aggiunto
1:00:11Des nouvelles de DuckDB avec l'interface graphique DuckDB UI, Les vecteurs dans les principales bases de données relationnelles comme Oracle, SQL Server ou PostgreSQL et comment fabriquer ses embeddings. Enfin une discussion sur les avantages et inconvénients entre la solution NO/Low Code et le Code de l'intégration à la BI…
…
continue reading
Dans cet épisode du Big Data Hebdo, 🎙️ j’ai eu le plaisir d’échanger avec Nicolas Korchia de Indexima, qui nous dévoile comment leur solution révolutionne la performance des requêtes analytiques sur Snowflake⚡ 👉 Indexima for Snowflake analyse les requêtes en temps réel et génère automatiquement des agrégats optimisés avec les Dynamic Tables, réduis…
…
continue reading

1
episode 213 : Timeseries et SQL avec Warp10
1:00:16
1:00:16
Riproduci in seguito
Riproduci in seguito
Liste
Like
Like aggiunto
1:00:16🎙️ On plonge dans les séries temporelles et l’intégration SQL avec Warp 10, en compagnie de Mathias Herbert (Senx.io). 📊 SQL atteint vite ses limites face aux time series. Comment faire mieux sans exploser la facture cloud ? WarpLibapporte une solution en s’intégrant dans Databricks, Starburst et bientôt Snowflake ! Show notes et chapitres sur http…
…
continue reading

1
Episode 212 Analytique en Cloud Hybride
1:18:03
1:18:03
Riproduci in seguito
Riproduci in seguito
Liste
Like
Like aggiunto
1:18:03Le BigDataHebdo reçoit Florian Caringi, responsable des plateformes Data & IA au sein du groupe BPCE. On discute de l'évolution des architectures Big Data, de Hadoop aux environnements hybrides et cloud, avec une adoption massive de Google Cloud (BigQuery, Vertex AI) pour des usages analytiques et data science. Florian partage son expérience sur le…
…
continue reading
Episode timelineDi Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
…
continue reading
Le BigDataHebdo, reçoit Mehdi, Developer Advocate chez MotherDuck, pour explorer l’univers de DuckDB et MotherDuck. Au programme, les origines académiques de DuckDB, son évolution en tant que moteur SQL analytique performant, et son extension MotherDuck qui permet de l’utiliser comme un Data Warehouse en ligne. Show notes sur http://bigdatahebdo.co…
…
continue reading
Dans cet épisode on revient brièvement sur l'année écoulée, et on vous parle de ce qu'on prévoit sur 2025. Evidement ces prédictions sont très tintées d'IA ! Retrouvez tous les épisodes avec leurs shownotes : https://bigdatahebdo.com/?src=shownotes ----------------- Cette publication est sponsorisée par Datatask (https://datatask.io/) et CerenIT (h…
…
continue reading

1
Episode 52 : Iceberg et Delta, Migration de bases de données, Evidence.dev : Reports as Code
52:17
Episode timelineDi Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
…
continue reading

1
Episode 209 : FoundationDB, brique élémentaire de Materia KV feat @MACI
1:15:26
1:15:26
Riproduci in seguito
Riproduci in seguito
Liste
Like
Like aggiunto
1:15:26Dans cet épisode on revient sur FoundationDB. FoundationDB est le socle de beaucoup de services (Icloud, Snowflake...) mais reste peu connue. Qui de mieux que l'équipe de spécialistes de Clever cloud qui l'a utilisé pour construire ses "Databases as a Service" pour en parler ? C'est donc un épisode conjoint avec leur podcast "Message à Caractère in…
…
continue reading
Dans cet épisode on revient sur FoundationDB. FoundationDB est le socle de beaucoup de services (Icloud, Snowflake...) mais reste peu connue. Qui de mieux que l'équipe de spécialistes de Clever cloud qui l'a utilisé pour construire ses "Databases as a Service" pour en parler ? C'est donc un épisode conjoint avec leur podcast "Message à Caractère in…
…
continue reading
Episode enregistré en Live au Salon de la Data et De l'IA de Nante en Septembre 2024. On débat de la Data-Quality avec la contribution du public. à retrouver aussi sur Youtube https://youtu.be/9_C6hbZpDrw Les shownotes de cet épisode sont à retrouver sur https://bigdatahebdo.com/podcast/episode-207-live-salon-data-ia/ Retrouvez tous les épisodes de…
…
continue reading

1
Episode 51 : DuckDB v1.1 vs PostgreSQL v17 / SQL en difficulté
1:04:10
1:04:10
Riproduci in seguito
Riproduci in seguito
Liste
Like
Like aggiunto
1:04:10Episode timelineDi Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
…
continue reading
Les shownotes de cet épisode sont à retrouver sur https://bigdatahebdo.com/podcast/episode-206-portes-ouvertes-chez-openai/ Retrouvez tous les épisodes de ce podcast sur https://bigdatahebdo.com Et sur la chaine YoutubeDi Vincent Heuschling, Alexander Dejanovski, Jérôme Mainaud, Nicolas Steinmetz
…
continue reading

1
Episode 205 : Kestra avec Ludovic Dehon
1:14:17
1:14:17
Riproduci in seguito
Riproduci in seguito
Liste
Like
Like aggiunto
1:14:17Les shownotes de cet épisode sont à retrouver sur https://bigdatahebdo.com/podcast/episode-205-Kestra-avec-Ludovic-Dehon Retrouvez tous les épisodes de ce podcast sur https://bigdatahebdo.com Et sur la chaine YoutubeDi Vincent Heuschling, Alexander Dejanovski, Jérôme Mainaud, Nicolas Steinmetz
…
continue reading
Les shownotes de cet épisode sont à retrouver sur https://bigdatahebdo.com/podcast/episode-204-70-milliards-de-relections/ Retrouvez tous les épisodes de ce podcast sur https://bigdatahebdo.com Et sur la chaine Youtube ------------------ Cette publication est sponsorisée par Datatask et CerenIT. CerenIT vous accompagne pour concevoir, industrialise…
…
continue reading
Les shownotes de cet épisode sont à retrouver sur https://bigdatahebdo.com/podcast/episode-203-pas-de-treve-olympique-pour-les-llms/ Retrouvez tous les épisodes de ce podcast sur https://bigdatahebdo.com ------------------ Cette publication est sponsorisée par Datatask et CerenIT. CerenIT vous accompagne pour concevoir, industrialiser ou automatise…
…
continue reading

1
Episode 202 : Data Architecture avec Frédéric Brossard de Dcube
1:12:30
1:12:30
Riproduci in seguito
Riproduci in seguito
Liste
Like
Like aggiunto
1:12:30Retrouvez les shownotes de cet épisode sur https://bigdatahebdo.com/podcast/episode-202-data-architecture-avec-frederic-brossard-de-dcube/ ------------------ Cette publication est sponsorisée par Datatask et CerenIT. CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données tempor…
…
continue reading
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-201-snowflake-summit-24-part-2-ml-et-genai/ ------------------ Cette publication est sponsorisée par Datatask et CerenIT. CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données te…
…
continue reading

1
Episode 50 : Performance d’un stockage physique récent | L’audit de sécurité dans SQL Server et PostgreSQL | Stockage objet
Dans cet épisode ont parle de Performance d'un stockage physique recent et la comparaison avec ce que l'on peut avoir sur du cloud public.De l'audit de sécurité dans SQL Server et PostgreSQL.Du stockage objet (S3 et Ceph), Cloud (ou pas)Di Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
…
continue reading
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-200-snowflake-summit-24-part-1-data-engineering/ ------------------ Cette publication est sponsorisée par Datatask et CerenIT. CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos donné…
…
continue reading

1
Episode 199 : Databricks Data & AI Summit 2024
1:07:36
1:07:36
Riproduci in seguito
Riproduci in seguito
Liste
Like
Like aggiunto
1:07:36Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-199-databricks-dais-2024/ ------------------ Cette publication est sponsorisée par Datatask et CerenIT. CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez…
…
continue reading
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-198-ia-gen-et-anssi/ ------------------ Cette publication est sponsorisée par Datatask et CerenIT. CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous…
…
continue reading

1
Episode 197 : GLADIA avec Jean-Louis Queguiner
1:19:30
1:19:30
Riproduci in seguito
Riproduci in seguito
Liste
Like
Like aggiunto
1:19:30Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-197-gladia-avec-jean-louis-queguiner/ ------------------ Cette publication est sponsorisée par Datatask et CerenIT. CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporel…
…
continue reading
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-196-python-news-et-autres/ ------------------ Cette publication est sponsorisée par Datatask et CerenIT. CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrive…
…
continue reading

1
Episode 195 : DBT avec Florian Eiden
1:13:51
1:13:51
Riproduci in seguito
Riproduci in seguito
Liste
Like
Like aggiunto
1:13:51Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-195-dbt-avec-florian-eiden ------------------ Cette publication est sponsorisée par Datatask et CerenIT. CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrive…
…
continue reading
On parle : Migration/Transfert de données inter-databases et les problématiques de collations associées. Puis discussions sur les collations : performances, impactsUn REX sur un dataoops sur les datatypes text/varchar entre postgresqle et mssqlLes grands cas d'usage IA : détectionDevOx : retour d'Adrien sur ce qui lui a plus : Alto et Park et l'AGC…
…
continue reading
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-194-self-service-data-avec-tristan-mayer/ ------------------ Cette publication est sponsorisée par Datatask et CerenIT. CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temp…
…
continue reading

1
Episode 193 : Microsoft Fabric avec Marie Aubert
1:06:15
1:06:15
Riproduci in seguito
Riproduci in seguito
Liste
Like
Like aggiunto
1:06:15Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-193-microsoft-fabric-avec-marie-aubert ------------------ Cette publication est sponsorisée par Datatask et CerenIT. CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données tempore…
…
continue reading

1
Episode 192 : DuckDB et autres avec Christophe Blefari
1:10:52
1:10:52
Riproduci in seguito
Riproduci in seguito
Liste
Like
Like aggiunto
1:10:52Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-192-duckdb-et-autres-avec-christophe-blefari ------------------ Cette publication est sponsorisée par Datatask et CerenIT. CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données t…
…
continue reading
On parle indexation dans les bases de données relationnelles et en particulier PostgreSQL, MSSQL et Oracle : index Btree, GIN, GIST, partiel ou filtré, couvrant, columnstore, FullText, Spatial, BRIN, Bitmap...Une heure de comparaison entre les 3 grands SGBDRDi Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
…
continue reading

1
Episode 191 : Popsink avec Benjamin Djidi
1:02:21
1:02:21
Riproduci in seguito
Riproduci in seguito
Liste
Like
Like aggiunto
1:02:21Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-191-popsink-avec-benjamin-djidi ------------------ Cette publication est sponsorisée par Datatask et CerenIT. CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. E…
…
continue reading
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-190-databricks-dbrx-avec-quentin-ambard ------------------ Cette publication est sponsorisée par Datatask et CerenIT. CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données tempor…
…
continue reading
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-189-la-compta-du-futur-et-autres-news/ ------------------ Cette publication est sponsorisée par Datatask et CerenIT. CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données tempore…
…
continue reading

1
Episode 47 : PostgreSQL : MVCC et Vacuum – PowerBI : Analyser les performances – Modélisation One Big Table et le stockage colonne à la rescousse – Détection d’anti-pattern dans MSSQL
Retour pgday Paris.PostgreSQL : MVCC et Vacuum.PowerBI : Analyser les performances et quelques conseils pour les optimiser.OBT : modélisation One Big Table et le stockage colonne à la rescousse.Clause Non-Sargable et détection d'anti-pattern avec les extended events sur MSSQLDi Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
…
continue reading
Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-188-data-ops-avec-matthieu-rousseau/ ------------------ Cette publication est sponsorisée par Datatask et CerenIT. CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporell…
…
continue reading
Di Vincent Heuschling, Alexander Dejanovski, Jérôme Mainaud, Nicolas Steinmetz
…
continue reading

1
Episode 46 : Adrien Nayrat nous rejoint pour parler postgresql – DuckDB v0.10 – C/C++ bannis par les USA ?
Adrien Nayrat un spécialiste postgresql rejoint l'équipe Dataoops, il se présente et en profite pour nous rappeler l'histoire de postgresql et glisser quelques conseils sur les extensions. La deuxième partie concerne DuckDB et les nouveautés de la v0.10 ainsi que des remarques sur une nouvelle concernant les languages C/C++ considérés comme "à risq…
…
continue reading

1
Episode 186 : plus jQuery que Terraform
1:06:57
1:06:57
Riproduci in seguito
Riproduci in seguito
Liste
Like
Like aggiunto
1:06:57Retrouvez les liens de cet épisode dans les shownotes sur https://bigdatahebdo.com/podcast/episode-186-plus-jquery-que-terraform/ ------------------ Cette publication est sponsorisée par Datatask et CerenIT. CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ec…
…
continue reading
* La Nuit de la Data et de l'IA - And the winners are... : -> https://www.republikgroup-it.fr/palmares-2024-tda * IA ACT * Probabl is a new AI company built around popular library scikit-learn -> https://techcrunch.com/2024/02/01/probabl-is-a-new-ai-company-built-around-popular-library-scikit-learn/ * From Silos to Standardization: Leveraging DBT f…
…
continue reading

1
Episode 45 : Chargement massif 1 Milliard de lignes dans un columnstore SQL Server en 6min, DuckDB v0.10, MS Fabrics et Vacuum
1:07:09
1:07:09
Riproduci in seguito
Riproduci in seguito
Liste
Like
Like aggiunto
1:07:09Comment accélérer un chargement massif dans un columnstore sur SQL Server : un retour d'expérience approfondi avec 1 milliard de lignes chargé en 6 minutes.DuckDB passe en v0.10 et stabilise son stockage.MS Fabric annonce que le Vacuum sera bientot possible et voici pourquoi c'est une bonne chose...Di Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
…
continue reading
Shownotes sur : https://bigdatahebdo.com/podcast/episode-184-pour-une-poignee-de-dollars/Di Vincent Heuschling, Alexander Dejanovski, Jérôme Mainaud, Nicolas Steinmetz
…
continue reading
### Promptologues * How to Cut RAG Costs by 80% Using Prompt Compression -> https://towardsdatascience.com/how-to-cut-rag-costs-by-80-using-prompt-compression-877a07c6bedb * Prompt Compression avec LLMLingua -> https://github.com/microsoft/LLMLingua ### LLM Infra* Introducing Pinecone Serverless -> https://www.pinecone.io/blog/serverless/ * embedch…
…
continue reading
Shownotes sur : https://bigdatahebdo.com/podcast/episode-182-zuck-fabric-une-agi-avec-des-data-contracts/Di Vincent Heuschling, Alexander Dejanovski, Jérôme Mainaud, Nicolas Steinmetz
…
continue reading

1
Episode 44 : REX dataoops modélisation et postgresql performance, DuckDB stars, MS Fabric ratio prix/performance
1:06:09
1:06:09
Riproduci in seguito
Riproduci in seguito
Liste
Like
Like aggiunto
1:06:09REX sur des erreurs de modélisation avec des vues trop imbriquées, performance postgresql windows vs linux. DuckDB une star sur Github qui rejoint Postgresql. MS Fabric des prix d'appel pour les entreprises avec un ratio prix/performance attractif.Di Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
…
continue reading
Shownotes sur : https://bigdatahebdo.com/podcast/episode-181-le-maestro-du-gptstore/Di Vincent Heuschling, Alexander Dejanovski, Jérôme Mainaud, Nicolas Steinmetz
…
continue reading
https://bigdatahebdo.com/podcast/episode-180-quelques-news-pour-demarrer-2024/Di Vincent Heuschling, Alexander Dejanovski, Jérôme Mainaud, Nicolas Steinmetz
…
continue reading

1
Episode 43 : bilan 2023 une année spéciale pour la data avec l’émergence de l’IA et la progression des stockages objets et lakehouse
1:02:01
1:02:01
Riproduci in seguito
Riproduci in seguito
Liste
Like
Like aggiunto
1:02:01Episode 43 : bilan 2023 avec les lakehouses, la gouvernance des données, les bases de données vectorielles, les IA génératives et autres LLM, Oracle Cloud et les bases AutonomousDi Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
…
continue reading

1
Episode 179 : 2023 en revue et quelques prédictions pour 2024
1:28:04
1:28:04
Riproduci in seguito
Riproduci in seguito
Liste
Like
Like aggiunto
1:28:04Di Vincent Heuschling, Alexander Dejanovski, Jérôme Mainaud, Nicolas Steinmetz
…
continue reading

1
Episode 42 : MSSQL Server replication oops / Qdrant, PostgresML et LanceDB / chdb / tpch / oracle autonomous db
Episode timelineDi Romain Ferraton, Fabien Beaumont, Eric Duquesnoy
…
continue reading
Onyxia est une UX open source pour mettre en place un datalab avec des services basés sur des containers et orchestrés par K8s. Minio pour le stockage, Keycloak et Vault pour la sécurité s'intègre parfaitement.Cette solution est mise en oeuvre à l'INSEE avec le datalab SSP et Frederic Comte, Architecte Data à l'INSEE nous en explique les fondements…
…
continue reading