Artwork

Contenuto fornito da Brian Olsen and Trino Community. Tutti i contenuti dei podcast, inclusi episodi, grafica e descrizioni dei podcast, vengono caricati e forniti direttamente da Brian Olsen and Trino Community o dal partner della piattaforma podcast. Se ritieni che qualcuno stia utilizzando la tua opera protetta da copyright senza la tua autorizzazione, puoi seguire la procedura descritta qui https://it.player.fm/legal.
Player FM - App Podcast
Vai offline con l'app Player FM !

45: Trino swimming with the DolphinScheduler

1:54:46
 
Condividi
 

Manage episode 358485307 series 2796878
Contenuto fornito da Brian Olsen and Trino Community. Tutti i contenuti dei podcast, inclusi episodi, grafica e descrizioni dei podcast, vengono caricati e forniti direttamente da Brian Olsen and Trino Community o dal partner della piattaforma podcast. Se ritieni che qualcuno stia utilizzando la tua opera protetta da copyright senza la tua autorizzazione, puoi seguire la procedura descritta qui https://it.player.fm/legal.

DolphinScheduler is a popular Apache data workflow orchestrator that enables running complex data pipelines. They recently added a Trino integration and will be demonstrating how to use DolphinScheduler to enable a series of transformations on the data lakehouse with Trino.

- Intro Music: 0:00

- Intro: 0:31

- Trino release 407: 13:22

- What is workflow orchestration?: 21:12

- Why do we need a workflow orchestration tool for building a data lake?: 31:07

- What is Apache DolphinScheduler?: 37:35

- Does DolphinScheduler have any computing engine or storage layer?: 53:11

- What are the differences with other workflow orchestration, such as Apache Airflow?: 58:46

- Demo: Creating a simple Trino workflow in DolphinScheduler: 1:26:44

- PR: Improve performance of Parquet files: 1:47:04

Show Notes: https://trino.io/episodes/45

Show Page: https://trino.io/broadcast/

  continue reading

59 episodi

Artwork
iconCondividi
 
Manage episode 358485307 series 2796878
Contenuto fornito da Brian Olsen and Trino Community. Tutti i contenuti dei podcast, inclusi episodi, grafica e descrizioni dei podcast, vengono caricati e forniti direttamente da Brian Olsen and Trino Community o dal partner della piattaforma podcast. Se ritieni che qualcuno stia utilizzando la tua opera protetta da copyright senza la tua autorizzazione, puoi seguire la procedura descritta qui https://it.player.fm/legal.

DolphinScheduler is a popular Apache data workflow orchestrator that enables running complex data pipelines. They recently added a Trino integration and will be demonstrating how to use DolphinScheduler to enable a series of transformations on the data lakehouse with Trino.

- Intro Music: 0:00

- Intro: 0:31

- Trino release 407: 13:22

- What is workflow orchestration?: 21:12

- Why do we need a workflow orchestration tool for building a data lake?: 31:07

- What is Apache DolphinScheduler?: 37:35

- Does DolphinScheduler have any computing engine or storage layer?: 53:11

- What are the differences with other workflow orchestration, such as Apache Airflow?: 58:46

- Demo: Creating a simple Trino workflow in DolphinScheduler: 1:26:44

- PR: Improve performance of Parquet files: 1:47:04

Show Notes: https://trino.io/episodes/45

Show Page: https://trino.io/broadcast/

  continue reading

59 episodi

Tutti gli episodi

×
 
Loading …

Benvenuto su Player FM!

Player FM ricerca sul web podcast di alta qualità che tu possa goderti adesso. È la migliore app di podcast e funziona su Android, iPhone e web. Registrati per sincronizzare le iscrizioni su tutti i tuoi dispositivi.

 

Guida rapida