Artwork

Contenuto fornito da Deep Learning Deep Dive. Tutti i contenuti dei podcast, inclusi episodi, grafica e descrizioni dei podcast, vengono caricati e forniti direttamente da Deep Learning Deep Dive o dal partner della piattaforma podcast. Se ritieni che qualcuno stia utilizzando la tua opera protetta da copyright senza la tua autorizzazione, puoi seguire la procedura descritta qui https://it.player.fm/legal.
Player FM - App Podcast
Vai offline con l'app Player FM !

Episode #2: DALL-E and friends in image generation

1:51:27
 
Condividi
 

Manage episode 336489917 series 3274640
Contenuto fornito da Deep Learning Deep Dive. Tutti i contenuti dei podcast, inclusi episodi, grafica e descrizioni dei podcast, vengono caricati e forniti direttamente da Deep Learning Deep Dive o dal partner della piattaforma podcast. Se ritieni che qualcuno stia utilizzando la tua opera protetta da copyright senza la tua autorizzazione, puoi seguire la procedura descritta qui https://it.player.fm/legal.

Andrej Karpathy and Justin Johnson deep dive into OpenAI's DALL-E and use it as an anchor point to recurse into some of the recent work in AI on image generation. Approximate agenda:

DALL-E Blog Post:
https://openai.com/blog/dall-e/

ImageGPT
https://openai.com/blog/image-gpt/

VQ-VAE
https://arxiv.org/abs/1711.00937

VQ-VAE-2
https://arxiv.org/abs/1906.00446

Gumbel-Softmax / Concrete Distribution
https://arxiv.org/abs/1611.01144
https://arxiv.org/abs/1611.00712

VQGAN
https://arxiv.org/abs/2012.09841

Andrej's attempted re-implementation of VQVAE and GumbelSoftmax:
https://github.com/karpathy/deep-vector-quantization/blob/main/model.py

You can see a video version of this episode on YouTube:
https://www.youtube.com/watch?v=gMc90bqHMSM

We reached out to all speakers and obtained their written consent to appear in this recording.

  continue reading

2 episodi

Artwork
iconCondividi
 
Manage episode 336489917 series 3274640
Contenuto fornito da Deep Learning Deep Dive. Tutti i contenuti dei podcast, inclusi episodi, grafica e descrizioni dei podcast, vengono caricati e forniti direttamente da Deep Learning Deep Dive o dal partner della piattaforma podcast. Se ritieni che qualcuno stia utilizzando la tua opera protetta da copyright senza la tua autorizzazione, puoi seguire la procedura descritta qui https://it.player.fm/legal.

Andrej Karpathy and Justin Johnson deep dive into OpenAI's DALL-E and use it as an anchor point to recurse into some of the recent work in AI on image generation. Approximate agenda:

DALL-E Blog Post:
https://openai.com/blog/dall-e/

ImageGPT
https://openai.com/blog/image-gpt/

VQ-VAE
https://arxiv.org/abs/1711.00937

VQ-VAE-2
https://arxiv.org/abs/1906.00446

Gumbel-Softmax / Concrete Distribution
https://arxiv.org/abs/1611.01144
https://arxiv.org/abs/1611.00712

VQGAN
https://arxiv.org/abs/2012.09841

Andrej's attempted re-implementation of VQVAE and GumbelSoftmax:
https://github.com/karpathy/deep-vector-quantization/blob/main/model.py

You can see a video version of this episode on YouTube:
https://www.youtube.com/watch?v=gMc90bqHMSM

We reached out to all speakers and obtained their written consent to appear in this recording.

  continue reading

2 episodi

Tutti gli episodi

×
 
Loading …

Benvenuto su Player FM!

Player FM ricerca sul web podcast di alta qualità che tu possa goderti adesso. È la migliore app di podcast e funziona su Android, iPhone e web. Registrati per sincronizzare le iscrizioni su tutti i tuoi dispositivi.

 

Guida rapida

Ascolta questo spettacolo mentre esplori
Riproduci