Artwork

Contenuto fornito da Sigurd Schacht, Carsten Lanquillon, Sigurd Schacht, and Carsten Lanquillon. Tutti i contenuti dei podcast, inclusi episodi, grafica e descrizioni dei podcast, vengono caricati e forniti direttamente da Sigurd Schacht, Carsten Lanquillon, Sigurd Schacht, and Carsten Lanquillon o dal partner della piattaforma podcast. Se ritieni che qualcuno stia utilizzando la tua opera protetta da copyright senza la tua autorizzazione, puoi seguire la procedura descritta qui https://it.player.fm/legal.
Player FM - App Podcast
Vai offline con l'app Player FM !

Episode 118 -Sleeper Agent - Backdoors in Sprachmodellen

27:58
 
Condividi
 

Manage episode 406099931 series 2911119
Contenuto fornito da Sigurd Schacht, Carsten Lanquillon, Sigurd Schacht, and Carsten Lanquillon. Tutti i contenuti dei podcast, inclusi episodi, grafica e descrizioni dei podcast, vengono caricati e forniti direttamente da Sigurd Schacht, Carsten Lanquillon, Sigurd Schacht, and Carsten Lanquillon o dal partner della piattaforma podcast. Se ritieni che qualcuno stia utilizzando la tua opera protetta da copyright senza la tua autorizzazione, puoi seguire la procedura descritta qui https://it.player.fm/legal.

Heute sprechen wir über Hintertüren bei Sprachmodellen und was dies für die Sicherheit von LLMs bedeutet. Wir zeigen auf wie Backdoors entstehen könnten und diskutieren die Konsequenz daraus.
Eine spannende Sendung. Hören Sie rein.
Sleeper Agents: https://arxiv.org/abs/2401.05566
Poisoning Language Models During Instruction Tuning https://arxiv.org/abs/2305.00944

Support the Show.

  continue reading

175 episodi

Artwork
iconCondividi
 
Manage episode 406099931 series 2911119
Contenuto fornito da Sigurd Schacht, Carsten Lanquillon, Sigurd Schacht, and Carsten Lanquillon. Tutti i contenuti dei podcast, inclusi episodi, grafica e descrizioni dei podcast, vengono caricati e forniti direttamente da Sigurd Schacht, Carsten Lanquillon, Sigurd Schacht, and Carsten Lanquillon o dal partner della piattaforma podcast. Se ritieni che qualcuno stia utilizzando la tua opera protetta da copyright senza la tua autorizzazione, puoi seguire la procedura descritta qui https://it.player.fm/legal.

Heute sprechen wir über Hintertüren bei Sprachmodellen und was dies für die Sicherheit von LLMs bedeutet. Wir zeigen auf wie Backdoors entstehen könnten und diskutieren die Konsequenz daraus.
Eine spannende Sendung. Hören Sie rein.
Sleeper Agents: https://arxiv.org/abs/2401.05566
Poisoning Language Models During Instruction Tuning https://arxiv.org/abs/2305.00944

Support the Show.

  continue reading

175 episodi

Tutti gli episodi

×
 
Loading …

Benvenuto su Player FM!

Player FM ricerca sul web podcast di alta qualità che tu possa goderti adesso. È la migliore app di podcast e funziona su Android, iPhone e web. Registrati per sincronizzare le iscrizioni su tutti i tuoi dispositivi.

 

Guida rapida