Petr Šimeček
Původním vzděláváním biostatistik, pak kapitán křišťálové koule pro predikci časových řad ve společnosti Google; v současné době splétá uzly na proteinech pro CEITEC MU a krotí lamy pro Mediaboard.
this talk will be in Czech only
ChatGPT získal 100 milionů uživatelů rychleji než jakákoli jiná platforma před ním. Tahle prezentace nabídne vstupenku do rychle se měnícího světa AI.
Zaměříme se především na češtinu a slovenštinu (proto bude i samotná přednáška česky). Umí ChatGPT psát básně? Mluví hantecem? Jaké chyby ChatGPT/GPT4 dělá? Jak jej ovládat z Pythonu skrze API. Projdeme též alternativy k ChatGPT jako Claude (Anthropic), Bard (Google) a Bing Chat (Microsoft).
Vysvětlíme si, jak jsou velké jazykové modely trénovány a jak si s češtinou poradí ty dostupné pro komerční užití jako OpenLlama, Dolly, MPT, Falcon a především Llama2. Ukážeme si, jak je získat z veřejného úložiště HuggingFace a jak je dotrénovat na specifický problém pomocí 4 či 8-bitové kvantizace a LoRA adaptoru.
Původním vzděláváním biostatistik, pak kapitán křišťálové koule pro predikci časových řad ve společnosti Google; v současné době splétá uzly na proteinech pro CEITEC MU a krotí lamy pro Mediaboard.