Etická problematika trénování velkých jazykových modelů

Seminární práci do předmětu Online žurnalistika napsala Bc. Lucie Riedlová.

Od svého oficiálního vydání 30. listopadu 2022 (Marr 2023) ovlivnil ChatGPT (a jemu podobné nástroje) spoustu aspektů v našem životě v návaznosti na rychlý a obrovský rozvoj umělé inteligence jako takové. Nástroje generativní AI nám umožňují zvyšovat produktivitu, zefektivňovat práci, automatizaci některých úkonů. Jak v soukromém životě, tak i ve spoustě jednotlivých profesí. Je ale nutné neustále mít na paměti, že se s umělou inteligencí a jejím využíváním vážou určitá rizika a etické otázky.

V této práci se budu zabývat velkými jazykovými modely, pod kterými si lze představit třeba již zmiňovaný ChatGPT od společnosti OpenAI. Hlavní část se bude týkat toho, na jakých zdrojích tyto modely fungují a jaké etické problémy s tím souvisí: Jaké jsou nejpopulárnější datové sady, jaký je rozdíl mezi jedno a více jazyčnými korpusy, jakým způsobem souvisí zdrojová data s ochranou soukromí, stereotypizací, zaujatostí nebo „halucinováním“ jazykových modelů a jakým způsobem s trénováním velkých jazykových modelů souvisí crowdsourcingové agentury. V neposlední řadě bych se ráda zaměřila na vztah mezi vývojem a tréninkem modelů umělé inteligence a ochranou životního prostředí, což je další důležité etické téma, které nám rozvoj umělé inteligence otevírá.