Čtvrtek 25. dubna 2024

Vyhledat

17. 4. 2023 13:07

Osm věcí, které musíte vědět o ChatGPT

Samuel R. Bowman sepsal článek Osm věcí, které je třeba vědět o velkých jazykových modelech. ChatGPT a spol. (velké jazykové modely – Large Language Model, LLM) jsou sledovány často s obavami, například ze zkreslení či chování.

hlavní ekonom České spořitelny

Osm věcí, které musíte vědět o ChatGPT Foto: Shutterstock.com

Co bychom o nich tedy měli vědět?

1. LLM vykazují předvídatelné zlepšení s rostoucími náklady, a to i bez výrazných inovací.

To umožňuje výzkumným a vývojovým týmům navrhovat projekty trénování modelů v hodnotě mnoha milionů USD s přiměřenou jistotou, že se jim podaří vytvořit ekonomicky hodnotné systémy.

Zákon škálování umožňuje přesně předpovědět některá hrubá, ale užitečná měřítka toho, jak schopné budou budoucí modely, když je budeme škálovat ve třech dimenzích: množství dat, velikost (měřeno v parametrech) a množství výpočtů použitých k trénování (měřeno v FLOP).

Původní GPT nebyl schopen vytvářet souvislý text. GPT-2 přidal schopnost produkovat přiměřeně kvalitní text a omezenou schopnost sledovat jednoduché instrukce. GPT- 3 byl první moderní univerzální LLM a je skutečně užitečný v široké škále jazykových úloh.

2. Se zvýšenými náklady na výcvik se však mohou nepředvídatelně objevit specifické dovednosti, takže je obtížné předvídat, kdy bude model schopen plnit určité úkoly.

Rozložení kvality modelu v jednotlivých úlohách ukázalo, že malé a střední modely měly omezené schopnosti, zatímco u větších modelů došlo k výraznému zvýšení výkonnosti.

Investování do LLM je investicí do blackboxu: máme přiměřenou jistotu, že získáme hromadu nových cenných dovedností. Ale nejsme schopni jistotou předpovědět, jaké dovednosti to budou.

3. LLM jsou schopny učit se a používat reprezentace vnějšího světa, jak se ukázalo u modelů vycvičených ke hraní deskových her na základě textových popisů tahů.

To znamená, že mohou porozumět takovým věcem, jako jak vypadá kočka nebo co dělá auto, i když je nikdy v životě neviděly. Dělají to tak, že analyzují slova a věty v textu, na kterém jsou trénovány, a vytvářejí mezi nimi souvislosti.

Pokud si například učící se LLM přečte větu typu Kočka seděla na parapetu, může se naučit, že kočka je zvíře, které má srst, vousy a čtyři nohy a že může sedět na věcech, jako jsou parapety. Tuto znalost pak může použít k vytvoření nových vět o kočkách, jako například Černá kočka honila myš nebo Chlupatá kočka vrněla, když ji někdo hladil.

LLM se ale mohou dopustit chyb nebo přijít s nepravdivými informacemi, zejména pokud nejsou vyškoleni v rozmanitých textech. I když se tedy mohou dozvědět o světě, stále musíme být opatrní v tom, jak je používáme a jaké informace jim svěřujeme.

4. V současné době neexistují spolehlivé metody řízení chování LLM, a to i přes pokrok při zmírňování různých problémů, jako je učení ze zpětné vazby.

Narůstají obavy, že tyto problémy se v budoucích rozsáhlých systémech mohou stát katastrofálními. Zjednodušeně řečeno, LLM jsou jako opravdu chytří roboti, kteří dokáží porozumět jazyku a generovat jej. Jsou však tak chytré, že je těžké kontrolovat, co říkají nebo dělají. Je to jako snažit se kontrolovat opravdu chytrého kamaráda, který občas říká věci, které nečekáte. Někdy mohou tito roboti dělat chyby nebo říkat věci, které nejsou pravdivé, a je těžké zjistit proč. Vědci se stále snaží přijít na to, jak tyto roboty přimět, aby se chovali lépe a dělali to, co po nich chceme.

5. Odborníci v současné době nejsou schopni interpretovat vnitřní fungování LLM, protože neexistuje metodika, která by umožnila vyjádřit, jaké znalosti, úvahy nebo cíle model používá k vytváření výsledků.

Moderní velké jazykové modely jsou postaveny na umělých neuronových sítích, které jsou volně modelovány podle lidských neuronů. Vědci nejsou schopni interpretovat vnitřní fungování těchto modelů, což znamená, že nedokážou vysvětlit, jaké znalosti, úvahy nebo cíle model používá, když vytváří nějaký výstup.

6. LLM mají potenciál překonat člověka v mnoha úlohách, i když jsou vycvičeny tak, aby napodobovaly chování člověka při psaní, jak se ukázalo v užších úlohách, jako je například hraní šachů.

LLM mohou potenciálně překonat člověka v mnoha úlohách, protože jsou vycvičeny na mnohem větším množství dat, než jaké vidí člověk, a mohou být dodatečně vycvičeny pomocí posilování učení. To znamená, že modely LLM mají přístup k většímu množství informací a mohou se naučit vytvářet odpovědi, které jsou užitečnější než odpovědi, které dokáže vytvořit člověk.

Představte si, že se snažíte naučit řešit matematický problém. Máte k dispozici učebnici s několika příklady, ale velký jazykový model má přístup k mnoha učebnicím s tisíci příklady. Čím více příkladů model má, tím lépe se může naučit, jak problém vyřešit.

Kromě toho lze modelu poskytnout další pomoc, jako je doučování, aby se naučil řešit problém ještě lépe. To je podobné tomu, jak lze modelům LLM poskytnout posilování učení, aby se zlepšil jejich výkon.

7. LLM nemusí vyjadřovat hodnoty svých tvůrců nebo hodnoty zakódované ve vzorku z internetu.

Když prostý předtrénovaný LLM vytvoří text, bude se tento text obecně podobat textu, na kterém byl trénován. To zahrnuje podobnost v hodnotách vyjádřených textem. Tyto hodnoty však podléhají dobré míře kontroly ze strany jejich vývojářů, zejména když je prostý předtrénovaný LLM dále podněcován a trénován, aby byl přizpůsoben pro nasazení jako produkt. To znamená, že hodnoty vyjádřené v chování nasazeného LLM nemusí odrážet nějaký průměr hodnot vyjádřených v jeho tréninkových datech.

8. Počáteční hodnocení LLM může být zavádějící, protože pečlivě vytvořená výzva nebo příklad mohou výrazně zlepšit jeho výkon a odhalit jeho skutečné schopnosti.

LLM mohou být citlivé na obsah instrukcí idiosynkratickým způsobem a často nedokážou splnit zadanou úlohu. Jakmile je však nalezen vhodný způsob, jak modelu zadat úkol, může model konzistentně podávat dobré výkony v různých případech úlohy. LLM sice rozumí jazyku, ale někdy je může zmást způsob, jakým je otázka položena. To znamená, že nemusí být vždy schopni splnit úkol správně napoprvé, ale pokud je otázka přeformulována nebo mírně změněna, mohou úkol splnit správně.

Je to podobné, jako když požádáte kamaráda o pomoc s matematickou úlohou – pokud mu ji nevysvětlíte jasně, nemusí vám být schopen pomoci, ale pokud ji vysvětlíte jinak, může vám ji pomoci vyřešit.

Téměř 90 % domácností ušetří na energiích

Čína hromadí zásoby kritických komodit

TIC BRNO boduje na poli cestovního ruchu

Trhy v korekci, co bude dál

Rok 2027 narovná mzdy mezi muži a ženami

Rozmar moderního člověka, nebo udržitelnější způsob nakupování?

Revoluční služba Office as a service

Pokrok a Čína

Evropa vyslyšela požadavky českých podnikatelů

Vítězí smysl pro detail a tradice

Osm věcí, které musíte vědět o ChatGPT

Články autora David Navrátil

Pokrok a Čína

Obezita, Londýn, soláry a tři kila

Epidemie obezity

Maniodepresivní Češi, koncepty, Čína vs. EU a energie

Dostupnost bydlení: Kdo umí, ten staví

Bitcoin a konec konce světa

Hrozí Česku nedostatek písku?

Bohaté Německo s nebohatými Němci

Dopady AI: práce a úrokové sazby

Narativy, inovace, klam a tření

Konflikty, zelené investice, energie, zombie jeleni a AI

Jak nepanikařit?

Čeká nás slušný fičák?

Je globální válka jen teoretickou možností?

Bez kvalitního vzdělání, a tedy učitelů není prosperita možná

Jazýčkem na vahách bude plyn

Recese, Hook 2.0 a populisté

Pozitivní účinek změn nespadne jen tak z nebe

Čínský omyl a německý trh práce

Příliš koncentrované inovace brání vyššímu růstu produktivity

Finanční stres snižuje IQ

Může ČNB snížit potenciál české ekonomiky?

Kolik chyb dělají dobré týmy

Letem světem: blbá nálada is all around

Bude budoucnost horší než současnost?

Profese, které čeká pokles a čínský náskok

Chaos, žebřík a hra na prázdné židle

V Česku za Evropou silně zaostáváme

Cena za strach? Zákaz levné energie stojí miliony životů!

Politika zvýší náklady spojené s klimatickou změnou

Špatné zprávy: Česko dusí německá chřipka

Meze státu: Zlí úředníci versus procesy

Otázka dne: Blíží se konec inflace v Čechách?

Česko je v pasti ekonomiky středních příjmů

Na houpačky do lunaparku smějí jen někteří

Turchinůlv model úpadku: Může za to nerovnost