O co jde v žalobě Getty Images

V minulém roce došlo k nebývalému rozmachu modelů umělé inteligence (AI). Modelů, které toho spoustu umí, a navíc se pořád učí. Problémem je ovšem způsob, jak se učí. Většinou to dělají tak, že identifikují a kopírují vzory v souborech dat. Pokud jsou ale vstupní data chráněna autorským právem, dochází ke konfliktu mezi původními tvůrci obsahu a databází a mezi tvůrci generativních systémů AI.

Konkrétním příkladem je spor mezi americkou fotobankou Getty Images, která podala žalobu proti americké společnosti se sídlem v Londýně, Stability AI, Inc. Žaloba, ze které v dalším textu vycházím, je ze dne 3.2.2023.

obrázek vytvořený pomocí DALLE-E2

autor pokynů: Hana Krajčíková

Co v žalobě tvrdí Getty Imges

Getty Images tvrdí, že Stability AI zkopírovala více než 12 milionů fotografií z kolekce Getty Images chráněných copyrightem, a to společně s doprovodným textem a metadaty. Učinila tak bez svolení Getty Images a jakékoli kompenzace. Úmyslem bylo trénovat Stable Diffusion model a vytvořit tak konkurenční produkt k produktu Getty Images. To se podařilo a Stability AI se stala přímým konkurentem Getty Images všude tam, kde zákazník hledá kreativní obrázky. Obchodní úspěch Stability AI je tak přímo postaven na zneužití obsahu Getty Images.

Stability AI se přitom podle tvrzení Getty Images ani nepokusila licenci pro uvedené užití fotografií vyjednat. Snímky užila neoprávněně a přesto, že podmínky užití Getty Images takové neschválené kopírování obsahu k obchodním účelům výslovně zakazují.

Jak mělo učení umělé inteligence fakticky probíhat

Podle tvrzení uvedených v žalobě probíhal proces učení následovně:

Stability AI zkopírovala miliardy textových a obrazových dvojic a nahrála je do paměti počítače, aby trénovala model.
Stability AI zakódovala obrázky, přičemž vytvořila menší verze původních obrázků, tak aby zabíraly méně paměti. Samostatně zakódovala také spárovaný text. AI přitom uchovávala a ukládala kopie zakódovaných obrázků a textu jako základní prvek trénování modelu.
Do kódovaných obrázků přidala Stability AI vizuální „šum“, tedy dále měnila obrázky tak, že bylo postupně obtížnější rozeznat, co na nich je, protože byla záměrně snížena vizuální kvalita obrázků. Účelem bylo „vytrénování“ modelu k odstranění „šumu“. Stability AI tak učila model generovat výstupní obrázky tak, aby odpovídaly konkrétnímu textovému popisu (např. „pes hrající si na pláži při západu slunce“).
Model dekódoval změněný obraz a naučil se odstraňovat šum porovnáním dekódovaného obrázku s původním obrázkem a textovými popisy, které byly zkopírovány a uloženy. Tím, že se model naučil dekódovat šum, se naučil poskytovat obrázky podobné, někdy dokonce téměř stejné jako originál bez šumu.

Kopírování a učení mělo probíhat ve více stupních a s využitím německé entity LAION. Pro představu jsou ale podstatné uvedené čtyři kroky.

Jaká je česká právní úprava

Novela Autorského zákona přinesla zásadní změnu v ustanovení § 39c, která se týká licence k rozmnožování díla pro účely automatizované analýzy textů nebo dat. Podle uvedeného ustanovení nezasáhne do práva autorského ten, kdo za uvedeným účelem zhotoví rozmnoženinu díla, ale takovouto rozmnoženinu je oprávněn uchovat jen po dobu nezbytně nutnou pro účely této analýzy. Autor přitom může takové užití zakázat.

Novela AZ také aktualizovala ustanovení §90, které se týká užití obsahu databází ve vztahu k pořizovateli databáze. Pořizovatel databáze je ten, kdo investoval podstatné úsilí a zdroje do vytvoření databáze. Jen on může užít celý obsah databáze nebo jeho kvantitativně nebo kvalitativně podstatnou část. A jen on může udělit oprávnění k takovému užití někomu jinému.

Mimo to mohou být databáze podle ustanovení §2 AZ chráněny také jako souborné autorské dílo, pokud jsou způsobem výběru nebo uspořádáním obsahu vlastním duševním výtvorem autora.

Bylo by jednání Stability AI v souladu s českou úpravou?

Soubor obrázků Getty Images spolu s jejich textovými popisy a metadaty je každopádně databází, do jejíž tvorby Getty Images podle vlastních slov investovala mnoho času, úsilí a financí. Getty Images tvrdí, že Stability AI oprávnění k užití obrázků za účelem trénování modelu umělé inteligence neudělila. Ba co víc, že takové užití bylo výslovně zakázáno v jejich všeobecných podmínkách.

Po novele by bez takového souhlasu mohla Stability AI pouze analyzovat text a data a hledat vztahy mezi nimi. Getty Images totiž uvedené užití sice zakázala, ovšem pravděpodobně nikoli strojově čitelnými prostředky. V uvedeném případě ale navíc mělo docházet k neoprávněnému rozmnožování obrázků spolu s texty a metadaty. Podle žaloby byly tyto rozmnoženiny uchovávány a ukládány, byly měněny a zřejmě také v určité změněné verzi používány ve výsledku poskytovaném AI. Tímto způsobem byla navíc užita podstatná část uvedené databáze.

Roztomilým detailem pak byla pokroucená označení Getty Images na „originálních“ obrázcích vytvořených Stability AI. Getty Images toto samozřejmě roztomilé nepřipadalo a uvedené uplatnila jako další samostatný nárok v žalobě.

Počínání Stability AI by tak nebylo v souladu ani s českou úpravou Autorského zákona. Zejména kvůli uchovávání a ukládání rozmnoženin obrázků a textů a jejich dalšímu užívání.

Soud by navíc mohl uvedené jednání posoudit také jako nekalou soutěž a poškození dobrého jména a značky Getty Images.

Hana Krajčíková

Hana Krajčíková je advokátka, která pomáhá firmám a podnikatelům v IT a kreativních profesích (akkrajcikova.cz). Má dlouholeté zkušenosti z advokacie a fandí mediaci jako mimosoudnímu způsobu řešení konfliktů. Kromě toho ji baví vše, co souvisí s právem a uměním.

Ve volném čase se věnuje parkouru, hudbě a podpoře místní komunity Soběšice dětem.