Dzieła stworzone przez tysiące pisarzy trafiły do bazy danych wykorzystywanych przez narzędzia sztucznej inteligencji – piszą od kilku dni międzynarodowe media. Jak się okazuje, bezprawnie wykorzystywane miały być m.in. książki Zadie Smith czy George’a Saundersa.
O sztucznej inteligencji głośno jest od kilkunastu miesięcy. Choć część środowiska artystycznego widzi w nich ogromne zagrożenie, niektórzy wskazują także na pozytywne aspekty sztucznej inteligencji w procesie twórczym. By AI mogło się jednak rozwijać, potrzebuje danych, dzięki którym się doskonali. Jak się okazuje, teraz wykorzystywane miały być do tego powieści popularnych twórców.
Sztuczna inteligencja odpowie słowami znanych pisarzy?
O sprawie pierwszy napisał „The Atlantic”, a tuż za nim brytyjski „The Guardian”. W „Guardianie” wskazana zostaje również sprawa sądowa, od której wszystko się zaczęło: złożony przed miesiącem pozew o naruszenie dóbr osobistych autorów trojga autorów: Sarah Silverman, Richarda Kadreya oraz Christophera Goldena, których książki wykorzystane zostały w ramach szkolenia AI w projekcie modeli językowych LLaMA wydanych przez Meta.
Chodzi o zbiór „Books3”, który zgromadził tysiące różnych utwory literackich – w tym zarówno prozy, jak i literatury faktu. Dzieła znanych twórców – takich jak Stephen King, Margaret Atwood, Haruki Murakami, ale także Jonathan Franzen, Rebecca Solnit czy George Saunders – miały pojawić się bezprawnie w bazie, którą następnie w swoich pracach nad AI wykorzystywały największe technologiczne firmy.
Sztuczna inteligencja czyta książki?
W ramach zbioru „Books3” miało znaleźć się ponad 30 tysięcy książek wydawanych nakładem Penguin Random House. Według „Guardiana” wykorzystano także tysiące książek wydawnictwa HarperCollins, Macmillan oraz Oxford University Press. Większość z książek miała zostać napisana w ciągu ostatnich dwudziestu lat. Oczywiście, książki nie posłużyły sztucznej inteligencji do samej przyjemności lektury. Chodziło o wykorzystywanie stworzonych przez pisarzy zdań jako swoistych wzorców, dzięki którym programiści mogli lepiej „trenować” rozwijane modele językowe sztucznych inteligencji.
Czytaj także: Cenzura książek trwa. Sztuczna inteligencja usunęła z bibliotek książki Toni Morrison oraz Mayi Angelou
Jak komunikuje serwis interestingengineering.com, zbiór „Books3” zawierał łącznie ponad 200 tysięcy książek. Baza miała zostać już usunięta ze strony internetowej, która rozwija badania nad sztuczną inteligencją w ramach rozwiązań open source. Żądanie usunięcia złożyć miała m.in. grupa Rights Alliance, która reprezentowała wydawców i autorów z Danii. W bazie znaleziono utwory ponad 150 duńskich twórców.