Meta kan fortsätta sno böcker för att AI-träna
Zuckerberg fintar upp författarna på läktaren
I januari avslöjades att Mark Zuckerbergs bolag Meta laddat ner miljontals piratkopierade böcker. Syftet: att träna sin AI-modell Llama 3. Nya avslöjanden visar att Zuckerberg själv godkände att företaget tankade hem från det kontroversiella ”skuggbiblioteket” Libgen. Även svenska böcker finns i datadumpen. En snabb sökning ger mig Karin Smirnoff, Sara Stridsberg och Johannes Anyuru på flera språk.
Diskussioner fördes om att i stället betala förlagen för tillgången, men interna chattloggar visar att man tyckte att det var ”orimligt dyrt”. Och Meta behövde verkligen böckerna. Som en senior chef på Meta skriver i bevisdokumenten: ”Böcker är viktigare än webbdata”.
... kanske borde jag lägga till en extra post på fakturan: ”Avgift för AI-träning”?
Science fictionförfattaren Arthur C. Clarkes ”tredje lag” säger: ”All tillräckligt avancerad teknologi är omöjlig att särskilja från magi”. Litteraturen hjälper språkmodellen förstå och börja behärska författarens trollkonster. Utan böcker i sin träningsdata, blir språkmodellerna semantiskt endimensionella och deras användningsområden begränsade.
Meta försvarar sig med det juridiska begreppet ”fair use”. Det kan vara en framgångsrik strategi. Tidigare tvister mellan författare och exempelvis Google har gett teknikföretagen rätt. Den ”transformativa” effekten har guidat domare och jury; marknadens tekniska innovation bedöms viktigare än upphovsrätt.
Schibsted, koncernen bakom just den här sidan, låter Open AI träna språkmodeller på bland annat den här texten. Hmm ... kanske borde jag lägga till en extra post på fakturan: ”Avgift för AI-träning”? Idén är faktiskt inte så långsökt. Microsoft gjorde förra året en deal med förlaget HarperCollins. Microsoft, som kontrollerar Open AI, betalade 50 000 kronor per bok för att använda den i sin AI-träning. Alice Robb, en av författarna som gick med på dealen, säger att hon fick hälften av pengarna i en engångsbetalning från förlaget. Så, jag borde väl kunna få ... en femhundring till för den här texten? Jag testar.
Några brittiska författare skrev av sig ilskan i tidningen The Guardian (också de en strategisk partner till Open AI) och på Facebook (mer träningsdata till Zuckerberg). I torsdags samlades en tapper skara författare och journalister utanför Metas högkvarter vid Kings Cross i London. Ilskan på gatan var stor, men som synes har våra uppdragsgivare resignerat. AI är redan en del av kultur- och mediesektorn, de pressade bok- och tidningsbranscherna behöver de ekonomiska stordriftsfördelar AI-verktygen ger.
Samtidigt är hela internet argt på den senaste AI-triggern – Open AI:s Studio Ghibli-bilder. Ja, det är ett helgerån och Miyazaki är Gud. Men vi måste sluta att så enögt se generativ AI som en etisk fråga. Konflikten människa-maskin kan kännas existentiell men den är i grunden materiell.
Att sätta konsten i etiskt motsatsförhållande till tekniken är kulturparnassens protektionistiska ryggradsreflex. En oinsatt rant om AI:ns värdelöshet ger interna stilpoäng, det gestaltar en yttre fiende att enas mot. Gott så; avståndstagandet kan ju generera materiellt resultat i form av reseersättning till ett panelsamtal på bokmässan. Men just oviljan/oförmågan att försöka förstå hur artificiell intelligens fungerar är huvudorsak till att EU:s AI-lagstiftning inte säkrar upphovsrätten för författare eller journalister.
… när gigantiska företag tränar AI-skrivverktyg på dem får vi inget
I slutförhandlingen om lagen fintade Zuckerbergs lobbyister upp kulturivrarna på läktaren. Djävulen fanns i avgörande detaljer om ”data mining” – kryphål Meta såklart hade full koll på. Kultursektorn hade näsan i Kant – kanske finns svaren om AI där? Inget fel på Kant, och Adorno, men det etiska fokuset öppnade upp för Meta att fortsätta att gratis skörda böcker och artiklar. Zuckerberg pissar på Kant. Och Adorno. Och dig.
Kulturutövarnas fronttrupper måste vässa sin tekniska kompetens. Techsektorn kommer inte göra jobbet åt oss; den varken förstår eller värnar kulturen. Att skriva under på datorteknikens positiva genomslagsnetto men samtidigt argumentera för upphovsrätt does liksom not compute hos techfolk. Argumenten har fått mig utslängd från såväl Spotifyfest som Piratbyråns mörkröda buss. (Nej, så full var jag inte.) Branschens key account managers och cyberpunkare ser resultatet av kulturskapande som data, inget mer. Nu höjer samma oheliga allians av Handelselit, marknadsliberala öppen källkod-aktivister och gamla anarkaprogrammerare Facebooktummarna till Mark Zuckerbergs ära. Är Meta alltså AI-versionen av Pirate Bay? Zuck. Dags för en uppdaterad maktanalys kanske?
Vi författare ersätts när privatpersoner kopierar våra verk för eget bruk. Men när gigantiska företag tränar AI-skrivverktyg på dem, får vi inget. Det är en svårbegriplig ekvation. Det är därför helt rätt att ett antal författare nu begär att Parisa Liljestrand agerar. Men mer behövs. Lex Microsoft/HarperCollins ger vid handen att Författarförbundet kanske bör skissa på ett nytt standardavtal. 25 000 spänn är ju inte kattskit.
Café Bambino: Djävulen bär Prada, fast på Facebook

