A Meta, a mesterséges intelligencia fejlesztésére fordított hatalmas erőforrások mellett, illegális forrásokból töltött le óriási mennyiségű könyvet, hogy betaníthassa a MI modelljeit. A cég munkatársai e-mailekben osztották meg, hogy a LibGen és a Z-Library torrentoldalakról szerezték be az anyagokat, amit a szerzői jogvédők etikátlan gyakorlatként ítéltek meg - tudósított a hvg.
Az ügyészség szerint a Meta összesen 80 terabájtnyi kalóz adatot töltött le, ezzel a mesterséges intelligencia képzése során etikailag és jogilag is vitatott módszert alkalmazva.
A mesterséges intelligencia fejlesztése az utóbbi években rengeteg figyelmet vonzott, különösen a ChatGPT megjelenésével, amely alapjaiban változtatta meg a technológiai tájat. Azonban ahhoz, hogy a nagy nyelvi modellek megfelelően működjenek, hatalmas mennyiségű, jó minőségű adatra van szükség, hogy ezek a rendszerek tanuljanak. A probléma az, hogy az ilyen típusú adatokat gyakran szerzői jogok védik, így a fejlesztők számára korlátozottak az elérhető legális források.
Az OpenAI, a ChatGPT mögötti cég, szintén kritikák kereszttüzébe került, mivel sokan szerzői jogsértéssel vádolják, mivel az MI fejlesztéséhez szükséges adatokat gyakran jogvédett tartalmakból szerzi. Az OpenAI azzal védekezett, hogy az ilyen adatfelhasználás méltányos használatnak minősül, és a mesterséges intelligencia fejlődése érdekében szükséges a jogsértő anyagok felhasználása. Azonban a vállalat egyes lépései, például a kínai DeepSeek kapcsán tett panaszai, ellentmondásosnak tűnnek, mivel itt is azzal vádolják a céget, hogy illegálisan használta fel más cégek technológiáját.
A vállalat dolgozói, bár észrevették az illegális források használatát, úgy vélték, hogy a MI-képzéshez szükséges hatalmas mennyiségű adat megszerzése elengedhetetlen. Az egyik dolgozó például etikai aggályokat vetett fel a kalózanyagok használatával kapcsolatban, míg mások a VPN-en keresztüli letöltést javasolták a titokban tartás érdekében. Az e-mailek arra is rávilágítanak, hogy a Meta dolgozói tisztában voltak azzal, hogy az adatok illegális forrásból származnak, ám az MI-fejlesztéshez szükséges adatokat megszerezni egy "fegyverkezési versenyhez" hasonlították.