Az OpenAI-os Mira Murati nem biztos abban, hogy a Sora képzési adatai honnan származhatnak

A The Wall Street Journalnak adott interjújában Mira Murati homályos válaszokat adott, amikor az OpenAI Sora modelljének adatforrásáról kérdezték.

Az OpenAI közelgő, videókat is generáló (MI) modelljének, a Sora-nak adatforrása nem világos a vállalat technológiai vezetője, Mira Murati számára.

Murati homályos válaszai

A The Wall Street Journalnak adott, március 13-án megjelent interjúja során Murati homályos válaszokat adott, amikor a vállalat Sora modelljének adatforrásáról kérdezték. A modell képes szöveges utasításokból videókat generálni.

“Nyilvánosan elérhető adatokat és licencelt adatokat használtunk” – válaszolta Murati arról, hogy a 80 milliárd dollárra értékelt vállalat hogyan képezte ki a készülő modelljét.

Joanna Stern, a WSJ munkatársa ezután megkérdezte, hogy a Sora-t olyan közösségi média platformok adataiból képezték-e ki, mint a YouTube, az Instagram vagy a Facebook. “Ebben igazából nem vagyok biztos” – válaszolta Murati, majd hozzátette:

Tudod, ha nyilvánosan elérhetőek lennének – nyilvánosan használhatnánk. De nem vagyok benne biztos. Nem vagyok teljesen biztos benne.

Mielőtt Stern témát váltott volna, megemlítette az OpenAI partnerségét a Shutterstock kép szolgáltató céggel. Majd megkérdezte, hogy a cég adatait fel lehetne-e használni a Sora képzéséhez. “Nem fogom részletezni, hogy milyen adatokat használtak fel. De nyilvánosan elérhető vagy licencelt adatok voltak” – tette hozzá Murati. Később megerősítette a WSJ-nek, hogy a Shutterstock adatait használták a Sora számára.

Az OpenAI megint a hírekben

A mesterséges intelligencia modelleket nagy adathalmazok segítségével képzik ki, amelyek segítségével a modell megtanulja felismerni a mintákat, képes előrejelzéseket készíteni vagy megérteni a nyelvet.

Murati 2018 óta dolgozik az OpenAI-nál és a vállalat legnépszerűbb projektjeit vezeti. Ezek között a Dall-E 3 képgenerátor modellt, a beszédfelismerő eszközt, a Whisper-t és a vállalat chatbotjának legújabb verzióját, a ChatGPT-4-et. 2023 novemberében rövid időre átvette az ideiglenes vezérigazgatói posztot, miután az OpenAI igazgatótanácsa leváltotta Sam Altmant.

Az OpenAI ellen több jogi eljárás is indult az MI-modellek képzési adataival kapcsolatban. 2023 júliusában Sarah Silverman, Richard Kadrey és Christopher Golden szerzők pert indítottak a vállalat ellen. Véleményük szerint a ChatGPT szerzői jogvédelem alatt álló tartalmak alapján készített összefoglalókat a szerzők műveiről.

2023 decemberében a The New York Times beperelte a Microsoftot és az OpenAI-t egy hasonló szerzői jogi jogsértés miatt. Szerintük a vállalatok az újság tartalmát használták fel az MI chatbotok kiképzéséhez. Kaliforniában egy másik, csoportos keresetet nyújtottak be, amelyben azt állítják, hogy az OpenAI a felhasználók beleegyezése nélkül halászták az internetről a felhasználók magánjellegű adatait a ChatGPT kiképzéséhez.