OkosHír: Az OpenAI kedden bemutatta a Sora 2 nevű új mesterséges intelligencia modelljét, amely hang- és videógenerálásra képes. A TechCrunch jelentése szerint a cég bemutatói és közleményei alapján a Sora 2 a korábbi rendszerekhez képest pontosabban veszi figyelembe a fizika törvényeit, ami valósághűbb videókat eredményez.
A fejlesztők állítása szerint a Sora 2 modell kevésbé „optimista” a videók generálásában, mint más mesterséges intelligencia rendszerek. Példaként említik, hogy amennyiben egy kosárlabdázó kihagy egy dobást, a labda a valóságban is visszapattan, nem pedig azonnal a kosárba teleportál, ahogy az más AI-generált videókban előfordulhat.
Az új modell bevezetésével együtt az OpenAI egy új alkalmazást is bejelentett, amelynek működése a TikTokéhoz hasonló. Ez az alkalmazás kizárólag mesterséges intelligencia által generált tartalmakat fog megjeleníteni. A felhasználók rövid hang- és videómintákat tölthetnek fel magukról, amelyek alapján az AI avatárokat készít, és ezeket be lehet illeszteni a generált videókba. Emellett a felhasználók engedélyezhetik, hogy mások is felhasználják élethű avatárjaikat.
Az alkalmazás algoritmusai a felhasználók tartalomfolyamát az általuk generált AI-tartalmak, korábbi reakciók, tartózkodási hely és ChatGPT előzmények alapján állítják össze; ez utóbbi funkció kikapcsolható. Szülői felügyeleti lehetőségek is elérhetők, mint például a videók végtelen görgetésének korlátozása, az algoritmikus személyre szabás kikapcsolása, valamint a gyermekeknek üzenetet küldők körének beállítása.
Az alkalmazás induláskor ingyenesen használható, az OpenAI célja ezzel az, hogy az emberek szabadon kipróbálhassák a rendszer képességeit. Az egyetlen jelenlegi bevételi forrás az, hogy csúcsidőben, nagy videógenerálási igény esetén egy bizonyos darabszám felett díjat számíthatnak fel a további videók generálásáért.
Az új technológia megjelenése kapcsán felmerülnek a mesterséges intelligencia által generált, valósághű videók lehetséges veszélyei. Egy, az OpenAI vezérigazgatójáról, Sam Altmanról készült videó, amelyen videókártyát „lop”, röviddel a Sora 2 bejelentése után terjedt el. Fontos megjegyezni, hogy ez a videó maga is mesterséges intelligencia által generált deepfake volt, amelyet a Sora 2 képességeinek demonstrálására hoztak létre, és nem valós eseményt ábrázolt. Az ilyen típusú, rendkívül élethű, de hamis videók generálásának lehetősége kihívásokat vet fel a hitelesség és a manipuláció terén. Az iparági szereplők, köztük maga Sam Altman is, korábban már figyelmeztettek az AI-vezérelt csalások, például a hang- és videó-imperszonációk jelentette „jelentős csalási válság” veszélyére, kiemelve az elavult hitelesítési módszerek sebezhetőségét.
Tiszta.AI elemzés: Az eredeti cikk értékelése
- Az eredeti cikk narratívája és célja: Az eredeti cikk az OpenAI Sora 2 modelljének és a hozzá tartozó közösségi alkalmazás bemutatásával kezdődik, technológiai újdonságként tálalva azt. Azonban a szöveg fokozatosan egy óvatos, majd kifejezetten kritikus hangvételű, aggodalmat keltő elbeszélésbe fordul át. A narratíva célja az olvasó figyelmének felhívása a mesterséges intelligencia lehetséges veszélyeire, különös tekintettel a deepfake technológiára és a szabályozás hiányára. A cikk célja, hogy kétségeket és aggodalmakat ébresszen a technológia felelősségteljes alkalmazásával kapcsolatban, és a nagy techcégek feltételezett lobbitevékenységét is kritizálja.
- Főbb elemzési pontok:
- Nyelvi és Retorikai Eszközök: A cikk a bevezető, tényközlő részek után egyre inkább érzelmi és manipulatív nyelvezetet használ, különösen a záró bekezdésekben.
- Az „kevésbé optimista, mint más MI-k” kifejezés emberi tulajdonságokat tulajdonít az AI-nak, ami érzelmi azonosulást vagy ellenszenvet kelthet.
- A „tudatos, felelősségteljes emberekként elég-e csak technológiai szempontból vizsgálni” kérdés közvetlenül az olvasó felelősségtudatára apellál, és egy előre meghatározott válasz felé tereli.
- Az „egyértelmű, hogy a minél élethűbb, de teljesen kamu videók generálása tele van buktatókkal és veszélyekkel” állítás egy következtetést mutat be nyilvánvaló tényként, anélkül, hogy bizonyítékokat vagy részletes elemzést nyújtana.
- Az „elképesztő pénzeket ölnek abba, hogy lobbizással megakadályozzák, hogy szigorúbban szabályozzák a mesterséges intelligenciát” mondat erős, vádló hangnemet használ, amely összeesküvés-elméletre utalhat. Bár a lobbizás ténye általánosságban ismert a tech-iparban, a cikk konkrét bizonyítékokat nem szolgáltat a „megakadályozás” szándékára.
- Forráskezelés és Egyensúly: Az eredeti cikk forráskezelése a kezdeti tényközlő részekben megfelelő (pl. TechCrunch hivatkozás). Azonban a cikk későbbi, véleményt kifejező részeiben hiányzik a kiegyensúlyozottság.
- A legjelentősebb manipuláció a Sam Altmanról szóló videó tényként való bemutatása volt. A cikk azt állítja, hogy „el is készült egy videó, amin az OpenAI vezérigazgatója, Sam Altman látható egy bolti kamera felvételén, ahogy videókártyát lop”. Ez az állítás félrevezető, mivel a keresési eredmények egyértelműen igazolják, hogy a videó egy mesterséges intelligencia által generált deepfake volt, amelyet maga a Sora 2 modell hozott létre, és az OpenAI saját munkatársai is terjesztették a modell képességeinek bemutatására. Az eredeti cikk ezt az AI-generált tartalmat valós eseményként tálalja, ezzel erősítve a „veszélyes” narratívát.
- A lobbizással kapcsolatos állításokhoz (miszerint „elképesztő pénzeket ölnek abba, hogy lobbizással megakadályozzák, hogy szigorúbban szabályozzák a mesterséges intelligenciát”) a cikk nem szolgáltat konkrét forrásokat vagy bizonyítékokat, így ezek a szerző feltételezései maradnak.
- A cikk nem tér ki arra, hogy maga Sam Altman is aktívan figyelmeztetett az AI-vezérelt csalások és deepfake-ek jelentette veszélyekre, és a szabályozás szükségességére. Ez a kontextus hiánya egyoldalú képet fest a cég álláspontjáról.
- Nyelvi és Retorikai Eszközök: A cikk a bevezető, tényközlő részek után egyre inkább érzelmi és manipulatív nyelvezetet használ, különösen a záró bekezdésekben.
- A téma társadalmi relevanciája: A mesterséges intelligencia, különösen a valósághű videó- és hanggeneráló modellek fejlődése rendkívül fontos társadalmi, etikai és jogi kérdéseket vet fel. Az ilyen technológiák potenciálisan forradalmasíthatják a tartalomgyártást és a kommunikációt, ugyanakkor komoly aggodalmakat is keltenek a félretájékoztatás, a csalás, a személyazonosság-lopás és a szerzői jogok megsértése miatt. A mesterséges intelligencia szabályozásával, a vállalatok felelősségével, valamint az innováció és a biztonság közötti egyensúly megteremtésével kapcsolatos viták a közélet kiemelt témái, és alapvetően befolyásolhatják a digitális társadalom jövőjét.
(Forrás: telex.hu)
A kép illusztráció. Forrás: AI szerkesztés