Trend Egyre több nyelven „beszél” a mesterséges intelligencia

Egyre több nyelven „beszél” a mesterséges intelligencia

autopro.hu/P.B. | 2021.09.18 12:17

Egyre több nyelven „beszél” a mesterséges intelligencia

Fotó: Pixabay

A mesterséges intelligencia fejlődésével az elmúlt években eljutottunk odáig, hogy a gépek képesé váltak önállóan szöveget alkotni – eleinte angol nyelven, de ma már több másik európai nyelven is képesek összefüggő szöveg alkotására.

Hirdetés

Egy német startup, az Aleph Alpha a világ egyik legjobb mesterséges intelligencián alapuló nyelvi programját alkotta meg. Ez nemcsak angolul, hanem több európai nyelven – például franciául, olaszul vagy spanyolul – képes folyékony szöveget alkotni.

Az internetes olvasásból tanultak alapján az algoritmus koherens cikkeket alkothat meg egy adott témában, és határozottan válaszolhat néhány általános ismerettel kapcsolatos kérdésre. Érdekesség, hogy ezek a válaszok eltérhetnek egy amerikai algoritmus által adott választól anélkül, hogy bármelyik hibás lenne – hiszen a válaszok attól függnek, mit tanultak meg a gépek. Így lehet az, hogy a világ legsikeresebb sportklubja az Aleph Alpha esetében egy német focicsapat, míg tengerentúli modelleknél kosárlabda vagy jégkorong csapatok fordulnak elő.

Hirtelen növekedésnek indult piac

A gépek évtizedekig lassan haladtak a szavak és mondatok jelentésének megértésében, ám a gépi tanulás ígéretes fejlődést hozott a területen. A startupok igyekeznek is kihasználni az ebben rejlő lehetőségeket – írja a Wired.

Az amerikai OpenAI volt az első startup, amely 2019-ben bemutatta egy GPT-2 nevű, új, mesterséges intelligencián alapuló nyelvi programot – azóta már az új, hatékonyabb GPT-3 verziót kínálja a vevőinek. Néhány más amerikai vállalat, köztük a Cohere és az Anthropic, hasonló eszközökön dolgoznak. Ma már egyre több vállalat tevékenykedik az Egyesült Államokon kívül hasonló területen – Kínában, Dél-Koreában, Izraelben és Németországban. Minden erőfeszítésnek megvan a maga technikai fordulata, de mindegyik ugyanazon a gépi tanuláson alapul.

Lehetetlen teljes sikert elérni

Régóta nagy kihívást jelent a kutatók számára, hogy a gépek emberi nyelvet sajátítsanak el. A nyelv rendkívül gazdag, a szavak és a fogalmak szinte végtelen módon kombinálhatók, ráadásul a szavak jelentésének dekódolása nehéz lehet a gyakori kétértelműség miatt is. Lényegében lehetetlen a nyelv összes szabályát számítógépes programba írni.

Ugyanakkor a legújabb eredmények azt mutatják, hogy az internet olvasásával a mesterséges intelligencián alapuló alkalmazások figyelemreméltó eredményeket tudnak elérni.

Az a meglepő ezekben a nagy nyelvi modellekben, hogy mennyit tudnak a világ működéséről, egyszerűen csak elolvasva az általuk talált dolgokat az interneten – mondja Chris Manning, a Stanford Egyetem mesterséges intelligenciára és nyelvre specializálódott professzora.

Kihívások

A fent említett komplexitáson kívül a legnagyobb aggály az, hogy miként lehet visszaélni az ilyen programokkal. Mivel a modellek meggyőző szöveget tudnak kidolgozni egy témában, egyesek attól tartanak, hogy könnyen felhasználhatók hamis vélemények, spamek vagy álhírek készítésére.

Egy másik probléma, hogy milyen környezetben tanulnak az adott alkalmazások. Kutatások kimutatták, hogy a kínai internetes tartalmakon oktatott nyelvi modellek tükrözik a kínai cenzúrát. A programok elkerülhetetlenül rögzítik és reprodukálják a faji, a nemi és a politikai finom és nyilvánvaló elfogultságokat az általuk használt nyelvben, beleértve a gyűlöletbeszédet is.

Az ezeket a modelleket fejlesztő vállalatok megígérik, hogy ellenőrzik azokat, akik hozzáférnek a programokhoz, de ahogy az eszközök egyre szaporodnak és hozzáférhetőbbé válnak, nem világos, hogy minden visszaélést ki tudnak-e szűrni – írja a Wired.

Kiemelt Partnereink