Farkas, Rodrigó, Wolfgang2020. október 31., szombat
Tudomány

Nyelvhalál a digitális korban

National Geographic Magyarország

Érdemes-e nekünk, magyaroknak, még ma is tartani Johann Gottfried von Herder jóslatától? A 18. századi német költő, filzófus jövendölése szerint a magyarok „…más népek közé vannak beékelve, s századok multán talán nyelvüket is alig lehet felfedezni.”

Fotó: dreamstime

A digitális korban azonban ami egyszer kikerült a webre az többé nem vész el, sőt inkább az ellenkező folyamatra látunk példákat: ahogy a klasszikus kínai, a szanszkrit, az ógörög és sok más már rég kihalt nyelv lassanként megjelenik a világhálón. Ugyanakkor egyre több olyan nyelvről tudunk, melyeket közvetlenül fenyeget a kihalás veszélye. Az Endangered Languages (veszélyeztetett nyelvek) weboldala 3200 ilyet sorol fel, ami a világ mintegy 8000 nyelvének 40 százaléka.
Hogy valójában mi a helyzet, azt tárja fel Kornai András matematikus, nyelvész a tudományos világ legtekintélyesebb online folyóiratában, a PLOS ONE-ban, 2013. október 22-én megjelent, “Digital language death” (Digitális nyelvhalál) című cikkében. A szerző először a nyelvek életképességének hagyományos kritériumait gondolja újra a digitális térben: a nyelvet beszélők száma helyett a nyelvet a hálózaton használók számára figyel. Az olyan, hagyományos értelemben kihalással egyáltalán nem fenyegetett nyelvek esetében mint a mandinka, (Alex Haley: Gyökerek c. regényéből és az ebből készült tévésorozatból ismerhető) hatalmas különbséget jelent, hiszen sokmillióan beszélik, de a lakosság kevesebb mint egy százaléka tudja írni is. Hiába ez a hivatalos nyelv ma két országban is, Szenegálban és Gambiában, hiába van mandinka nyelven rádió- és tévéadás, a digitális térben egyszerűen nincsenek jelen.

A matematikus-nyelvész kutatásának alalpjául óriási mennyiségű, webről gyűjtött adat állt rendelkezésre. „Az adatok gyűjtésében, elemzésében nagy segítségemre voltak munkatársaim az MTA SZTAKI-ban, Zséder Attila fejlesztő mérnök és Pajkossy Katalin matematikus. Hogy a kritériumokat számszerűsíteni tudjuk: minden nyelvet több mint harminc dimenzió mentén vizsgáltunk. Négy csoportra bontottuk a nyelveket: digitálisan mozdulatlan, örökségi, élő, és viruló nyelveket különböztettünk meg, nagyjából aszerint, hogy mennyi digitális kommunikáció zajlik azon a nyelven: a mozdulatlanokon gyakorlatilag semmi, a virulókon naponta több milliárd szónyi új anyag válik digitálisan elérhetővé” – mondta Kornai András.

Az örökségi nyelvek, mint a latin vagy az ógörög azért érdekesek, mert ezek hatalmas kulturális örökséget közvetítenek, de akik ezt felviszik a webre azok nem anyanyelvi beszélők. Büszkén vallhatja valaki, hogy ő mandinka, lengyel, vagy magyar, de senki nem mondhatja: én latin vagyok. Ettől még lelkesen szerkesztheti a latin wikipédiát. Amikor egy-egy nyelvet megmentünk a digitális nyelvhaláltól, akkor sajnos nem digitálisan élő, hanem örökségi nyelvek jönnek létre.

A módszer lényege, hogy nagyon világos és egyértelmű példákat választottak az egyes csoportokból, majd olyan matematikai modelleket állítottak fel, amik megtanulják melyik nyelv melyik osztályba esik.

„Ezek a modellek, mint kiderült, nem is használják a rendelkezésükre álló 35 dimenziót, ezekből mindössze 6-8-at tartottak fontosnak. Ennek ellenére, a különboző példákon és különböző paraméterhalmazokkal tanított modellek lényegében mind egyetértenek egymással amikor az eredeti példáktól eltérő nyelvekre alkalmazzuk őket: a ma ismert nyelvek és nyelvjárások több mint 95 százaléka digitálisan halott. Nem arról van szó, hogy egyszer majd, talán, valamikor ki fog halni: a mozdulatlan tetemek itt fekszenek előttünk” – tájékoztatott Kornai András.

És hogy mit lehet tenni? A professzor szerint két dolgot is: „Egyrészt a digitálisan halott nyelvek döntő többsége a hagyományos értelemben mégcsak nem is veszélyeztetett: biztosak lehetünk benne, hogy mandinka vagy nynorsk (a norvég egy változata) anyanyelvű beszélőket még száz év múlva is fogunk találni. Ezek a nyelvek örökségi nyelvvé tehetők, sokan dolgoznak ezen, de itt van még az a több mint négyszáz nyelv, aminek még van esélye. Ezekkel ma kevesebbet foglalkoznak, pedig nem mindegy, hogy a kibertérbe magunkkal visszük-e őket. A magyar nincs veszélyben, digitálisan sem! Ezt világosan le kell szögezni. Amíg épül a magyar wikipédia (jelenleg,nagyságra a 24-edik, tehát nemhogy az életképes 4-5 százalékban, de még a felső 0,5 százalékban is bent van), amíg magyarul csetelnek a felhasználók, magyarul írnak a fészbukra, virágzik a blog- és portálkultúra, addig nagy baj nem lehet.

A magyar gépi fordítást legjobban a Google, a magyar beszédfelismerést pedig a Nuance csinálja. Ezek a szoftverek nagyok és bonyolultak, fejlesztésükön egyszerre sok tucatnyi ember dolgozik. Még ha nem is olyan nagyszerű a Google Translate, nem sokan adnának pénzt valami jobbért. A magyar nyelvtechnológia igazából csak magyaroknak kell.

A Magyar Nyelv- és Beszédtechnológiai Platformot jobban ismerik Brüsszelben mint itt¬hon. A magyar kultúrörökség digitalizálására, nagyon helyesen, volt eddig némi állami támogatás, mint ahogy a kisebb finnugor közösségek nyelvtechnológiai támogatására is, de ezek a kicsi, néhány tizmilliós projektek csak az örökségi státusz felé visznek – ha azt akarjuk, hogy a magyar nyelv necsak túléljen hanem viruljon is a digitális korszakban, akkor nagyobb léptékben kell gondolkodni.

Forrás: sztaki.hu/ ng.24.hu

Hozzászólások

Újabb meglepetést okozott a Szaturnusz legnagyobb holdja

Újabb meglepetést okozott a Szaturnusz legnagyobb holdja

A Titan nevű hold izgalmas tájai és különleges anyagai miatt régóta foglalkoztatja a szakértőket.

Robothalak segítségével vizsgálták a halrajokat

Robothalak segítségével vizsgálták a halrajokat

Robothalak segítségével vizsgálták a rajban úszó halak

A Naprendszer egyik legérdekesebb aszteroidája

A Naprendszer egyik legérdekesebb aszteroidája

A mintegy 225 kilométer széles 16 Psyche a Mars és a Jupiter közötti fő kisbolygóöv egyik legnagyobb objektuma.

Új pályaadatok születtek az Apophis kisbolygóról

Új pályaadatok születtek az Apophis kisbolygóról

A kisbolygó a jövőben több alkalommal is elhalad a Föld közelében, a kérdés az, hogy ezek mennyire lesznek közeliek.

Mesterséges intelligencia fedezett fel egy új krátert a Marson

Mesterséges intelligencia fedezett fel egy új krátert a Marson

A NASA által használt mesterséges intelligencia (MI) az első, amely hasonló eredményt ért el.

National Geographic 2020. októberi címlap

Előfizetés

A nyomtatott magazinra,
12 hónapra

9 960 Ft

Korábbi számok

National Geographic 2010. januári címlapNational Geographic 2010. februári címlapNational Geographic 2010. márciusi címlapNational Geographic 2010. áprilisi címlapNational Geographic 2010. májusi címlapNational Geographic 2010. júniusi címlapNational Geographic 2010. júliusi címlapNational Geographic 2010. augusztusi címlapNational Geographic 2010. szeptemberi címlapNational Geographic 2010. októberi címlapNational Geographic 2010. novemberi címlapNational Geographic 2010. decemberi címlapNational Geographic 2011. januári címlapNational Geographic 2011. februári címlapNational Geographic 2011. márciusi címlapNational Geographic 2011. áprilisi címlapNational Geographic 2011. májusi címlapNational Geographic 2011. júniusi címlapNational Geographic 2011. júliusi címlapNational Geographic 2011. augusztusi címlapNational Geographic 2011. szeptemberi címlapNational Geographic 2011. októberi címlapNational Geographic 2011. novemberi címlapNational Geographic 2011. decemberi címlapNational Geographic 2012. januári címlapNational Geographic 2012. februári címlapNational Geographic 2012. márciusi címlapNational Geographic 2012. áprilisi címlapNational Geographic 2012. májusi címlapNational Geographic 2012. júniusi címlapNational Geographic 2012. júliusi címlapNational Geographic 2012. augusztusi címlapNational Geographic 2012. szeptemberi címlapNational Geographic 2012. októberi címlapNational Geographic 2012. novemberi címlapNational Geographic 2012. decemberi címlapNational Geographic 2013. januári címlapNational Geographic 2013. februári címlapNational Geographic 2013. márciusi címlapNational Geographic 2013. áprilisi címlapNational Geographic 2013. májusi címlapNational Geographic 2013. júniusi címlapNational Geographic 2013. júliusi címlapNational Geographic 2013. augusztusi címlapNational Geographic 2013. szeptemberi címlapNational Geographic 2013. októberi címlapNational Geographic 2013. novemberi címlapNational Geographic 2013. decemberi címlapNational Geographic 2014. januári címlapNational Geographic 2014. februári címlapNational Geographic 2014. márciusi címlapNational Geographic 2014. áprilisi címlapNational Geographic 2014. májusi címlapNational Geographic 2014. júniusi címlapNational Geographic 2014. júliusi címlapNational Geographic 2014. augusztusi címlapNational Geographic 2014. szeptemberi címlapNational Geographic 2014. októberi címlapNational Geographic 2014. novemberi címlapNational Geographic 2014. decemberi címlapNational Geographic 2015. januári címlapNational Geographic 2015. februári címlapNational Geographic 2015. márciusi címlapNational Geographic 2015. áprilisi címlapNational Geographic 2015. májusi címlapNational Geographic 2015. júniusi címlapNational Geographic 2015. júliusi címlapNational Geographic 2015. augusztusi címlapNational Geographic 2015. szeptemberi címlapNational Geographic 2015. októberi címlapNational Geographic 2015. novemberi címlapNational Geographic 2015. decemberi címlapNational Geographic 2016. januári címlapNational Geographic 2016. februári címlapNational Geographic 2016. márciusi címlapNational Geographic 2016. áprilisi címlapNational Geographic 2016. májusi címlapNational Geographic 2016. júniusi címlapNational Geographic 2016. júliusi címlapNational Geographic 2016. augusztusi címlapNational Geographic 2016. szeptemberi címlapNational Geographic 2016. októberi címlapNational Geographic 2016. novemberi címlapNational Geographic 2016. decemberi címlapNational Geographic 2017. januári címlapNational Geographic 2017. februári címlapNational Geographic 2017. márciusi címlapNational Geographic 2017. áprilisi címlapNational Geographic 2017. májusi címlapNational Geographic 2017. júniusi címlapNational Geographic 2017. júliusi címlapNational Geographic 2017. augusztusi címlapNational Geographic 2017. szeptemberi címlapNational Geographic 2017. októberi címlapNational Geographic 2017. novemberi címlapNational Geographic 2017. decemberi címlapNational Geographic 2018. januári címlapNational Geographic 2018. februári címlapNational Geographic 2018. márciusi címlapNational Geographic 2018. áprilisi címlapNational Geographic 2018. májusi címlapNational Geographic 2018. júniusi címlapNational Geographic 2018. júliusi címlapNational Geographic 2018. augusztusi címlapNational Geographic 2018. szeptemberi címlapNational Geographic 2018. októberi címlapNational Geographic 2018. novemberi címlapNational Geographic 2018. decemberi címlapNational Geographic 2019. januári címlapNational Geographic 2019. februári címlapNational Geographic 2019. márciusi címlapNational Geographic 2019. áprilisi címlapNational Geographic 2019. májusi címlapNational Geographic 2019. júniusi címlapNational Geographic 2019. júliusi címlapNational Geographic 2019. augusztusi címlapNational Geographic 2019. szeptemberi címlapNational Geographic 2019. októberi címlapNational Geographic 2019. novemberi címlapNational Geographic 2019. decemberi címlapNational Geographic 2020. januári címlapNational Geographic 2020. februári címlapNational Geographic 2020. márciusi címlapNational Geographic 2020. áprilisi címlapNational Geographic 2020. májusi címlapNational Geographic 2020. júniusi címlapNational Geographic 2020. júliusi címlapNational Geographic 2020. augusztusi címlapNational Geographic 2020. szeptemberi címlapNational Geographic 2020. októberi címlap

Hírlevél feliratkozás

Kérjük, erősítsd meg a feliratkozásod az e-mailben kapott linkre kattintva!

Kövess minket