
A GVH nyomására lépett a Microsoft – Tízmilliárd magyar szavas adatbázist épít
A Gazdasági Versenyhivatal eljárása nyomán a Microsoft történelmi vállalást tett. Tízmilliárd magyar szóból épít új MI-rendszert. Ráadásul az adatokat ingyenesen elérhetővé teszi más fejlesztőknek is. Új korszak kezdődhet a magyar nyelv digitális jövőjében?
Tízmilliárd magyar szóval tanul a mesterséges intelligencia a Microsoftnál
A Gazdasági Versenyhivatal (GVH) történelmi jelentőségű kötelezettségvállalást ért el a Microsoft céggel szemben folytatott versenyfelügyeleti eljárás során. A megállapodás értelmében a technológiai óriás legalább tízmilliárd magyar szót tartalmazó adatbázist állít össze, melyet mesterséges intelligencia (MI) alapú rendszereinek fejlesztéséhez használ fel, és amit ingyenesen elérhetővé tesz más fejlesztők számára is – számolt be a megállapodásról a versenyhivatal.
Miért indult a Microsoft ellen az eljárás?
A GVH 2023. júlusában kezdett vizsgálatot a Microsoft Ireland Operations Limited ellen, miután felmerült, hogy a cég tisztességtelen kereskedelmi gyakorlatot folytat a magyar fogyasztókkal szemben az új Bing kereső MI-alapú chatfunkciójával kapcsolatban. A hatóság értékelése szerint a felhasználói tájékoztatás nem volt megfelelő. A szöveg helyenként csak angol nyelven állt rendelkezésre, illetve a dokumentumok széttagoltak és tartalmilag ellentmondásosak voltak.
Nem volt jogsértés, de jött a megegyezés
A GVH nem állapított meg jogsértést, de a Microsoft a vizsgálat hatására jelentős változtatásokat hajtott végre. A vállalat egy összetett kötelezettségvállalási csomagot nyújtott be, amely több ponton is segíti a magyar nyelvű MI-fejlesztéseket és az ezekkel kapcsolatos fogyasztói tudatosság növelését.
Tízmilliárd magyar szót tartalmazó adatbázis
A Microsoft vállalta, hogy egy legalább 10 milliárd magyar szót tartalmazó adatbázist hoz létre, amit mesterséges intelligencia rendszereinek tanításához használ, ugyanakkor azt más fejlesztők számára is nyilvánossá teszi. Ez hatalmas ugrás, figyelembe véve, hogy az OpenAI ChatGPT rendszere eddig körülbelül 120-130 millió magyar szón tréningezett.
Oktatási programok és tudatos használat tanítása
A megállapodás része az is, hogy a Microsoft edukációs programokat szervez a magyar államigazgatás, köztisztviselők, kkv-k és fogyasztók számára. A cél, hogy átfogóbb kép alakuljon ki a mesterséges intelligencia működéséről, előnyeiről és kockázatairól.
A GVH és a Microsoft közötti megegyezés mérföldkő lehet a magyar nyelv digitális jövője szempontjából. A magyar nyelv az egyik legnehezebben feldolgozható nyelv a mesterséges intelligencia számára, de az új adatbázis segíthet abban, hogy világszinten is pontosabb, használhatóbb MI-megoldások szülessenek magyar nyelven is.
Címlapkép forrása: Unsplash