2018. november 12-től érhető el megújult formában az Európai Unió intézményközi terminológiai adatbázisa, vagyis a IATE (InterActive Terminology for Europe). Ebből a rövid összefoglalóból megismerhetők az újítások, az adatbázis felületének megjelenése, szerkezete és használata.
Az adatbázis kidolgozásáért felelős szervezet, az Európai Unió Szerveinek Fordítóközpontja (CdT) sajtóközleménye szerint a IATE számos uniós szerv közös munkája nyomán jött léte: az Európai Parlament, az Európai Unió Tanácsa, az Európai Unió Bizottsága, az Európai Unió Bírósága, az Európai Központi Bank, az Európai Számvevőszék, az Európai Gazdasági és Szociális Bizottság, a Régiók Bizottsága, az Európai Beruházási Bank és az Európai Unió Szerveinek Fordítóközpontja mind hozzájárul az egységes terminológia kialakításához és fenntartásához. A IATE fejlesztésének kezdete a 2000-es évek elejére tehető, az uniós intézmények számára 2004-től, míg a köznyilvánosság számára 2007 óta érhető el. A cél már a kezdetektől egy olyan dinamikus adatbázis létrehozása volt, amely segítséget nyújt az uniós jogszabályok többnyelvű megalkotásában, valamint abban, hogy bárki hozzáférhessen az uniós szakterület validált terminológiai adataihoz.
Az adatbázis jelenleg több mint 8 millió terminust tartalmaz, amelyhez több mint 1,2 millió bejegyzés tartozik. A terminusok és a hozzájuk kapcsolódó információk az Európai Unió mind a 24 hivatalos nyelvén elérhetők. Ahogy a lenti diagramon is látható, az Unió fő munkanyelve, az angol vezet a bejegyzések számát tekintve, míg a magyar nyelv a huszadik helyen áll 50 966 bejegyzéssel.
A IATE mára szinte az egyedüli uniós terminológiai referenciaforrássá nőtte ki magát nemcsak a nyelvi szakemberek számára, hanem a nemzeti szakértők, politikai tanácsadók, a közigazgatásban dolgozók, a kutatók és a különböző területen jelen lévő magáncégek számára is. Népszerűségét a lekérdezések száma is bizonyítja, amely évente 50 millióra tehető.
Az uniós terminológiai adatbázis mostani verziójának fejlesztési munkái két évig tartottak. Mostanra elmondható, hogy az adatbázis a lehető legmodernebb technológiát képviseli, ami egyrészt a keresési módok és ezek eredményének szűrési lehetőségeiben, másrész abban mutatkozik meg, hogy lehetőség van más rendszerekkel (például fordítástámogató szoftverekkel) összekapcsolni nyilvánosan elérhető API-kon (Application Programing Interfaces) keresztül. További integrálási lehetőséget jelent, hogy a teljes adatbázist le lehet tölteni TBX formátumban. Nem feltétlenül érdemes azonban a teljes adatbázist betölteni akármelyik fordítástámogató eszközbe, hiszen ennek kezelése meglehetősen erőforrásigényes, így jelentősen lassúvá válhat a keresés. Ennek elkerülésére több megoldás is rendelkezésre áll: az első a már említett API-kon keresztüli elérés, ahol az adott program közvetlenül kapcsolódik a IATE szerveréhez, ahonnét lekérdezi az adatokat. A másik megoldás, hogy nem a teljes adatbázist töltjük le TBX formátumban, hanem annak csak szűrt változatát. Utóbbit megkönnyítendő, a IATE honlapján elérhető egy olyan program, amelynek segítségével nyelvpár- és/vagy szakterületspecifikusan ki lehet nyerni a számunkra releváns adatokat, és az ebből készült TBX fájlt már hatékonyabban képesek kezelni a különböző rendszerek. 2019-ben a TBX formátumot illetően is várhatók fejlesztések: a vonatkozó ISO 30042:2008 szabvány felülvizsgálatával egyidejűleg, amelyet az ISO/FDIS 30042 szabvány fog felváltani, változások lesznek a TBX fájlt adatszerkezetében, valamint az adatkategóriákban is, mindez pedig végső soron az automatizált és gyakoribb frissítéseket fogja lehetővé tenni.
A fejlesztési munkálatoknak további, látható eredménye is van: a megújult felhasználói felület sokkal könnyebb navigációt tesz lehetővé, emellett nagymértékben javultak a hozzáférési lehetőségek, így a fogyatékkal élők is nagyobb hatékonysággal képesek használni az adatbázist. Emellett a felhasználói felület rugalmas kialakítása is megvalósult, így a rendszert többféle platformon (pl. mobiltelefon, táblagép) is lehet használni.
Kezdőképernyő és szerkesztési elvek
Az adatbázis kezdőképernyője tartalmazza a IATE-val kapcsolatos fontosabb információkat, illetve itt lehet beállítani az alapvető keresési paramétereket. A kezdőképernyő alján található általános statisztika számot ad az adatbázisban megtalálható bejegyzések, illetve terminusok számáról, így nyomon lehet követni, hogy milyen mértékben bővül az adatbázis tartalma. Ezeket jelenleg csak időszakosan frissítik, de a tervek szerint a későbbiekben valós idejű statisztikai adatokat fognak itt megjeleníteni.
Az adatbázis felhasználói felülete mind a 24 hivatalos nyelven elérhető, amelyet a képernyő jobb felső sarkában lévő, kétbetűs nyelvkódot kiválasztva lehet megváltoztatni. Ahogy már korábban is említésre került, a felület hozzáférhetőség is javult: egyrészt az adatbázist lehetséges egérmentesen, csakis a billentyűzet segítségével használni, valamint a fogyatékkal élők számára elérhető a képernyőfelolvasási funkció is. Ezt és további kisegítő lehetőségeket a jövőben is fejleszteni fogják.
A IATE kialakítása és szerkesztési elve megfelel a terminológiai adatbázisoknál megszokottaknak: nem általános szótárról van szó, hanem kimondottan az uniós kontextusban használatos fogalmakat és az azokat jelölő terminusokat, valamint a hozzájuk kapcsolódó információkat gyűjti össze és írja le. Fontos szempont a bejegyzések megbízhatósága, az adatbázis minél több információt biztosít ahhoz, hogy a felhasználók képesek legyenek megítélni, hogy az adott terminus vagy a hozzá kapcsolódó információk valóban megfelelőek és hitelesek-e.
Az adatbázis adatstruktúrája a fogalomalapú megközelítés mentén szerveződik, ami a gyakorlatban azt jelenti, hogy ideális esetben az egyes fogalmakat a hozzájuk kapcsolódó egyetlen bejegyzés fedi le. Mivel a IATE korai változatai úgy jöttek létre, hogy a különböző nemzeti terminológiai adatbázisokat olvasztották egybe, számos duplikátum található a rendszerben. 2015-ben létrejött egy intézményközi különleges csapat (Clen-up Task Force), amelynek célja, hogy folyamatosan elemezze az adatbázist és adattiszítást végezzen, különös tekintettel a duplikált bejegyzések összevonására.
A szerkesztési elvekhez hozzátartozik még az egyes bejegyzések három szerkesztési szintje: a nyelvfüggetlen szint (Language Independent Level – LIL), a nyelvi szint (Language Level – LL), valamint a terminus szintje (Term Level – TL). Ezekre részletesebben a későbbiekben térünk ki.
Keresés az adatbázisban
A IATE adatbázisában lehetőség van egyszerű és részletes keresést végezni. Az egyszerű keresésnél a keresési kulcsszó beírása után a felhasználónak meg kell adnia, hogy mi a forrásnyelv (vagyis milyen nyelvű a keresési kulcsszó), és ezt milyen célnyelven vagy célnyelveket kívánja megjelenítteteni. A keresés megkönnyítésére a rendszer az ötödik leütéstől automatikusan egy legördülő menü formájában megmutatja az adatbázisban elérhető lehetőségeket. Az alapbeállítás szerint a kereső „minden szóra” rákeres, ami azt jelenti, hogy minden találatot megjelenít, amely tartalmazza a keresőmezőbe beírt szavakat
A terminus szövegére való keresés mellett lehetőség van a terminus azonosítója szerinti keresésre: ilyenkor a „Keresés kártyaszám alapján” opció aktiválódik, ezt szemlélteti az alábbi ábra is:
A részletes keresésnél különböző lehetőségek állnak a felhasználók rendelkezésére, attól függően, hogy a keresési mezőbe beírt karaktersorra pontos találatot vagy részleges találatot kíván megjeleníteni, valamint, hogy a kereső hol keressen rá a kulcsszóra: a terminussal egyezzen vagy az ahhoz tartozó információkban. Emellett lehetőség van még a forrásnyelvi terminus típusának meghatározására, így lehet keresni a terminusok, a rövidítések, a kötött szókapcsolatok, képletek és rövid változatok között. A részletes keresési mező alján pedig témakör szerinti szűrésre is van lehetőség. A IATE adatbázis doménszerkezete az Európiai Unió többnyelvű tezauruszán, vagyis az EuroVoc-on alapul (az EU nyelvi erőforrásait kezelő portál itt érhető el).
Keresési eredmények
A keresési eredményeket a rendszer relevancia szerinti sorrendben jeleníti meg. A keresési kritériumoknak megfelelő eredmény az alábbi információkkal jelenik meg: a terminus azonosítója (Kártyaszám), domén (Témakör), melyik intézményhez tartozik a bejegyzés, a speciális státuszú-e a bejegyzés (ezt a bal felső sarokban megjelenő fehér csillag jelzi), a nyelvfüggetlen szintre vonatkozó speciális információ (a terminus életciklusa, eredete), a keresésben szereplő forrás- és célnyelv, illetve a vezérnyelv (anchor language), amennyiben elérhető.
A találatok információi a keresési nézetben is kibővíthetők, mint ahogy azt az alábbi kép szemlélteti:
Teljes bejegyzés megtekintése
Ha a keresési oldalon a terminus azonosítójára kattintunk, a teljes bejegyzést a forrás- és célnyelv(ek)en egyaránt megjeleníti. Lehetőség van arra, hogy a forrás- és célnyelvi változatokat egymás alatt jelenítsük meg, ahogy a fenti kép is mutatja, de lehetőség van az egymás melletti megjelenésre is, amint azt a lenti képen is látható.
Ebben a nézetben mutatkozik meg a legjobban, hogy az adatbázis szerkesztési szintjei pontosan hogyan is épülnek fel, illetve milyen adatkategóriákat tartalmaznak.
1. Nyelvfüggetlen szint (Language-Independent Level – Lil)
Ez a kategória tartalmazza a teljes bejegyzésre vonatkozó metaadatokat. Innét kapunk információkat többek között a fogalommal kapcsolatos olyan adatokról, mint a domén vagy az eredet. Ezek az a nyelvfüggetlenek, vagyis minden nyelvű bejegyzésre érvényesek. Ezen a szinten a következő adatkategóriák találhatók meg:
- Témakör (domén): az a szakterület, amelyhez a fogalom tartozik. Egy fogalom átalagoson 1–3 domén alá sorolható be, amelyek mind az EuroVoc tezauruszban meghatározott szintekhez sorolhatók be.
- Témakörhöz kapcsolódó megjegyzés: az előző IATE verzióból származó adat, további speciális információkat jelöl a kontextussal kapcsolatban.
- Kiemelt bejegyzés: a tagállami adatbázisok összeolvasztása eredményeképpen létrejött duplikátumok közül a preferált bejegyzést jelöli csillaggal.
- Eredet: azt jelöli, hogy a fogalom ország- vagy EU-specifikus-e.
- Megjegyzés az eredettel kapcsolatban: további információkat jelöl a fogalom nemzeti vagy földrajzi eredetével kapcsolatban.
- Életciklus: három címke jelenhet meg itt a fogalomra vonatkozóan. A „historical” címkénél a fogalom nem létezik vagy nem használatos, a „proposed” javasolt, de még el nem fogadott terminust jelöl, az „abandoned” pedig javasolt, de végül elvetett terminust jelez.
- Kereszthivatkozások: itt lehet jelölni, ha a kapcsolatot más bejegyzésekhez.
- Mellékeltek: a bejegyzéssel kapcsolatos dokumentumok vagy grafikonok.
- Megjegyzések a mellékletekkel kapcsolatban: a fenti kategóriában szereplő anyagok leírás.
2. Nyelvi szint (Language Level – LL)
Az itt található kategóriák a fogalomhoz kapcsolódó, az adott nyelven íródott adatokat tartalmazzák, és minden ahhoz a nyelvhez tartozó terminusra vonatkoznak. Itt található a legfontosabb kategória, vagyis a definíció, amelynek ideális esetben hasonlónak kellene lennie, és igazából az egyel magasabb, nyelvfüggetlen szinten kellene megjelennie. Ez a harmonizált fogalmak esetén meg is tud valósulni, de mivel számos fogalom más jellemzőket mutat az egyes tagországokban, ezen a szinten lehet a legpontosabban leírni az adott nyelvhez tartozó fogalommeghatározást. Ezen a szinten a következő adatkategóriák találhatók:
- Nyelvi kód: az egyes nyelvek kétbetűs kódja. A rendszer a kereséskor automatikusan kiválasztja a „la”, illetve a „mul” célnyelvi kategóriákat is. Előbbi a latint jelöli, amely elsősorban taxonómiai (az állat- és növényvilág nevei) és jogi szakkifejezéseknél fordul elő, míg utóbbi a többnyelvű megnevezéseket jelöl, és nyelvfüggetlen kódokra utal, pl. ISO szabványszámok, kémiai képletek, bizonyos mozaikszavak és rövidítések.
- Anchor language (vezérnyelv): ehhez a nyelvi bejegyzéshez igazítják a többi nyelv bejegyzéseit is. Ilyen esetben a definícióknak is a vezérnyelv definíciójához kell igazodniuk a lehető legnagyobb mértékben. Országspecifikus fogalmak esetén az adott nyelv lesz a vezérnyelv, míg taxonómiai bejegyzéseknél a latin lesz ez.
- Definíció: a definícióknak világosnak és tömörnek kell lenniük.
- Definíció referenciája: a definíció forrása. Kötelező kategória, ha a definícióban szerepel valamilyen adat.
- Nyelvi megjegyzés: a fogalomhoz kötődő bármilyen releváns információ, pl. magyarázat, amely valamilyen okból nem lehet a definíció része.
- Nyelvi megjegyzés referenciája: a fenti adatok forrása.
- Mellékletek: a nyelvi szinthez kapcsolható releváns dokumentumok vagy grafikák.
- Megjegyzések a mellékletekhez: a fenti anyagok leírása.
3. Terminusok szintje (Term Level – TL)
A legalacsonyabb szint az adott nyelv konkrét terminusaira vonatkozik. Az adatbázison belül lehetőség van több terminust megadni nyelvenként (vagy adott esetben a terminus rövidítését, ahogy a fenti képen is látható). Minden terminusnak az adott fogalomhoz kell kapcsolódnia és külön kell őket bevinni – ez a terminusautonómia elve, vagyis az az irányelv, hogy az ugyanahhoz a fogalomhoz tartozó terminusokat külön kell dokumentálni. Ezen a szinten a következő adatkategóriák találhatók:
- Terminustípusok, amelyek az alábbiak lehetnek:
- Terminus: a fogalom jelölője az adott nyelven, amely lehet akár egy vagy több szó, vagy akár tulajdonnév is.
- Rövidítés
- Kifejezés: olyan kifejezések tartoznak ide, amelyek szigorú értelemben véve nem terminusok, de amelyeknek van bevett fordításuk, vagy amelyek fordítása adott esetben gondot okozhat
- Képlet: kémiai vagy matematikai képlet és más tudományos kifejezés, amelyeket lehetőleg a nemzetközi szabványok figyelembevételével kell írni.
- Rövid változat: pl. egy megállapodás elterjedt neve vagy egy ország nem hivatalos neve. Az olyan terminusokat is ide lehet sorolni, amelyek rövidítéseket tartalmaznak.
- Értékelés: a terminusok használatához kötődő információk az egyik legfontosabb elemei az adatbázisnak. Ezek segítségével nyomon lehet követni, hogy mely terminusok használatát részesítik előnyben, és melyeket érdemes inkább másként használni. Ez funkció mutatja meg, hogy az adatbázis nem pusztán leíró (deskriptív), hanem bizonyos tekintetben előíró (preskriptív) jellegű is.
- preferred: az EU-s szövegekben előnyben részesített teminusok, amelyek biztosítják az EU-s szövegeken belüli konzisztenciát.
- admitted: helyes terminusokat jelölnek, amelyekre azonban van rá jobb szinonima.
- deprecated: széleskörben használt terminusok, előfordulhatnak EU-s vagy egyéb hivatalos szövegekben, de sem eredeti változatában, sem fordításként nem használhatók, mert nem helyesek és nem alkalmasak az uniós szövegekben való használatra.
- obsolete: korábban használt terminus egy adott fogalom leírására, de már nincs használatban.
- Megbízhatóság: a IATE adatbázisnak másik fontos része, amely megmutatja, hogy a terminológiai információk milyen minőségű forrásból származnak, valamint azt is jelzi, ha esetleg a megjelenített adat a korábbi, tagállami adatbázisokból származik-e. A megbízhatóságot 1-től 4-ig terjedő csillagokkal jelölik.
- Terminus referenciája: milyen forrásból származik a terminus. Ez a kategória támasztja alá a megbízhatóság kategóriájában megadott csillagok számár.
Megjegyzés: a terminusra vonatkozó megjegyzések.
- Megjegyzés referenciája: a fenti megjegyzés forrása.
- Kontextus: a terminus használatát szemléltető szövegrészlet. Hasznos kategória, főleg, ha nincs definíció.
- Kontextus referenciája: a fenti kategória forrása.
- Nyelvhasználati tudnivalók: a terminus használatára vonatkozó információk, pl. mindig többesszámban használatos.
- Nyelvhasználati tudnivalók referenciája: a fenti kategória forrása.
- Regionális használat: melyik területen melyik terminust használják, pl. ugyanarra a holland nyelvű fogalomra Hollandiában és Belgiumban van-e külön terminus.
- Regionális használat referenciája: a fenti kategória forrása.
- A terminus tulajdonosa: ha különböző intézmények/testületek más terminust használnak ugyanarra a fogalomra, akkor az adott terminus melyikhez tartozik.
- Nyelvtani információk: a terminusra vonatkozó alapvető nyelvtani információk, úgymint, szófaj, nyelvtani nem (amennyiben van), szám.
A IATE megújult változatának fejlesztése folyamatban van: a következő frissítést előreláthatólag 2019 januárjában teszik közzé, amelyet a jövő év során még számos újítás fog követni.
Források:
- https://iate.europa.eu/home
- http://termcoord.eu/2018/11/the-new-iate-is-online/
- http://termcoord.eu/iate/the-new-iate/
- IATE Handbook – https://iate.europa.eu/assets/IATE_Handbook_public.pdf
- https://slator.com/industry-news/eu-revamps-terminology-database-that-gets-50-million-queries-a-year/