Tudnivalók a kapcsolt adatokról
Egyre szélesebb körökben jelentkezik az igény a kutatási adatok nyílt elérésére, illetve az adatok összekapcsolására. Az adatok megnyitásával kapcsolatban megélénkült intézmények közötti párbeszédek szemontjából elengedhetetlen két alapfogalom tisztázása:
- Nyílt adat: “olyan adat, amelyet bárki szabadon használhat, újrahasznosíthat, és terjeszthetk- legfeljebb a nevezd meg! és így add tovább! licenc feltételek mellett”1;
- Kapcsolt adat: az adatok interoperabilitására utaló fogalom, amely lehetővé teszi a különböző forrásokban található adatok összekötését (a szemantikus web felépítéséhez kapcsolódik)
Amíg a nyílt adat a korlátok nélkül elérhető adatokat jelenti, a kapcsolt adatok a gép által értelmezhető és szemantikailag összefügő adatokra utal. Így, egy adat lehet nyílt, de nem kapcsolt, vagy lehet kapcsolt, de nem nyílt. Amennyiben mindkét feltétel teljesül, akkor beszélünk kapcsolt nyílt adatról.
Kapcsolt nyílt adatok - Linked Open Data (LOD)
A kapcsolt adatok elősegítik a weben található struktúrált adatok publikálását, megosztását és összekapcsolását.
A kapcsolt nyílt adatok felhasználását egy nyílt forráskodú licenc teszi lehetővé. 2010-ben Tim Berners-Lee kidolgozott egy 5 csillagos értékelési rendszert, amely osztályozza az adatszolgáltatókat által közrebocsájtott adatokat elérhetőségük és interoperabilitásuk alapján:
★ Az adat elérhető a neten bármilyen formában (PDF is), de csak nyílt forráskodú licenc keretében
★★ Az adat gép által értelmezhető struktúrált adatként jelenik meg (excel, szkennelt táblázat helyett)
★★★ Az adat elérhető nem levédett formátumban (CVS, excel helyett)
★★★★ Az előbbi szempontok és W3C nyílt szabványok használata, mint pl. RDF and SPARQL, amely elősegítik más adatokhoz való kapcsolódást
★★★★★ Az előbbi szempontok és más adatokhoz való kapcsolódás összefüggő tartalmak létrehozása érdekében
Milyen elv alapján működik a kapcsolódás?
Annak érdekében, hogy a weben található adatok összekapcsolhatóak legyenek, szükség van egy olyan mechanizmusra, amely az adatok tartalmainak kapcsolatát értelmezi. Ez a mechanizmus a metaadatok értelmezésére használt RDF (Resource Description Framework) keretrendszer.
A források egy hármas RDF azonosítóval látják el (URI) a bennük lévő tételeket, amelyek tartalmazzák a következő elmeket:
- csomópont, annak a dolognak az azonosítója, amit a csomópont reprezentál
- állítmány (tulajdonság), annak a két dolognak a viszonyát azonosítja, amelyet összekapcsol
- tárgy, a kapcsolatot létrehozó tulajdonság értékét adja meg.
Az URI segítségével a web egy hatalmas adatbázis lesz, amelyben az adatok összekapcsolódnak. Az adatbázisok ellátása RDF azonosítókkal még nem hoz létre kapcsolt nyílt adatokat. Annak érdekében, hogy 5 csillagos minősítést kapjon az adott adathalmaz, az RDF halmazok között automatikus linkeket kell létrehozni szabvány szótárak segítségével.
Nemzetközi kezdeményezések a nyílt és kapcsolt adatok támogatására
Research Data Alliance (RDA): az EU, USA, Ausztrália és más kutatási adatokkal foglalkozó intézmények összefogásában megalakult Gothenburgban (Svédország) 2013 márciusában a Kutatási Adatok Együttműködése. Célja az adatszabványok és adatkezelési irányelvek létrehozása és támogatása.
Open Knowledge Foundation (OKF): egy non-profit szervezet a nyílt kutatási adatok támogatásra, amelynek nagy gyakorlata van közösségek létrehozásában. A CKAN, egy nyílt adatportál és adatbázis is az OKF közössége által fenntartott program eredménye.
Open Data Institute (ODI): 2012 decemberében indult UK kezdeményezés, amelynek célja a kutatási adatok köré épülő új kultúra és üzlet elősegítése, illetve a szabványok támogatásával új gazdasági és társadalmi értékek teremtése. Az intézetet Tim Berners-Lee and Nigel Shadbolt alapította állami támogatás felhasználásávall.
Global Open Data for Agriculture and Nutrition (GODAN): a Nyílt Állami Együttműködések találkozóján, 2013 októberében létrehozott program, amely globális szinten támogatja a mezőgazdasággal és táplákozással kapcsolatos adatok nyílt hozzáférhetőségét.
Referenciák
[1] Open Knowledge Foundation. Open Definition. Available at http://opendefinition.org, Accessed December 11 2013.
RDF fogalma: http://www.w3c.hu/forditasok/RDF/REC-rdf-concepts-20040210.html
Berners-Lee, Tim, 2009. Linked Data. Available at http://www.w3.org/DesignIssues/LinkedData, Accessed December 11 2013.