Metaadat szabványok elemzése

Prajczer Tamás

GeoX Kft.

1033 Budapest, Fő tér 1

Tel/fax: 4379-458

[email protected]

http://www.geox.hu

 

Bevezetés

A térbeli adatkészletek metaadatainak szabványosítását illetően a legjelentősebb lökést az amerikai NSDI (National Spatial Data Infrastructure – Nemzeti Térbeli Adat-Infrastruktúra) meghirdetése adta, amely szabványos, kötelező ellenőrzésen alapuló megoldást írt elő a párhuzamos adatelőállítások kiszűrhetőségének biztosítására. A “Content Standards for Digital Geospatial Metadata” szabvány, illetve az ennek elemeire épülő szolgáltatásnál az FGDC szoros határidőt adott a központi költségvetési pénzekből előállított adatkészletek ezen szabvány szerinti dokumentálására. Az így keletkezett metaadatok szolgáltatását kötelezővé tette. Mára 70 fölött van a bekapcsolódott, elsősorban szövetségi szintű intézmények száma.

Az FGDC metaadat-tartalom szabványát – amelyet szellemiségében sok alkalmazás követ, betű szerint azonban talán egy sem – két szempontból éri kritika, támadás: a terjedelme és az általánossága miatt. A terjedelmi problémákra megoldást jelent a minimális változat, amelyet az ISO szabvány tervezete már így tartalmaz. A szakterületi problémák elsősorban a leíró adatok metaadatainak hiányosságai következtében jelentkeznek. Erre megoldást kínáltak a speciális, a szakterületi igényekhez igazodó változatok (NBII, 1997; Cultural, 1997), illetve a szabvány második változata, amely már megengedi a szakterületi kiegészítések beépítését (FGDC, 1998).A szabványos leírások mellett nagyon sok országos, valamint ennél szűkebb kihatású, nem országos vagy nemzetközi, hanem szervezeten belüli szabványokon alapuló szolgáltatás is létezik. Ezeknek legfontosabb alkalmazási területe pl. az távérzékelési adatok szolgáltatása, illetve a különböző üzleti célú térinformatikai adatkatalógusok (pl. ArcData), részletesebb termékleírások.

A hálózat ilyen ütemű fejlődéséhez természetesen az is hozzájárult, hogy a térbeli adatkészletek metaadataitól függetlenül – elsősorban dokumentum menedzselési és általános kormányzati-közigazgatási információ szolgáltatási, törvényi hátterű kényszerből – igen magas szintre jutott a GILS fejlesztése és tényleges használata. Ez a szervezetek Internet-adaptációját jelentősen könnyítette, s számos köztisztviselő és kapcsolódó szervezet “szokta meg” a webes munkastílust, a világhálós tájékoztatási és információs politika megvalósítását.

Európában némi késéssel, az Európai Bizottság az Info2000 program keretében végzett átfogó felmérés után indulhattak meg a fejlesztések, pályázati felhívás alapján, szintén az Európai Bizottság által finanszírozott, CEN-keretben kidolgozott szabványjavaslatokra építve. A CEN TC 287 metaadat szabvány tervezete alapján valósult meg a belgiumi (flamand), a hollandiai és a portugáliai szolgáltatás.

1996-tól az ISO TC 211 és az OGC (Open GIS Consortium = a térinformatikai szoftvergyártókat tömörítő érdekvédelmi, harmonizáló szervezet) tevékenységének megélénkülését követően új elemekkel gazdagodott a metaadatok szabványa. A térinformatikai alapszoftvereknél a konverziós problémák a gyártók OGC keretében végzett “szabványosító” tevékenységének eredményeként megszűntek, a rendszerek különösebb extra ráfordítás nélkül képesek egymás adatait kezelni. A jelentős befolyású OGC részvétele az FGDC és az ISO munkájában hozzájárult ahhoz, hogy az amerikai metaadat szabvány előkészületben lévő, következő változata/generációja már ISO alapú lesz.

Az európai szabványosítással párhuzamosan annak eredményeit figyelembe véve, de az amerikai (FGDC) és globális (ISO) tapasztalatokat sem elhanyagolva megjelentek azok az európai alkalmazások (MEGRIN, ESMI), amelyek közvetlenül érintik a hazai metaadat-tartalom kialakítását.

 

A minimális metaadat-tartalom kialakításának szempontjai

A hazai térinformatikai metaadat szabvány kialakítását megelőzően, elsősorban a METATÉR projekt megvalósítása miatt szükség volt egy minimális metaadat-tartalom kialakítására. Ennek előzményei már több évre nyúlnak vissza.

A kialakítás során a nemzetközi kapcsolódások miatt figyelembe kellett a meglévő nemzetközi szabványokat és alkalmazásokat. Sajnos ezek sok esetben nem kompatibilisek egymással, így a magyar minimális változat a szokásos „core” metaadat leírásoknál hosszabb. A térinformatikai metaadat-szolgáltatásnál kialakítandó, egységes törzs-adattartalom meghatározásához a következő szempontokat vettük figyelembe.

Az adattartalom meghatározásánál a következő szabványokat, tervezeteket és javaslatokat vettük figyelembe:

Az adattartalom váza az ún. minimális térinformatikai metaadat, amelyet az FGDC szabványa és az ISO szabvány javaslata is definiál. A Dublin Core egyértelműen megadja a minimális elemeket, míg a GILS-ben lévő elemek számuk miatt alkalmasak kiindulási pontként. A minimális változat hiányzik az európai javaslatokból, a kötelezőnek minősített elemek nem egyeznek meg mindenben a fenti minimális adatkészlettel.

Az FGDC szabvány minimális metaadat meghatározása:

ISO szabvány minimális metaadat definíciója:

Az elkészített metaadat tartalom nem helyettesíti a hazai szabvány megalkotását, a nemzetközi szabvány(ok) honosítását. Kell azonban egy olyan alap, amelyen a leírások készítését és a szolgáltatást el lehet indítani. Ugyanakkor ennek az alapnak meg kell felelnie annak a követelménynek, hogy alapelemei konformak legyenek a meglévő szolgáltatásokkal és az adatleírások minimális elemeivel. Emiatt a javasolt leírás valamivel több, mint egy minimális tartalom, de több – valamennyi lényeges – szabvány és szolgáltatás felé lehetséges a metaadat exportálás.

A METATÉR projekt metaadat-tartaloma

Metatér ID

GEO Attriute ID

GEO Structure

Occu-rance

Type

Domain

Name

Definition

1 Dataset overview Information for overall description of the dataset.
1.1.1 4 105 text free text Title The explicity name of the dataset, to sufficiently identify it by the users.
1.1.2 43 105 ? text free text Abbreviated title Short name of the dataset.
1.1.3 5 105 ? text free text Series name Name of the parent dataset to which this dataset belongs together with other ones.
1.3 3805 105 + list element cl Product The mode in which the data set is represented.
1.4 31 5 date yyyymmdd Publication Date Date when the dataset was published or otherwise made available.
1.5 54 105 list ISO 639 Language Language and character set used within the dataset, identified by codes defined in ISO 639.
1.6 62 105 text free text Summary Brief summary of the content of the dataset.
1.7 2003 105 ? text free text Purpose of Production Summary of the intentions with which the dataset was developed
1.8 3108 105 text free text Progress Status of the dataset
1.9 3109 105 ? text free text Update Frequency Frequency with which changes and additions are made to the dataset.
1.10 2004 105 text free text Access Constraints Constraints regulating the access of the dataset.
1.11 2005 105 text free text Use Constraints Constraints regulating the usage of the dataset, other than copyright.
1.12 6911 (2001) 105 ? text free text Copyright owners Name of the organisation(s) owning the copyright of the datset
1.13 3137 204 * Sample One or more examples taken from the dataset being representative for the whole dataset.
1.13.1 3138 105 text free text Name Names of the sample files (without file extensions).
1.13.2 3140 105 list cl Format Formats in which the examples are available.
2 Administrative Information about organisation(s) and person(s) associated with the data set.
2.1 3008 204 + Organisation Organisations and their role in relation to the dataset.
2.1.1 2024 105 text free text Organisation Name Name of the organisation
2.1.2 6912 (2000) 105 + list cl Organisation Role Responsibility of the organisation in relation to the dataset.
2.2 3004 204 + Contact person Contact person
2.2.1 2023 105 text free text Contact person name Whole name ofthe contact person for further information (title, first name, middle name, last name). Family name is indicated with capital letters.
2.2.2 6913 (3001) 105 + list cl Contact person role Responsibility of the contact person in relation to the dataset.
2.2.3 2032 105 + text free text Telephone Telephone number on which the contact person can be reached (without country code).
2.2.4 2033 105 + text free text Facsimile Facsimile phone number.
2.2.5 2030 105 + text free text Contact electronil mail address Address of the electronic mailbox of the contact person
2.3 3006 204 + Point of Contact Address Address of the contact person
2.5.1 2025 105 + text free text Postal Address Address line for the address (visiting address or P.O. Box)
2.5.2 2026 105 + text free text City City of the address
2.5.3 2028 105 + text free text Postal Code ZIP or other postal code of the address
2.5.4 2029 105 + list element ISO 3166 Country Country of the address
2.5.7 3618 105 * text free text Network Address Network address from which more information or the dataset itself can be available.
3 Dataset Extent The horizontal extent and time period covered by the dataset.
3.1 6923 204 Bounding Extents The horizontal spatial coverage of the dataset
3.1.1 2060 201 ? Geographic Coordinates WGS84 bounding coordinates
3.1.1.1 2038 200 float number Earth longitude West Bounding Coordinate Western-most coordinate of the limit of coverage
3.1.1.2 2041 200 float number Earth latitude South Bounding Coordinate Southern-most coordinate of the limit of coverage
3.1.1.3 2039 200 float number Earth longitude East Bounding Coordinate Eastern-most coordinate of the limit of coverage
3.1.1.4 2040 200 float number Earth latitude North Bounding Coordinate Northern-most coordinate of the limit of coverage
3.1.2 6918 201 ? EOV Coordinates EOV bounding coordinates
3.1.2.1 6919 200 float number Y min coordinate Western-most coordinate of the limit of coverage
3.1.2.2 6920 200 float number X min coordinate Southern-most coordinate of the limit of coverage
3.1.2.3 6921 200 float number Y max coordinate Eastern-most coordinate of the limit of coverage
3.1.2.4 6922 200 float number X max coordinate Northern-most coordinate of the limit of coverage
3.2 2042 105 * text free text Geographic Extent Name Name of the areal units which are covered in the dataset
3.3 6914 (3906) 204 Temporal Extent Time period covered by the content of the dataset.
3.3.1 2072 5 date yyyymmdd Begin Date from date
3.3.2 2073 5 date yyyymmdd End Date to date
4 Keywords Words summarizing an subject of the dataset.
4.1 3122 204 + Theme Subjects covered by the data set.
4.1.1 2002 105 text free text Theme Keyword Commom-use words or technical terms used to describe the subject of the dataset.
4.1.2 2036 105 text free text Name of theme keyword thesaurus Name of the registered thesaurus or a similar authorative source of keywords (e.g. standard, law)
4.2 3128 204 * Stratum Layered vertical locations characterised by the data set.
4.2.1 3130 105 text free text Stratum Keyword Commom-use words or technical terms used to describe the dataset.
4.2.2. 3129 105 text free text Name of stratum keyword thesaurus Name of the registered thesaurus or a similar authorative source of keywords (e.g. standard, law)
4.3 3131 204 * Temporal Temporal period(s) characterised by the data set.
4.3.1 3133 105 text free text Temporal Keyword Commom-use words used to describe the dataset.
4.3.2 3132 105 text free text Name of temporal keyword thesaurus Name of the registered thesaurus or a similar authorative source of keywords (e.g. standard, law)
4.3 6902 204 * Other Other keywords, not appropriate for the above mentioned three categories.
4.3.1 6903 105 text cl Other Keyword Type Method used to group similar keywords (e.g. discipline). Place keywords are used at Geographic Extent Name.
4.3.2 6904 105 text free text Other Keyword Commom-use words or technical terms used to describe the subject of the dataset.
4.3.3 6905 105 text free text Name of other keyword thesaurus Name of the registered thesaurus or a similar authorative source of keywords (e.g. standard, law)
5 ? Quality General assessment of the quality of the data set.
5.1 3212 205 ? text free text Overall positional accuracy Average intervals in meters of the accuracy of the geographic position of the objects within the dataset compared to its nominal ground: horizontal accuracy or 3D accuracy.
5.2 3207 105 ? text free text Overall completeness Average percentage of conformance of the dataset compared to its nominal ground with respect to the presence of objects, association instances, and property instances.
5.3 3503 105 * list cl Spatial Object Type Name of the point, vector and raster objects used to locate zero-, one-, two, or three-dimensional spatial locations in the dataset (topology should be mentioned if exists).
5.4 3219 204 ? Linage Informaion about the source data and processing steps
5.4.1 3221 105 (204) * text free text Source List of sources used to create the dataset.
5.4.2 3228 105 * text free text Processes Explanation of the processing steps made during the construction of the dataset.
5.5 1012 5 ? date yyyymmdd Last dataset update date Date when the dataset was last modified.
6 ? Spatial Reference System Description of the spatial system used reference in the dataset
6.1 6915 (3301) 105 * text free text Indirect Reference System Indirect reference system in which the references to a position are given e.g. administrative units, street names.
6.2 6916 (3401) 204 * Direct Reference System The system used to represent space in the data set.
6.2.1 3462 105 list cl Name of Geodetic Datum Name of the geodetic datum.
6.2.2 3408 105 list cl Name of Map Projection Name of the projection or type of the coordinates.
6.2.3 3468 105 list cl Name of Vertial Datum Name of the reference system used for elevation.
7 * Distribution General information about options for obtaining the data set.
7.1 6906 105 * text free text Distribution Identifier Identifier by which the distributor knows the dataset.
7.2 2055 105 * text free text Price Data aout charges for the dataset, including price per nit and discount possibilities.
7.3 2017 105 * text free text Order process Data about how to order the dataset, including instructions and expected timescale for the delivery of the dataset.
7.4 6917 (2006) 105 * text free text Distribution Unit Data about the partitioning of the dataset (usually it means geographic partitioning e.g. mapsheets).
7.5 3632 105 * list cl Distribution Media Media on which the dataset can be received.
7.6 1031 105 * list cl Distribution Format Name Formats in which the dataset can be delivered.
8 Metadata Reference General information about the metadata
8.1 3702 5 date yyyymmdd Last metadata update date The date of latest review of metadata.
8.2 64 105 list element ISO 639 Metadata Language Language and character set used for the textual statements in the description of the dataset, identified y codes defined in ISO 639.

 

Irodalom

 

Content Standard for Digital Geospatial Metadata
(Federal Geographic Data Committee, April, 1997)

Dublic Core Elements
http://www.purl.org/metadata/dublin_core_elements

ESMI Search Variables and Metadata
05/21/98, ver. 2.1

European Committee for Standardisation, 1995-09-21
Geographic Information – Data description – Metadata

Geographic Information – 15046 Part 15: Metadata
(ISO/TC 211/WG, December 22, 1997)

Geographical Data Description Directory version 2.1
(MEGRIN Group)

Geographic Information – Data Description – Metadata
(CEN/TC 287/WG 2, November, 1996)

GILS Element Definition
http://www.usgs.gov/gils/elements.html

Javaslat az egységes közigazgatási térinformatikai metaadat-szolgáltatás koncepciójára és megvalósítására
MeH, 1998, p. 39.

Kovácsné, Prajczer, T., 1995
Evaluation of Metadata Standards
FÖMI, p.36+82.

Prajczer Tamás, Kecskés Zsolt, Székely Iván, 1998
A METATÉR projekt megvalósíthatósági tanulmánya
GeoX, p. 75