Metaadat szabványok elemzése
Prajczer Tamás
GeoX Kft.
1033 Budapest, Fő tér 1
Tel/fax: 4379-458
[email protected] http://www.geox.hu
Bevezetés
A térbeli adatkészletek metaadatainak szabványosítását illetően a legjelentősebb lökést az amerikai NSDI (National Spatial Data Infrastructure – Nemzeti Térbeli Adat-Infrastruktúra) meghirdetése adta, amely szabványos, kötelező ellenőrzésen alapuló megoldást írt elő a párhuzamos adatelőállítások kiszűrhetőségének biztosítására. A “Content Standards for Digital Geospatial Metadata” szabvány, illetve az ennek elemeire épülő szolgáltatásnál az FGDC szoros határidőt adott a központi költségvetési pénzekből előállított adatkészletek ezen szabvány szerinti dokumentálására. Az így keletkezett metaadatok szolgáltatását kötelezővé tette. Mára 70 fölött van a bekapcsolódott, elsősorban szövetségi szintű intézmények száma.
Az FGDC metaadat-tartalom szabványát – amelyet szellemiségében sok alkalmazás követ, betű szerint azonban talán egy sem – két szempontból éri kritika, támadás: a terjedelme és az általánossága miatt. A terjedelmi problémákra megoldást jelent a minimális változat, amelyet az ISO szabvány tervezete már így tartalmaz. A szakterületi problémák elsősorban a leíró adatok metaadatainak hiányosságai következtében jelentkeznek. Erre megoldást kínáltak a speciális, a szakterületi igényekhez igazodó változatok (NBII, 1997; Cultural, 1997), illetve a szabvány második változata, amely már megengedi a szakterületi kiegészítések beépítését (FGDC, 1998).A szabványos leírások mellett nagyon sok országos, valamint ennél szűkebb kihatású, nem országos vagy nemzetközi, hanem szervezeten belüli szabványokon alapuló szolgáltatás is létezik. Ezeknek legfontosabb alkalmazási területe pl. az távérzékelési adatok szolgáltatása, illetve a különböző üzleti célú térinformatikai adatkatalógusok (pl. ArcData), részletesebb termékleírások.
A hálózat ilyen ütemű fejlődéséhez természetesen az is hozzájárult, hogy a tér
beli adatkészletek metaadataitól függetlenül – elsősorban dokumentum menedzselési és általános kormányzati-közigazgatási információ szolgáltatási, törvényi hátterű kényszerből – igen magas szintre jutott a GILS fejlesztése és tényleges használata. Ez a szervezetek Internet-adaptációját jelentősen könnyítette, s számos köztisztviselő és kapcsolódó szervezet “szokta meg” a webes munkastílust, a világhálós tájékoztatási és információs politika megvalósítását.Európában némi késéssel, az Európai Bizottság az Info2000 program keretében végzett átfogó felmérés után indulhattak meg a fejlesztések, pályázati felhívás alapján, szintén az Európai Bizottság által finanszírozott, CEN-keretben kidolgozott szabványjavaslatokra építve. A CEN TC 287 metaadat szabvány tervezete alapján valósult meg a belgiumi (flamand), a hollandiai és a portugáliai szolgáltatás.
1996-tól az ISO TC 211 és az OGC (Open GIS Consortium = a térinformatikai szoftvergyártókat tömörítő érdekvédelmi, harmonizáló szervezet) tevékenységének megélénkülését követően új elemekkel gazdagodott a metaadatok szabványa. A térinformatikai alapszoftvereknél a konverziós problémák a gyártók OGC keretében végzett “szabványosító” tevékenységének eredményeként megszűntek, a rendszerek különösebb extra ráfordítás nélkül képesek egymás adatait kezelni. A jelentős befolyású OGC részvétele az FGDC és az ISO munkájában hozzájárult ahhoz, hogy az amerikai metaadat szabvány előkészületben lévő, következő változata/generációja már ISO alapú lesz.
Az európai szabványosítással párhuzamosan annak eredményeit figyelembe véve, de az amerikai (FGDC) és globális (ISO) tapasztalatokat sem elhanyagolva megjelentek azok az európai alkalmazások (MEGRIN, ESMI), amelyek közvetlenül érintik a hazai metaadat-tartalom kialakítását.
A minimális metaadat-tartalom kialakításának szempontjai
A hazai térinformatikai metaadat szabvány kialakítását megelőzően, elsősorban a METATÉR projekt megvalósítása miatt szükség volt egy minimális metaadat-tartalom kialakítására. Ennek előzményei már több évre nyúlnak vissza.
A kialakítás során a nemzetközi kapcsolódások miatt figyelembe kellett a meglévő nemzetközi szabványokat és alkalmazásokat. Sajnos ezek sok esetben nem
kompatibilisek egymással, így a magyar minimális változat a szokásos „core” metaadat leírásoknál hosszabb. A térinformatikai metaadat-szolgáltatásnál kialakítandó, egységes törzs-adattartalom meghatározásához a következő szempontokat vettük figyelembe.Az adattartalom meghatározásánál a következő szabványokat, tervezeteket és javaslatokat vettük figyelembe:
Az adattartalom váza az ún. minimális térinformatikai metaadat, amelyet az FGDC szabványa és az ISO szabvány javaslata is definiál. A Dublin Core egyértelműen megadja a minimális elemeket, míg a GILS-ben lévő elemek számuk miatt alkalmasak kiindulási pontként. A minimális változat hiányzik az európai javaslatokból, a kötelezőnek minősített elemek nem egyeznek meg mindenben a fenti minimális adatkészlettel.
Az FGDC szabvány minimális metaadat meghatározása:
„A szabvány kötelezően alkalmazandó fejezeteiben néhány elemet minden té
rbeli adatkészlet esetében meg kell adni. Összehasonlítva más metaadat szabványokkal, ezeket az elemeket »mag« elemeknek hívjuk.”ISO szabvány minimális metaadat definíciója:
„Az 1. szint azokat a minimális elemeket tartalmazza, amelyek segítségével egy adatkészletet egyértelműen azonosítani lehet... Ezt a szintet akkor kell alkalmazni, ha a leírás célja katalógus készítés vagy metaadat szolgáltatás.”
Az elkészített metaadat tartalom nem helyettesíti a hazai szabvány megalkotását, a nemzetközi szabvány(ok) honosítását. Kell azonban egy olyan alap, amelyen a leírások készítését és a szolgáltatást el lehet indítani. Ugyanakkor ennek az alapnak meg kell felelnie annak a követelménynek, hogy alapelemei konformak legyenek a meglévő szolgáltatásokkal és az adatleírások minimális elemeivel. Emiatt a javasolt leírás valamivel több, mint egy minimális tartalom, de több – valamennyi lényeges – szabvány és szolgáltatás felé lehetséges a metaadat exportálás.
A METATÉR projekt metaadat-tartaloma
Metatér ID |
GEO Attriute ID |
GEO Structure |
Occu-rance |
Type |
Domain |
Name |
Definition |
1 | Dataset overview | Information for overall description of the dataset. | |||||
1.1.1 | 4 | 105 | text | free text | Title | The explicity name of the dataset, to sufficiently identify it by the users. | |
1.1.2 | 43 | 105 | ? | text | free text | Abbreviated title | Short name of the dataset. |
1.1.3 | 5 | 105 | ? | text | free text | Series name | Name of the parent dataset to which this dataset belongs together with other ones. |
1.3 | 3805 | 105 | + | list element | cl | Product | The mode in which the data set is represented. |
1.4 | 31 | 5 | date | yyyymmdd | Publication Date | Date when the dataset was published or otherwise made available. | |
1.5 | 54 | 105 | list | ISO 639 | Language | Language and character set used within the dataset, identified by codes defined in ISO 639. | |
1.6 | 62 | 105 | text | free text | Summary | Brief summary of the content of the dataset. | |
1.7 | 2003 | 105 | ? | text | free text | Purpose of Production | Summary of the intentions with which the dataset was developed |
1.8 | 3108 | 105 | text | free text | Progress | Status of the dataset | |
1.9 | 3109 | 105 | ? | text | free text | Update Frequency | Frequency with which changes and additions are made to the dataset. |
1.10 | 2004 | 105 | text | free text | Access Constraints | Constraints regulating the access of the dataset. | |
1.11 | 2005 | 105 | text | free text | Use Constraints | Constraints regulating the usage of the dataset, other than copyright. | |
1.12 | 6911 (2001) | 105 | ? | text | free text | Copyright owners | Name of the organisation(s) owning the copyright of the datset |
1.13 | 3137 | 204 | * | Sample | One or more examples taken from the dataset being representative for the whole dataset. | ||
1.13.1 | 3138 | 105 | text | free text | Name | Names of the sample files (without file extensions). | |
1.13.2 | 3140 | 105 | list | cl | Format | Formats in which the examples are available. | |
2 | Administrative | Information about organisation(s) and person(s) associated with the data set. | |||||
2.1 | 3008 | 204 | + | Organisation | Organisations and their role in relation to the dataset. | ||
2.1.1 | 2024 | 105 | text | free text | Organisation Name | Name of the organisation | |
2.1.2 | 6912 (2000) | 105 | + | list | cl | Organisation Role | Responsibility of the organisation in relation to the dataset. |
2.2 | 3004 | 204 | + | Contact person | Contact person | ||
2.2.1 | 2023 | 105 | text | free text | Contact person name | Whole name ofthe contact person for further information (title, first name, middle name, last name). Family name is indicated with capital letters. | |
2.2.2 | 6913 (3001) | 105 | + | list | cl | Contact person role | Responsibility of the contact person in relation to the dataset. |
2.2.3 | 2032 | 105 | + | text | free text | Telephone | Telephone number on which the contact person can be reached (without country code). |
2.2.4 | 2033 | 105 | + | text | free text | Facsimile | Facsimile phone number. |
2.2.5 | 2030 | 105 | + | text | free text | Contact electronil mail address | Address of the electronic mailbox of the contact person |
2.3 | 3006 | 204 | + | Point of Contact Address | Address of the contact person | ||
2.5.1 | 2025 | 105 | + | text | free text | Postal Address | Address line for the address (visiting address or P.O. Box) |
2.5.2 | 2026 | 105 | + | text | free text | City | City of the address |
2.5.3 | 2028 | 105 | + | text | free text | Postal Code | ZIP or other postal code of the address |
2.5.4 | 2029 | 105 | + | list element | ISO 3166 | Country | Country of the address |
2.5.7 | 3618 | 105 | * | text | free text | Network Address | Network address from which more information or the dataset itself can be available. |
3 | Dataset Extent | The horizontal extent and time period covered by the dataset. | |||||
3.1 | 6923 | 204 | Bounding Extents | The horizontal spatial coverage of the dataset | |||
3.1.1 | 2060 | 201 | ? | Geographic Coordinates | WGS84 bounding coordinates | ||
3.1.1.1 | 2038 | 200 | float number | Earth longitude | West Bounding Coordinate | Western-most coordinate of the limit of coverage | |
3.1.1.2 | 2041 | 200 | float number | Earth latitude | South Bounding Coordinate | Southern-most coordinate of the limit of coverage | |
3.1.1.3 | 2039 | 200 | float number | Earth longitude | East Bounding Coordinate | Eastern-most coordinate of the limit of coverage | |
3.1.1.4 | 2040 | 200 | float number | Earth latitude | North Bounding Coordinate | Northern-most coordinate of the limit of coverage | |
3.1.2 | 6918 | 201 | ? | EOV Coordinates | EOV bounding coordinates | ||
3.1.2.1 | 6919 | 200 | float number | Y min coordinate | Western-most coordinate of the limit of coverage | ||
3.1.2.2 | 6920 | 200 | float number | X min coordinate | Southern-most coordinate of the limit of coverage | ||
3.1.2.3 | 6921 | 200 | float number | Y max coordinate | Eastern-most coordinate of the limit of coverage | ||
3.1.2.4 | 6922 | 200 | float number | X max coordinate | Northern-most coordinate of the limit of coverage | ||
3.2 | 2042 | 105 | * | text | free text | Geographic Extent Name | Name of the areal units which are covered in the dataset |
3.3 | 6914 (3906) | 204 | Temporal Extent | Time period covered by the content of the dataset. | |||
3.3.1 | 2072 | 5 | date | yyyymmdd | Begin Date | from date | |
3.3.2 | 2073 | 5 | date | yyyymmdd | End Date | to date | |
4 | Keywords | Words summarizing an subject of the dataset. | |||||
4.1 | 3122 | 204 | + | Theme | Subjects covered by the data set. | ||
4.1.1 | 2002 | 105 | text | free text | Theme Keyword | Commom-use words or technical terms used to describe the subject of the dataset. | |
4.1.2 | 2036 | 105 | text | free text | Name of theme keyword thesaurus | Name of the registered thesaurus or a similar authorative source of keywords (e.g. standard, law) | |
4.2 | 3128 | 204 | * | Stratum | Layered vertical locations characterised by the data set. | ||
4.2.1 | 3130 | 105 | text | free text | Stratum Keyword | Commom-use words or technical terms used to describe the dataset. | |
4.2.2. | 3129 | 105 | text | free text | Name of stratum keyword thesaurus | Name of the registered thesaurus or a similar authorative source of keywords (e.g. standard, law) | |
4.3 | 3131 | 204 | * | Temporal | Temporal period(s) characterised by the data set. | ||
4.3.1 | 3133 | 105 | text | free text | Temporal Keyword | Commom-use words used to describe the dataset. | |
4.3.2 | 3132 | 105 | text | free text | Name of temporal keyword thesaurus | Name of the registered thesaurus or a similar authorative source of keywords (e.g. standard, law) | |
4.3 | 6902 | 204 | * | Other | Other keywords, not appropriate for the above mentioned three categories. | ||
4.3.1 | 6903 | 105 | text | cl | Other Keyword Type | Method used to group similar keywords (e.g. discipline). Place keywords are used at Geographic Extent Name. | |
4.3.2 | 6904 | 105 | text | free text | Other Keyword | Commom-use words or technical terms used to describe the subject of the dataset. | |
4.3.3 | 6905 | 105 | text | free text | Name of other keyword thesaurus | Name of the registered thesaurus or a similar authorative source of keywords (e.g. standard, law) | |
5 | ? | Quality | General assessment of the quality of the data set. | ||||
5.1 | 3212 | 205 | ? | text | free text | Overall positional accuracy | Average intervals in meters of the accuracy of the geographic position of the objects within the dataset compared to its nominal ground: horizontal accuracy or 3D accuracy. |
5.2 | 3207 | 105 | ? | text | free text | Overall completeness | Average percentage of conformance of the dataset compared to its nominal ground with respect to the presence of objects, association instances, and property instances. |
5.3 | 3503 | 105 | * | list | cl | Spatial Object Type | Name of the point, vector and raster objects used to locate zero-, one-, two, or three-dimensional spatial locations in the dataset (topology should be mentioned if exists). |
5.4 | 3219 | 204 | ? | Linage | Informaion about the source data and processing steps | ||
5.4.1 | 3221 | 105 (204) | * | text | free text | Source | List of sources used to create the dataset. |
5.4.2 | 3228 | 105 | * | text | free text | Processes | Explanation of the processing steps made during the construction of the dataset. |
5.5 | 1012 | 5 | ? | date | yyyymmdd | Last dataset update date | Date when the dataset was last modified. |
6 | ? | Spatial Reference System | Description of the spatial system used reference in the dataset | ||||
6.1 | 6915 (3301) | 105 | * | text | free text | Indirect Reference System | Indirect reference system in which the references to a position are given e.g. administrative units, street names. |
6.2 | 6916 (3401) | 204 | * | Direct Reference System | The system used to represent space in the data set. | ||
6.2.1 | 3462 | 105 | list | cl | Name of Geodetic Datum | Name of the geodetic datum. | |
6.2.2 | 3408 | 105 | list | cl | Name of Map Projection | Name of the projection or type of the coordinates. | |
6.2.3 | 3468 | 105 | list | cl | Name of Vertial Datum | Name of the reference system used for elevation. | |
7 | * | Distribution | General information about options for obtaining the data set. | ||||
7.1 | 6906 | 105 | * | text | free text | Distribution Identifier | Identifier by which the distributor knows the dataset. |
7.2 | 2055 | 105 | * | text | free text | Price | Data aout charges for the dataset, including price per nit and discount possibilities. |
7.3 | 2017 | 105 | * | text | free text | Order process | Data about how to order the dataset, including instructions and expected timescale for the delivery of the dataset. |
7.4 | 6917 (2006) | 105 | * | text | free text | Distribution Unit | Data about the partitioning of the dataset (usually it means geographic partitioning e.g. mapsheets). |
7.5 | 3632 | 105 | * | list | cl | Distribution Media | Media on which the dataset can be received. |
7.6 | 1031 | 105 | * | list | cl | Distribution Format Name | Formats in which the dataset can be delivered. |
8 | Metadata Reference | General information about the metadata | |||||
8.1 | 3702 | 5 | date | yyyymmdd | Last metadata update date | The date of latest review of metadata. | |
8.2 | 64 | 105 | list element | ISO 639 | Metadata Language | Language and character set used for the textual statements in the description of the dataset, identified y codes defined in ISO 639. |
Irodalom
Content Standard for Digital Geospatial Metadata
(Federal Geographic Data Committee, April, 1997)
Dublic Core Elements
http://www.purl.org/metadata/dublin_core_elements
ESMI Search Variables and Metadata
05/21/98, ver. 2.1
European Committee for Standardisation, 1995-09-21
Geographic Information – Data description – Metadata
Geographic Information – 15046 Part 15: Metadata
(ISO/TC 211/WG, December 22, 1997)
Geographical Data Description Directory version 2.1
(MEGRIN Group)
Geographic Information – Data Description – Metadata
(CEN/TC 287/WG 2, November, 1996)
GILS Element Definition
http://www.usgs.gov/gils/elements.html
Javaslat az egységes közigazgatási térinformatikai metaadat-szolgáltatás
koncepciójára és megvalósítására
MeH, 1998, p. 39.
Kovácsné, Prajczer, T., 1995
Evaluation of Metadata Standards
FÖMI, p.36+82.
Prajczer Tamás, Kecskés Zsolt, Székely Iván, 1998
A METATÉR projekt megvalósíthatósági tanulmánya
GeoX, p. 75