Wojciech Pachelski
CBK PAN / IGiK, Warszawa
Standaryzacja i jakość w systemach informacji przestrzennej
Streszczenie
Niniejszy referat przedstawia ogólną problematykę standaryzacji w zastosowaniu do systemów informacji przestrzennej i w powiązaniu z zagadnieniami jakości. Standary zacja w SIP oznacza przede wszystkim rozwój, niezależnych od środowisk narzędziowych, instytucjonalnych, przedmiotowych i innych, metodologii projektowania i środków formalnych opisywania baz danych przestrzennych. Tak rozumiana standaryzacja, uzupełniona stanowieniem norm jako dokumentów techniczno - prawnych, jest utożsamiana z normalizacją. Jakość w SIP, natomiast, można rozpatrywać dwojako: w sensie ogólnym -jako jakość samych systemów informacji przestrzennej "jako takich", jak też w sensie szczegółowym - pod względem jakości danych zarządzanych przez te systemy. W pierwszym przypadku problematyka jakości jest związana z etapami działań prowadzących do powstania systemu: uwarunkowania, projektowanie, realizacja oraz wdrożenie i eksploatacja, w drugim zaś chodzi o sformułowanie spójnego systemu oceny jakości danych przestrzennych, warunkującego ich efektywne wykorzystanie przez użytkowników. Oba aspekty jakościowe systemów informacji przestrzennej są ściśle powiązane z uregulowaniami metodologicznymi zawartymi w normach międzynarodowych (ISO), europejskich (CEN) i krajowych (PKN).
1. Wstęp
Standaryzacja metod i środków formalnych w systemach informacji przestrzennej, wraz z normalizacją jako jej formą techniczno - prawną, oraz problematyka jakości w tych systemach są niezwykle silnie i wielorako ze sobą powiązane poprzez konieczność stworzenia jednolitych ram metodologicznych i formalnych dla projektowania i opisywania tych systemów, jak też poprzez konieczność jakościowego porównywania i oceny tych systemów według spójnych, a więc standardowych, zasad i kryteriów. Z jednej bowiem strony zgodność projektów SIP i budowanych na ich podstawie aplikacji narzędziowych z uznawanymi i akceptowanymi wzorcami, a więc standardami, jest podstawowym (jak to wykazuję w niniejszym opracowaniu) kryterium dla oceny ich jakości, z drugiej zaś strony wszelkie oceny jakości wymagają wspólnych i akceptowanych - czyli standardowych - poziomów odniesienia. Dotyczy to zarówno całościowych ocen systemów "jako takich" ("dobry system" - "zły system"), jak też ocen danych przestrzennych będących przedmiotem systemu. W tym ostatnim przypadku w grę wchodzą znowu standardy bądź normy.
W niniejszym opracowaniu przedstawiam encyklopedyczne informacje o standaryzacji i normalizacji, jak też o standardach i normach, oraz z zakresu usystematyzowanych ocen jakości wyrobów, w beżpośreidnim powiązaniu z ogólną, tj. niezależną od środków komputerowych, metodologią projektowania i środkami formalnymi opisu baz danych przestrzennych. Ta metodologia i środki formalne są przedmiotem przywoływanej grupy norm europejskich,podczas gdy problematyka ogólnych ocen jakości opiera się na normach międzynarodowych z grupy ISO 9000.
2. Podstawy standaryzacji
Krajowe źródła encyklopedyczne traktują standaryzację i normalizację w znaczeniu technicznym jako pojęcia synonimiczne i definiują je jako:
- działalność polegającą głównie na opracowywaniu, rozpowszechnianiu i wprowadzaniu w życie norm. Ważną korzyścią wynikającą z normalizacji jest dostosowanie wyrobów, procesów i usług do celów, którym mają służyć, zapobieganie powstawaniu barier tech-nicznych (...). Normalizacja może mieć jeden lub więcej specyficznych celów związa-nych z zapewnieniem funkcjonalności wyrobom, procesom lub usługom, m.in. reduko-wanie zbędnej różnorodności wyrobów (...), zapewnienie ich użyteczności oraz kompatybilności i zamienności (...), (NEP, 1996);
- opracowywanie i wprowadzanie jednolitych wzorcowych norm, zwłaszcza technicznych, dotyczących wymaganych właściwości normalizowanego przedmiotu. Podstawowe zadania normalizacji: uproszczenie i umożliwienie porozumiewania się (...), doprowadzenie do jednoznacznej i powtarzalnej oceny ilości i jakości wyrobów, kształtowanie optymalnej ich różnorodności (...), (WEP, 1966).
Kluczowym pojęciem w tych definicjach jest norma, którą z kolei definiuje się jako:
- przyjęty na zasadzie konsensu i zatwierdzony przez upoważnioną jednostkę organizacyjną dokument ustalający - do powszechnego i wielokrotnego stosowania - zasady, wytyczne lub charakterystyki odnoszące się do różnych rodzajów działalności lub ich wyników i zmierzający do uzyskania optymalnego stopnia uporządkowania w określonej dziedzinie, (PN-N, 1994);
- (...) przepis pisemny, będący wynikiem normalizacji; zwykle dokument (...) przyjęty na zasadzie konsensu (...) i zatwierdzony przez odpowiednią jednostkę (...); ustala, do powszechnego i stałego użytkowania, zasady postępowania i cechy charakterystyczne wyrobów, procesów lub usług; zastosowanie postanowień zawartych w normach pozwala na uzyskanie optymalnego stopnia uporządkowania w normalizowanej dziedzinie, (NEP, 1996);
- dokument techniczno - prawny określający w sposób jednoznaczny wymagania jakościowe lub ilościowe odnośnie przedmiotu normy - w oparciu o rozwiązania sprawdzone i uznane za najkorzystniejsze z możliwie najogólniejszego punktu widzenia, a także zalecający lub zobowiązujący do ich przestrzegania, (WEP, 1966).
W powszechnym użyciu oba pojęcia, normalizacja i standaryzacja, a także norma i standard, funkcjonują w sposób zamienny, co częstokroć prowadzi do nieporozumień wynikających z ich nieco różniących się faktycznie znaczeń. Zasadniczą, cechą normy jest bowiem jej postać i cecha wraz z wynikającymi stąd konsekwencjami jako ściśle zdefiniowanego dokumentu, aktu prawnego bądź przepisu, "przyjętego na zasadzie konsensu" i "zatwierdzonego przez odpowiednia jednostkę" do "powszechnego i wielokrotnego stosowania". Cechy tej nie musi posiadać natomiast standard, który jest zwykle traktowany jako pewien powszechnie i zwyczajowo uznawany i stosowany wzorzec metody, technologii, procesu, wyrobu, jakości lub tp., a także symbol, znak, termin czy zwrot, nie zawsze nawet posiadający ścisłą, wyczerpującą i jednoznaczną definicję.
Standaryzacja jest więc rozumiana przeważnie jako:
- całość działań zmierzających do opracowania, rozwinięcia, adaptacji, modyfikacji i upowszechnienia pewnych wzorcowych i optymalnych rozwiązań koncepcyjnych, teoretycznych i praktycznych, w tym także działań zmierzających do ustanowienia norm (Pachelski, Wysocka; 1999); bądź też jako:
- proces prowadzący do stworzenia i zastosowania zestawu reguł i porozumień między wieloma potencjalnymi użytkownikami w celu stworzenia przejrzystości i jednolitości wszędzie tam, gdzie zróżnicowanie jest niepożądane (Aalders, 1996).
Powyższe definicje precyzują cele i zadania standaryzacji i normalizacji, a mianowicie m.in.: zapobieganie barierom technicznym, zapewnienie funkcjonalności wyrobów i redukowanie ich zbędnej różnorodności, ułatwienie porozumiewania się poprzez ujednolicenie pojęć i symboli, umożliwienie jednolitej oceny jakości wyrobów, kształtowanie ich optymalnej różnorodności oraz uporządkowanie danej dziedziny co do pojęć, terminologii, metod, procesów, kryteriów jakościowych itp. Jednocześnie do ważnych aspektów standaryzacji i normalizacji należy, jak to wynika z tych definicji, aspekt konsensu, czyli powszechnej - w określonym środowisku - akceptacji proponowanych rozwiązań. Rozwiązań nie uznawanych powszechnie jako optymalne w danej sytuacji, a zatem nie mających takiej akceptacji, nie da się bowiem narzucić odgórnie, drogą administracyjną (na co istnieje dostatecznie wiele przykładów o randze dowodu). Dotyczy to także norm, które na ogół nie mają w Polsce, w myśl ustawy o normalizacji (Ustawa, 1993), charakteru obligatoryjnego. Ich stosowanie musi więc być opłacalne dla użytkowników poprzez spełnienie wymienionych powyżej celów.
Fakt ten determinuje dwa główne kierunki, metody i środki standaryzacji:
- kierunek merytoryczny, który obejmuje opracowanie, rozwinięcie, adaptację i modyfikację pewnych wzorcowych i optymalnych rozwiązań koncepcyjnych, teoretycznych i praktycznych; występuje tu konieczność ścisłego zdefiniowania tak przedmiotu standaryzacji, jak i proponowanych rozwiązań szczegółowych, co wraz z formą stosownego aktu techniczno - prawnego oznacza wprost normalizację jako metodę działania; jest to zatem standaryzacja poprzez normalizację;
- kierunek promocyjny, obejmujący upowszechnianie proponowanych rozwiązań w środowiskach praktyków i użytkowników poprzez propagowanie przykładowych zastosowań, edukację, wymianę doświadczeń, staże itp.; oznacza to konieczność przekonania tych środowisk o zasadności proponowanych rozwiązań i korzyściach z ich płynących, co często jest powiązane z pokonaniem licznych barier merytorycznych, technologicznych, psychologicznych (jak rutyna i przyzwyczajenia, a także bariera wiedzy i umiejętności) i innych; jest to standaryzacja poprzez upowszechnianie.
Normalizacja jest więc ważnym, a nawet nieodzownym, elementem standaryzacji. W kraju zagadnienia normalizacji regulowane są od 1 stycznia 1994 r. specjalnymi aktami prawnymi (Ustawa, 1993), które m.in.:
- ustanawiają ogólnie wspomnianą wcześniej dobrowolność stosowania norm (z wyjątkiem konkretnych norm obligatoryjnych, wymienionych oddzielnie);
- postulują wykorzystywanie norm międzynarodowych przy opracowywaniu Polskich Norm oraz wymagają niesprzeczności, tych ostatnich z normami międzynarodowymi;
- nadają Polskiemu Komitetowi Normalizacyjnemu (PKN) wyłączność na stanowienie Polskich Norm oraz udział w pracach międzynarodowych organizacji normalizacyjnych; PKN działa poprzez Biuro Komitetu i Normalizacyjne Komisje Problemowe.
Zarówno standardy, będące wynikiem procesów standaryzacyjnych, jak i normy, będące ich formami o randze i atrybutach aktów techniczno - prawnych, są nieodzowne dla wzajemnego rozumienia się i komunikowania ludzi i systemów informacyjnych. Mają one szczególne znaczenie właśnie w systemach informacji przestrzennej, w których takie wzajemne rozumienie i komunikowanie się jest nie tylko ich immanentną cechą, ale wręcz jedną z ich podstawowych funkcji. Stąd dla zharmonizowanego i racjonalnego rozwoju SIP standaryzacja i normalizacja, polegające głównie na wypracowaniu pewnych wzorcowych rozwiązań i ustanowieniu norm definiujących pojęcia, metody, schematy, modele, języki formalne itp., przeznaczone do ogólnego, tj. abstrahującego od konkretnych środków sprzętowych i programowych, opisu modeli informacji przestrzennej, projektowania baz danych przestrzennych, sposobów dostępu do danych i ich przenoszenia (transferu), a także do opisu funkcji i procesów realizowanych na tych danych, są wprost warunkiem koniecznym. Znaczenie tych działań wzmacnia w sposób istotny fakt, iż praktyczna realizacja SIP musi z natury rzeczy następować w wysoce zróżnicowanych środowiskach, zarówno pod względem platform sprzętowo - programowych, jak i pod względem zakresów przedmiotowych, form instytucjonalnych, preferencji użytkowników itp.
Reasumując standaryzacja w systemach informacji przestrzennej obejmuje:
- jako cel:
- zapobieganie barierom technicznym,
- zapewnienie funkcjonalności wyrobów i redukowanie ich zbędnej różnorodności,
- ułatwienie porozumiewania się poprzez ujednolicenie pojęć i symboli,
- umożliwienie jednolitej oceny jakości wyrobów,
- kształtowanie ich optymalnej różnorodności oraz uporządkowanie danej dziedziny;
- jako przedmiot:
- metodologię projektowania baz danych: opracowanie i adaptację, upowszechnianie, oraz zastosowania wzorcowych metod i rozwiązań, w tym m.in. technik projektowania, języków leksykalne, notacji graficznych, itp.;
- środki formalne opisu danych, ich transferu oraz wykonywanych funkcji i usług;
- definicje pojęć i terminologię;
- jako warunki:
- powszechną akceptację,
- dobrowolność stosowania (nieobligatoryjność),
- niezależność od środków narzędziowych; oraz
- jako metodykę:
- normalizację w skali międzynarodowej (ISO),
- europejskiej (CEN) i krajowej (PKN).
3. Problematyka jakości
Jakość wyrobów jest przedmiotem ogólnych uregulowań normatywnych w serii norm międzynarodowych ISO 9000. W problematyce jakości w odniesieniu do systemów informacji przestrzennej mają zastosowanie zarówno te uregulowania ogólne, jak też uregulowania szczegółowe, które odnoszą się do samych danych przestrzennych zarządzanych przez te systemy. Te ostatnie uregulowania szczegółowe zawarte są w normie europejskiej ENV 12656 (CEN, 1997) Geographic Information - Data description - Quality, w grupie norm dotyczących informacji przestrzennej, i przedstawione pokrótce w p. 5 niniejszego opracowania.
Poniżej przedstawiona jest pierwsza grupa zagadnień jakości, która dotyczy systemów informacji przestrzennej "jako takich", traktowanych całościowo. W grupie tej zastosowanie ma zwłaszcza norma (PKN-ISO, 1996) Systemy jakości - Model zapewnienia jakości w projektowaniu, pracach rozwojowych, produkcji, instalowaniu i serwisie. Norma ta już w tytule wymienia etapy prowadzące do powstania ogólnie określonego wyrobu, a mianowicie projektowanie, prace rozwojowe, produkcja oraz instalacja i serwis, co ma bezpośredni związek z etapami budowy systemu informacyjnego, w tym systemu informacji przestrzennej, omówionymi w p. 4.
Omawiana norma zawiera opis procedur i wymagań niezbędnych dla spełnienia przez wyrób stosownych wymagań (kryteriów) jakościowych i ma zastosowanie w przypadku, gdy m.in. (cytat):
wymagane jest projektowanie, a wymagania dotyczące wyrobu wyrażone są głównie jako jego cechy użytkowe lub gdy niezbędne jest ustalenie tych wymagań.
W tym kontekście kluczowe znaczenie w całej normie, a także dla jej zastosowań w procesie budowy systemu informacji przestrzennej, ma wprowadzona przez te normę definicja wyrobu, a mianowicie:
wyrób: Wynik działań lub procesów przy czym:
Wyrób może być materialny (np. zespoły lub przetworzone materiały), niematerialny (np. wiedza lub koncepcje) albo stanowić ich kombinację(podkr. WP).
Dodatkowymi definicjami, przydatnymi w analizach jakości systemów informacji przestrzennej i wprowadzonymi tą normą, są:
oferta: Propozycja przedstawiona przez dostawcę w odpowiedzi na propozycję zawarcia umowy dotyczącej dostarczenia wyrobu.
umowa: Uzgodnione pomiędzy dostawcą a klientem wymagania, przedstawione w dowolnej formie.
Jak stąd wynika, zarówno zakres stosowania normy, jak i powyższe definicje, mają zastosowanie i stanowią podstawę dla ogólnej (całościowej) analizy jakości systemów informacji przestrzennej. Aspekt ten jest szerzej omówiony w p. 4.3 poniżej.
Norma EN-ISO 8402, przywoływana tutaj za normą prENV 12656 Geographic Information - Data description - Quality. (CEN, 1997), definiuje ponadto m.in. następujące pojęcia:
jakość: całokształt charakterystyk wyrobu wyrażających jego zdolność do spełnienia postulowanych i implikowanych potrzeb.
specyfikacja: dokument ustanawiający wymagania.
4. Proces budowy systemu informacyjnego
4.1. Etapy budowy systemu
Jak podkreślałem w kilku wcześniejszych opracowaniach (m.in. Pachelski, 1995a i b) budowanie systemu informacyjnego jest, podobnie jak konstruowanie dowolnego urządzenia, procesem inżynierskim, w którym dają się wyróżnić następujące etapy:
- identyfikacja uwarunkowań zewnętrznych i lokalnych, które definiują cel i zakres systemu oraz jego warunki środowiskowe, techniczne, ekonomiczne, prawne, organizacyjne i inne;
- projektowanie, obejmujące dokładne i jednoznaczne sformułowanie, w sposób ogólny i niezależny od platform narzędziowych, modelu systemu w postaci schematu pojęciowego, zapisanego za pomocą stosownego języka formalnego i notacji graficznych, którego rolą jest zagwarantowanie jednolitości, spójności i zgodności dowolnej liczby opartych na nim realizacji i zastosowań na różnych platformach;
- realizacja (implementacja) takiego schematu na określonych platformach za pomocą dostępnego na nich oprogramowania;
- wdrożenie (eksploatacja) systemu w poszczególnych ośrodkach, które obejmuje wypełnienie bazy danych konkretnymi danymi oraz przejście do praktycznej rutynowej eksploatacji systemu.
Etapy te są zilustrowane na Rys. 1, gdzie obok powyższych ich określeń przytoczone są odpowiadające im oznaczenia według Polskiej Normy (PKN-ISO, 1996). Fakt ten, jak też przytoczony wcześniej zakres stosowania tej normy oraz zawarta w niej definicja wyrobu, pozwalają traktować poszczególne etapy jako procesy, do których odnoszą się uregulowania tej normy.
Rys. 1. Etapy budowy systemu informacyjnego w nawiązaniu do normy PN-ISO 9001 (PKN-ISO, 1996)
Pośród wymienionych w p. 4.1 i na Rys. 1 etapów budowy systemu informacyjnego decydujące znaczenie dla tego, w jakim stopniu będzie on w stanie wykonywać stawiane zadania i pełnić określone funkcje, czyli o jakości systemu, mają pierwsze dwa etapy, tj. etap identyfikacji uwarunkowań i etap projektowania. Jednocześnie konieczność porozumiewania się ludzi i systemów w warunkach nieodzownej różnorodności rozwiązań praktycznych w odmiennych środowiskach instytucjonalnych, przedmiotowych, organizacyjnych i innych, zwłaszcza zaś w warunkach zróżnicowanego sprzętu i oprogramowania, powoduje, że właśnie te dwa etapy powinny podlegać i podlegają standaryzacji i normalizacji metodologicznej. W chwili obecnej najbardziej zaawansowaną i nowoczesną metodologię tego rodzaju przedstawiają sobą normy europejskie w grupie Informacja przestrzenna, opracowane i ostatnio ratyfikowane przez CEN1). (Normy międzynarodowe ISO w tej dziedzinie są jeszcze w końcowej fazie opracowania).
Z drugiej strony i z tych samych powodów wszelkie ewentualne działania standaryzacyjne w stosunku do pozostałych dwóch etapów, tj. do realizacji oraz do wdrożenia i eksploatacji systemu, należałoby uznać za niecelowe, nieracjonalne i niepraktyczne. Znaczna różnorodność dostępnych obecnie platform sprzętowo - programowych oraz ich ciągły i intensywny rozwój, także w zakresie specyficznych dla tych platform środków formalnych, powodują bowiem konieczność traktowania tych etapów oddzielnie w każdym przypadku. Takie działania powodowałyby w konsekwencji efekty przeciwne do zamierzonych, a mianowicie obniżenie efektywności budowy i funkcjonowania SIP oraz istotne zawężenie kręgu użytkowników.
Powyższe uwagi w niczym nie ograniczają potrzeby, celowości i zakresów stosowania norm jakościowych do wszystkich czterech etapów budowy systemu informacyjnego (zob. p. 4.3).
Dominującą obecnie koncepcją metodologiczną w zakresie systemów informacyjnych są tzw. relacyjne bazy danych oraz metoda ich projektowania - tzw. metoda związków encji. W przypadku systemów informacji przestrzennej koncepcja ta jest podstawą metodologii modelowania i opisu baz danych oraz projektowania funkcji i procesów zawartej w normach CEN. Zasadniczym pojęciem w tej metodologii jest pojęcie encji2), które Barker (1996) definiuje jako rzecz lub obiekt, rzeczywisty lub wyobrażony, mający dla nas znaczenie (ważny), o którym informacje mają być dostępne. Według tej metody encje danego modelu pozostaję ze sobą w pewnych relacjach oraz mają przypisane odpowiednie atrybuty. Przedmiotem projektowania jest właśnie m.in. ustalenie zbioru encji w danym modelu oraz opisanie ich atrybutów i relacji pomiędzy nimi.
Zawarta w normach europejskich metodologia projektowania baz danych przestrzennych obejmuje tzw. schematy pojęciowe dla szeregu zagadnień ogólnych i wspólnych dla wszystkich działów informacji przestrzennej, jak jakość, geometria i topologia, bezpośrednie i pośrednie opisywanie położenia, transfer danych, jak też reguły budowania tzw. schematów aplikacyjnych, które są schematami pojęciowymi dla określonych konkretnych dziedzin zastosowań. Reguły te, jak też zasady ich integracji z innymi rozwiązaniami normatywnymi, są przedmiotem normy (CEN, 1999) zatytułowanej Reguły budowy schematów aplikacyjnych. Z tego względu normę tę należy uznać za kwintesencję omawianej metodologii informacji przestrzennej oraz za najważniejszy dokument tej grupy norm CEN. Rola i znaczenie schematów aplikacyjnych polega głównie na tym, że mogą i powinny one stanowić podstawę kompatybilnych realizacji narzędziowych w zróżnicowanych środowiskach. Omawiana metodologia pozwala również na efektywną harmonizację (tj. doprowadzenie do wzajemnej spójności) już istniejących oddzielnych realizacji narzędziowych, takiej spójności nie mających.
Sformułowany w myśl omawianej metodologii dla dowolnej dziedziny bądź dla dowolnego jej części pojęciowy schemat aplikacyjny definiuje w sposób ogólny (niezależny) skład i strukturę odpowiadającego mu zbioru danych przestrzennych, abstrahuje natomiast od konkretnych treści danych. Każdy schemat aplikacyjny pełni podwójną rolę:
- sformułowanie w kategoriach informatycznych i udokumentowanie zasad interpretacji danych przestrzennych, jakie są niezbędne dla powszechnego i poprawnego ich rozumienia3), oraz
- dostarczenie czytelnej przez zróżnicowane media komputerowe formy opisu danych przestrzennych, umożliwiającej zastosowanie tych mediów do zarządzania danymi.
Uzgodniony pomiędzy użytkownikami schemat aplikacyjny jest środkiem zapewniającym poprawne komunikowanie informacji przestrzennej poprzez m.in. efektywny transfer danych, z uwzględnieniem aspektów znaczeniowych.
Budowa schematu aplikacyjnego jest procesem, na który składają się z następujące etapy:
- ścisłe sformułowanie przedmiotu i zakresu modelowania oraz przegląd uwarunkowań zewnętrznych i wymagań użytkowników w danej dziedzinie zastosowań;
- modelowanie pojęciowe, polegające na sformułowaniu głównych encji, relacji, atrybutów i ograniczeń w ustalonym zakresie przedmiotowym modelowania w postaci tzw. schematu semantycznego;
- powiązanie (czyli integracja) tak powstałego modelu ze schematami pojęciowymi zawartymi w normach do postaci kompletnego schematu aplikacyjnego.
W pierwszym etapie chodzi o sprecyzowanie, wychodząc od potrzeb przyszłych użytkowników, przedmiotu, celów i funkcji, jakie mają być pełnione przez przyszłe realizacje. Jest to bodaj najważniejszy element uzgodnień co do koncepcji systemu informacji przestrzennej dla określonego zakresu przedmiotowego w gronie jego projektantów oraz potencjalnych administratorów i użytkowników. Pozwala to projektować pewien standardowy (ew. podlegający normalizacji) schemat aplikacyjny jako wzorzec dla przyszłych oddzielnych i niezależnych ogniw realizacyjnych. Całość koncepcji systemu winna być opracowana i uzgodniona według znormalizowanej metodologii oraz wyrażona i udokumentowana za pomocą stosownych i również znormalizowanych środków formalnych (normy europejskie zalecają stosowanie w tym celu języka EXPRESS oraz jego notacji graficznej).
W etapie drugim następuje stopniowe uszczegółowienie powstającego schematu do postaci tzw. schematu semantycznego, będącego głównym składnikiem schematu aplikacyjnego formułowanym przez użytkownika. Etap ten obejmuje:
- zidentyfikowanie i sklasyfikowanie głównych encji w określonym zakresie przedmiotowym;
- wyszczególnienie relacji i atrybutów dla poszczególnych encji;
- sformułowanie ograniczeń nakładanych na relacje i atrybuty.
Wynikiem tego etapu schemat semantyczny danego modelu sformułowany w formie poglądowej jako diagram (zespół diagramów) w notacji graficznej oraz w formie kompletnej, podlegającej formalnej kontroli poprawności za pomocą stosownego oprogramowania, w języku EXPRESS.
Etap trzeci (zob. Rys. 2) polega połączeniu schematy semantycznego użytkownika ze stosownymi fragmentami znormalizowanych schematów pojęciowych dotyczących geometrii i topologii (norma ENV 12160), bezpośrednich (ENV 12762) i pośrednich (ENV 12661) lokalizacji przestrzennych oraz jakości danych (ENV 12656) do postaci kompletnego schematu aplikacyjnego, umożliwiającego jego pełną realizację narzędziową. Omawiana norma ENV 13376:1999 (CEN, 1999) przedstawia zarówno odpowiednie do tego celu konstrukcje języka EXPRESS, jak też szczegółowe metody wykorzystania powyższych norm na zasadzie podobnej, jak w programach obliczeniowych wykorzystuje się składniki bibliotek algorytmów.
Rys. 2. Struktura schematu aplikacyjnego bazy danych przestrzennych według normy ENV 13376 (CEN, 1999)
Sformułowany według powyższych zasad pojęciowy schemat aplikacyjny może i powinien stanowić podstawę dla budowy, w etapie trzecim, kompatybilnych aplikacji SIP, niezbędnych dla efektywnego transferu danych, w kilku typowych sytuacjach, m.in.:
- realizacja pewnego wzorcowego schematu pojęciowego za pomocą różnych narzędzi sprzętowo programowych i w różnych środowiskach instytucjonalnych;
- realizacja schematów pojęciowych pochodzących z różnych źródeł na tej samej platformie, oraz
- jako podstawa dla harmonizacji już istniejących aplikacji SIP.
4.3. Ogólne aspekty jakości SIP
Punktem wyjścia dla analizy ogólnych aspektów jakości w systemach informacji przestrzennej winna być, moim zdaniem, przytoczona w p. 3 definicja jakości według normy EN-ISO 8402 jako całokształtu charakterystyk wyrobu wyrażających jego zdolność do spełnienia postulowanych i implikowanych potrzeb. Podobnie, jak praktycznie eksploatowana aplikacja SIP powstaje w toku procesu przedstawionego na Rys. 1, tak końcowa charakterystyka jakościowa tej aplikacji w powyższym sensie jest sumą charakterystyk jakościowych wyrobów powstających w poszczególnych etapach tego procesu. Oczywistą jest przy tym hierarchia tych charakterystyk: jakość wyrobu wcześniejszego, stanowiącego dane dla kolejnego etapu, warunkuje jakość wyrobu w etapie kolejnym. Każdy kolejny etap może bowiem zniweczyć jakość wykorzystywanych danych, żaden jednak nie może poprawić jakości wyrobu wcześniejszego.
Z kolei przytoczona w p. 3 za normą (PKN-ISO, 1996) definicja wyrobu oraz dopuszczalny jego niematerialny charakter pozwalają wynik każdego etapu w procesie budowy systemu traktować właśnie jako wyrób, do którego odnoszą się wszystkie uregulowania tej normy. W szczególności dotyczy to etapu pierwszego Uwarunkowania, którego "wyrobem" są ujęte w definicji jakości postulowane i implikowane potrzeby. Wyrób ten, stanowiący dane wejściowe dla etapu Projektowanie, ma zatem najwyższy priorytet w hierarchii ocen jakości. Naturalnym warunkiem koniecznym dla jakości całego przedsięwzięcia (i jednocześnie kryterium jakościowym w pierwszym etapie) jest zatem kompletne, ścisłe i jednoznaczne sformułowanie postulowanych i implikowanych potrzeb SIP w postaci uwarunkowań i założeń wyjściowych.
Kolejnym etapem omawianego procesu jest Projektowanie, do którego odnosi się obszerna metodologia projektowania baz danych przestrzennych będąca przedmiotem regulacji normatywnych CEN, zasygnalizowana w p. 4.2 powyżej. Stąd jako bodaj najważniejsze kryterium jakościowej oceny projektu bazy danych przestrzennych, będącego "wyrobem" w tym etapie, należy przyjąć obszernie rozumianą zgodność projektu z normami europejskimi. Wynika to z przytoczonych wcześniej celów standaryzacji i normalizacji, jak: zapobieganie barierom technicznym, zapewnienie funkcjonalności, ułatwienie porozumiewania się, umożliwienie jednolitej oceny jakości, kształtowanie różnorodności wyrobów oraz porządkowanie danej dziedziny, jak też z naturalnego założenia, że omawiane normy europejskie tym właśnie celom służą.
W tej sytuacji kwestią techniczną pozostaje stwierdzenie tej zgodności. W przypadku Polskich Norm kwestię tę reguluje Znak zgodności z Polską Normą (PKN, 2000), który jest stosowany na podstawie certyfikatów tej zgodności przyznawanych z ramienia Polskiego Komitetu Normalizacyjnego przez upoważnione krajowe jednostki certyfikujące wyroby. Znak zgodności z PN to:
zastrzeżony znak, przyznawany lub stosowany zgodnie z zasadami systemu certyfikacji, wskazujący, że zapewniono odpowiedni stopień zaufania, iż dany wyrób, proces lub usługa są zgodne z określoną normą lub innym dokumentem normatywnym.
Jednak znak i certyfikat zgodności dotyczą Polskich Norm, a nie norm europejskich. Fakt ten należy, moim zdaniem, traktować jako dodatkowy argument za intensyfikacją prac zmierzających do adaptacji norm europejskich w dziedzinie informacji przestrzennej jako Polskich Norm.
Jak to uzasadniono w p. 4.2, pozostałe etapy procesu budowy systemu (Realizacja oraz Wdrożenie i eksploatacja) nie są przedmiotem normalizacji metodologicznej. Zgodnie z definicją wyrobu do każdego z tych etapów mają, natomiast, zastosowanie normy jakościowe z rodziny ISO 9000. Problematyka ta wykracza jednak poza ramy niniejszego opracowania.
5. Szczegółowe aspekty jakości danych przestrzennych
5.1. Uwagi ogólne
Jak zaznaczono w p. 4.2., budowa schematu aplikacyjnego według norm europejskich obejmuje m.in. powiązanie (czyli tzw. integrację) schematu semantycznego, sformułowanego przez użytkownika, z opisanymi w normach schematami pojęciowymi (bądź ich fragmentami): geometrii i topologii, bezpośredniego opisywania położenia, identyfikatorów geograficznych oraz jakości. Poniżej omówiony jest przegląd reguł opisywania jakości danych przestrzennych zawartych w normie ENV 12656 Geographic Information - Data description - Quality (CEN, 1997). Norma ta specyfikuje rodzaje danych właściwe dla opisu jakości, które obejmują zarówno szczegóły o pochodzeniu i zastosowaniach konkretnych zbiorów danych przestrzennych, jak też rezultaty miar jakości w ramach w stosunku do wcześniej ustanowionej skali bądź względem innych podobnych danych. Norma ta ma zastosowanie:
- w przypadku dostawców danych przestrzennych pragnących całościowo opisać jakość dostarczanych przez siebie danych;
- w przypadku opisu informacji o jakości konkretnego zbioru danych przestrzennych dostarczanego użytkownikowi;
- w przypadku potencjalnych użytkowników danych przestrzennych pragnących opisać swe wymagania co do jakości danych.
Konkretne zbiory danych przestrzennych mogą być wynikiem zarówno połączeń, jak i podziałów, innych zbiorów danych, przy czym połączenia mogą dotyczyć wielu źródeł i epok zbiorów pierwotnych, podziały zaś mogą być dokonywane według zadanych zasięgów przestrzennych i czasowych oraz klas i atrybutów danych oryginalnych. Dlatego też informacja o jakości danych może być kojarzona z dowolnym poziomem danych, tj. zarówno z całym zbiorem danych, z jego podzbiorem, jak też z każdą indywidualną jednostką (instancją) danych. Jakość danych przestrzennych jest opisywana za pomocą tzw. elementów jakości, które mają zastosowanie na wszystkich tak rozumianych poziomach.
Element jakości jest zdefiniowany jako jednostka informacji opisującej jakość zbioru danych przestrzennych i stąd ma zastosowanie do encji, atrybutów i relacji zawartych w tych danych. Elementami jakości danych są:
- pochodzenie, czyli opis historii powstania danego zbioru danych przestrzennych;
- wykorzystanie, czyli opis dotychczasowych prac i projektów, w których dany zbiór danych przestrzennych był wykorzystywany;
- zestaw wymiernych parametrów jakości (przynajmniej jeden parametr), które opisują jakość informacji przestrzennej w stosunku do pewnego wcześniej ustalonego wzorca nominalnego;
- jednorodność, czyli tekstowy i jakościowy opis oczekiwanej bądź stwierdzonej (przetestowanej) jednolitości parametrów jakościowych w danym zbiorze danych przestrzennych.
Jeśli schemat aplikacyjny obejmuje informację o jakości danych przestrzennych, to powinna ona zawierać przynajmniej jeden z powyższych elementów jakości.
Dodatkowo definiuje się pojęcie tzw. metajakości w poczwórnym znaczeniu:
- jako miara zaufania do informacji o jakości danych;
- jako miara niezawodności informacji o jakości danych;
- jako opis metodologii użytej do uzyskania informacji o jakości danych;
- jako tzw. efekt abstrakcyjny, wyjaśniający rozbieżności pomiędzy stanem faktycznym a wzorcem nominalnym.
Pojęcie to może być wykorzystane jako charakterystyka jakościowa wszystkich powyższych elementów jakości danych przestrzennych.
5.2. Pochodzenie
Pochodzenie jako element jakości jest opisem historii powstania danego zbioru danych przestrzennych w kategoriach danych źródłowych, dat, zastosowanych procesów przetwarzania danych oraz stosownych organizacji. Na element ten składają się następujące typy informacji:
- produkcja, czyli "kto?", "kiedy?" i "dlaczego?", w tym: nazwa organizacji, na zamówienie której powstały omawiane dane, oraz cel i data wytworzenia danych;
- źródło i procesy przetwarzania, czyli "kto?", "co i jak?", "kiedy?" i "dlaczego?", w tym: pierwotne dane źródłowe oraz szczegóły dotyczące danych wejściowych, wykorzystanych metod, nazwa organizacji przetwarzającej, data, cel.
5.3. Wykorzystanie
Ten element jakości danych przestrzennych może obejmować zespół rekordów opisujących wcześniejsze wykorzystanie danych przestrzennych. Na każdy taki rekord mogą się składać:
- nazwa organizacji wykorzystującej;
- typ wykorzystania przez tę organizację;
- ograniczenia i uwarunkowania stwierdzone w toku wykorzystania;
- data wykorzystania; czyli "przez kogo? ", " dlaczego? ", "jakie ograniczenia? " i " kiedy? ".
5.4. Parametry jakości
Wymierne aspekty danych przestrzennych względem pewnego nominalnego wzorca opisywane są poprzez zespół (przynajmniej jeden) parametrów jakości, z których każdy może się składać ze wskaźników jakości, te zaś z kolei - z miar jakości. Wartości tych ostatnich wskazują dopiero na jakość informacji przestrzennej. Zdefiniowanymi w normie parametrami jakości danych przestrzennych są:
- dokładność położenia (dokładność względna w poziomie, dokładność względna w pionie, dokładność zdefiniowana przez użytkownika),
- dokładność semantyczna (dokładność klasyfikacji encji, zgodność wartości atrybutów),
- dokładność czasowa (np. dokładność pomiaru czasu, data ostatniej aktualizacji),
- kompletność (procent pominiętych bądź nadmiarowych encji), oraz
- spójność logiczna (procent zgodności cech geometrycznych, topologicznych, znaczeniowych oraz zgodnej struktury pliku).
przy czym podaje się również reguły, według których można definiować parametry dodatkowe.
Uszczegółowieniem parametrów jakości są, wskaźniki jakości, z których każdy winien zawierać:
- nazwę wskaźnika;
- tekst opisujący dany aspekt jakości, oraz
- definicje zespołu miar jakości.
Te ostatnie zawierają:
- nazwę miary,
- opis testów wykonanych celem uzyskania ilościowego wyniku dla danej miary, oraz
- typy wartości dla danej miary.
Wynikiem miary jakości jest:
- wartość lub zestaw wartości liczbowych zdefiniowanych jako miara jakości,
- jednostka miary,
- data testu,
- każdy z elementów metajakości (p. 5.1) charakteryzujących jakość wyniku.
Schematyczną strukturę parametrów jakości przedstawia Rys. 3, znormalizowaną strukturę parametru "dokładność pozycji" zaś, jako przykład, Tablica 1.
Tabela 1. Przykładowa struktura parametru "dokładność położenia"
| Wskaźniki jakości | Miary jakości |
| Względna dokładność w poziomie |
- Śr. błąd kwadratowy + błąd systematyczny w poziomie.
- Dokładność progowa w poziomie (l. błędów poniżej wartości progowej w procentach).
|
| Względna dokładność w pionie |
- Śr. błąd kwadratowy + błąd systematyczny w pionie.
- Dokładność progowa w poziomie (l. błędów poniżej wartości progowej w procentach).
|
| Dokładność bezwzględna (w układzie odniesienia) |
- Śr. błąd kwadratowy dla każdej ze współrzędnych.
- Elipsa błędu.
|
| Dokładność położenia względem obiektów sąsiednich |
Błąd standardowy odległości. |
| Dokładność położenia piksela |
Śr. błąd kwadratowy położenia piksela. |
| Dokładność identyfikatorów geograficznych |
Procentowa zgodność z innymi źródłami. |
5.5. Jednorodność
Element ten wyraża jednolitość rozkładu danego parametru jakości w obrębie danego zbioru danych przestrzennych ze względu na rozciągłość w przestrzeni i w czasie, typy encji, wartości atrybutów itp. Przykładami opisu jednorodności są:
- dokładność położenia w poziomie jest najwyższa w pobliży wybrzeża;
- spójność logiczna jest najwyższa dla danych pozyskanych po r. 1994;
- dokładność semantyczna jest najwyższa dla długich rzek;
- kompletność danych jest najwyższa dla miast.
6. Zakończenie i wnioski
Standardy metodologiczne projektowania oraz standardowe środki formalne opisywania baz danych przestrzennych, jak też ich formy techniczno - prawne w postaci norm, są warunkiem koniecznym (aczkolwiek nie wystarczającym) zapewnienia budowanym systemom informacji przestrzennej odpowiedniej jakości w sensie zdolności do spełnienia postulowanych i implikowanych potrzeb. Podstawowym kryterium dla oceny jakości systemów informacji przestrzennej w sensie ogólnym jest zgodność tych systemów i poszczególnych ich części z normami europejskimi (bądź z Polskimi Normami opartymi na normach europejskich).
Normy w dziedzinie informacji geograficznej pozwalają m.in. projektować i opisywać bazy danych przestrzennych oraz procesy transferu tych danych w kategoriach geoinformatyki, w sposób powszechnie zrozumiały w szeroko pojmowanych środowiskach użytkowników tej informacji oraz przez inne systemy informacyjne. Takie formułowanie baz danych przestrzennych oraz procesów ich transferu jest prawdopodobnie jednym z najważniejszych zadań geodezji stosowanej obecnie oraz jej produktem finalnym na użytek innych dziedzin.
Formą stosowania norm winna być przede wszystkim budowa wzorcowych pojęciowych schematów aplikacyjnych w poszczególnych dziedzinach, ich uzgadnianie w stosownych kręgach użytkowników oraz realizacja systemowa w odpowiednich instytucjach. Metodologia zawarta w omawianych normach pozwala również na efektywną harmonizację (tj. doprowadzenie do wzajemnej spójności) już istniejących aplikacji i baz danych przestrzennych, jak też na łączne wykorzystywanie danych pochodzących z różnych źródeł.
Jakość danych przestrzennych zarządzanych przez SIP jest przedmiotem oddzielnej normy w grupie norm europejskich i jest formułowana w kategoriach elementów jakości. Na te ostatnie składają się: pochodzenie danych, wykorzystanie danych, wymierne parametry jakości (w tym parametry definiowane przez użytkownika) oraz jednorodność.
Literatura:
- Aalders HJGL (1996): Standaryzacja przez współpracę. Mat. VI-tej
Konf. Nauk. - Techn. PTIP Systemy Informacji Przestrzennej., Warszawa.
- Baker R (1996): Case MethodSM - Modelowanie związków encji. WNT, Warszawa.
- CEN (1997): Geographic Information - Data description - Quality. prENY 12656. CEN.
- CEN (1999): Geographic Information - Data description - Rules for application schemas.ENV 13376. CEN.
- NEP (1996): Nowa Encyklopedia Powszechna PWN. WN PWN, Warszawa.
- Pachelski W(1995a): Standaryzacja danych przestrzennych w Polsce: propozycje pilnych przedsięwziąć. IV-ta Konf. PTIP'95, Warszawa.
- Pachelski W(1995b): Standaryzacja: miejsce i zakres w systemach informacji przestrzennej. Mat. Konf. "Systemy Informacji Przestrzennej", Kraków, 23 - 24 listopada 1995 r.
- Pachelski W, Wysocka E (1999): Standaryzacja systemów informacji przestrzennej: teoria i praktyka. Prace IGiK XLVI (98).
- PKN (2000): Znak zgodności z PN. www.pkn.pl.
- PKN-ISO (199?): PN-ISO 8402:199?: Zarządzanie jakością i zapewnienie jakości - Terminologia. Polski Komitet Normalizacyjny.
- PKN-ISO (1996): PN-ISO 9001:1996: Systemy jakości - Model zapewnienia jakości w projektowaniu, pracach rozwojowych, progukcji, instalowaniu i serwisie. Polski Komitet Normalizacyjny.
- Ullman JD (1988): Systemy baz danych. WNT, Warszawa.
- Ustawa (1993): Ustawa o normalizacji. Dz.U. z 1993 r. nr 55 poz.251, Dz.U. z 1995 r. nr 95, póz. 471 oraz rozporządzenia wykonawcze.
- WEP(1966): Wielka Encyklopedia Powszechna, t. 8. PWN, Warszawa.
Przypisy :
- Comité Européen de Normalisation.
- Jest to powszechnie obecnie stosowany w teorii relacyjnych baz danych termin odpowiadający pojęciowemu modelowi fizycznego lub abstrakcyjnego obiektu świata rzeczywistego. Został on wprowadzony do terminologii krajowej w polskim przekładzie książki Ullmana (1988).
- Jako dodatkową, uboczną rolę schematu aplikacyjnego można uznać automatyczną kontrolę gramatycznej i znaczeniowej poprawności projektu, implikowaną właśnie opisem w języku formalnym wraz z możliwością komputerowej analizy składni tego opisu. W języku formalnym nie można bowiem poprawnie wyrazić rzeczy niepoprawnych - inaczej niż w języku naturalnym, który nie zawiera mechanizmów sprawdzania sensowności formułowanych w nim zdań.