3.6.4 Geokoodaus verkkojen avulla

 

 

 

Lataa tulostuskelpoinen PDF-versio tästä luvusta koneellesi!

 

 

 

 

 

 

Geokoodaus on yleisnimi analyyseille, joiden avulla osoite-, postinumero- tai muun tunnistetiedon omaaville tietueille luodaan spatiaalisen tiedon sisältävien tietueiden avulla maantieteellinen sijainti.

Osoitteiden geokoodaustarpeen takia luotiin Suomen haja-asutusalueille uusi tien nimeen ja etäisyyteen sen alkupisteestä perustuva osoitejärjestelmä.

Geokoodaus 

Asiakasrekisterit tai muut osoitteelliset tiedot voidaan paikantaa kartalle osoitteen tai muun paikantavan tekijän avulla. Tyypillisin sovellus on osoitteiden geokoodaus. Geokoodausta varten tiedon tulee olla tietokantaan vietävässä muodossa ja lisäksi käytössä on oltava geometriatiedon omaava referenssitietokanta. Referenssitietokannan avulla osoitetieto voidaan sovittaa mahdollisimman lähelle oikeaa sijaintia.

 

Kuva 1. Joensuun  keskusta. Tyypillinen opaskartoissa ja geokoodauksessa käytettävä rasterikäyttöliittymä. Kartan "alla" on geometriatiedon, katujen nimet ja numerotiedon sisältävä verkko (viereinen palsta).  

Referenssitietokannan tauluissa on siis oltava vastaavat osoitteet. Osoitetiedon tarkkuudesta riippuu paikantamisen tarkkuus. Jokainen katu on jaettu segmentteihin, joilla on alku- ja loppuosoite. Tämä tekee mahdolliseksi arvioida segmentin välillä olevien osoitenumeroiden sijainnin arvioinnin (kuva 2). Joissakin toteutuksissa kummallakin tien puolella on oma numerointinsa, jotta sijainti saadaan sijoitettua oikealle puolelle tietä.

 

Kuva 2. Osoitteen sijainnin etsintä tiesegmentin alueelta.

Osoitetaulun ja referenssikannan lisäksi tarvitaan geokoodausproseduuri, joka sisältää erilaiset geokoodaussäännöstöt ja -toleranssit.  Lopputuloksena tietokannan osoiterivistölle saadaan sijainnit karttakoordinaattien muodossa. Osoitteiden sovituksen etenee pääpiirteittäin seuraavasti:

  1. Osoitetietojen rakenteen ja tyylin määritys.

  2. Sovitus ja toleranssien määritys

  3. Osoitteiden sovitus ja tunnistus

  4. Tulosten tarkastus ja toleranssien korjaus

  5. Uudelleen sovitus

  6. Osoitteilla koordinaatit

Ensimmäinen vaiheessa määritetään standardoitu osoitteen rakenne referenssikannalle ja itse prosessoitavalle osoitelistalle. Esimerkiksi ”500 Rankin Street NE”:ssä on neljä osaa: etäisyys kadun alkupisteestä (500), kadun nimi (Rankin), kadun tyyppi (Street) ja suunta (NE). Suomalaisessa osoitteessa ”Hakunintie 21” on vain kadun nimi ja numero. 

Sovitusalgoritmi ottaa yleensä sovitettavan osoitteen osa kerrallaan ja käy läpi kaikki referenssikannan kohteet. Jokaiselle referenssikannan kohteelle lasketaan ns. yhteensovituskerroin, joka kuvaan osoitteiden samanlaisuutta. Korkeimman pistemäärän saaneita kohteita kutsutaan kandidaateiksi. Sovitusparametrien avulla määrätään kandidaateiksi valittavien minimikerroin ja yhteensovituksen minimikerroin. 

Oikeinkirjoituksen herkkyys (eng. spelling sensitivity) kontrolloi kuinka paljon variaatiota voidaan sallia kandidaattien etsinnässä. Alhainen oikeinkirjoitusherkkyys sallii ”Mane”, ”Maine” ja ”Man” kandidaatit

Yleensä osoitteistoissa on virheitä ja puutteita, ja vain osa osoitteiden yhteensovituksesta onnistuu ensimmäisellä kerralla. Puutteita voidaan korjata editoimalla, interaktiivisesti sovittamalla tai käyttämällä uudelleensovitusta uusin parametrein.

 

      

 

 

 

 

 

 

 

Viereiseen karttaan liittyvä verkko, joka  sisältää esim. katujen nimet, verkon osien alku- ja loppukoordinaatit sekä tiedon solmuista (risteykset). Verkko näkyy harvoin loppukäyttäjälle.

Lähde: Tokola ja Kallioniemi: Paikkatietoanalyysi

Helsingin yliopiston metsävarojen käytön laitoksen julkaisuja

Helsinki 2003