Tietojärjestelmien kotoistus – yhteistyötä ja unilukkarina toimimista
Kieli ja tietotekniikka 1/2011

Tero Aalto, Erkki I. Kolehmainen

Tietojärjestelmien kotoistus – yhteistyötä ja unilukkarina toimimista

Moni tietokoneen käyttäjä on törmännyt tilanteeseen, jossa kirjoittamisen esteeksi ovat nousseet tekniikan asettamat rajoitukset. Tarpeellista merkkiä ei löydy merkkivalikoimista saati näppäimistöstä, lainausmerkit kääntyvät aina väärinpäin tai ohjelma tarjoaa outoja ehdotuksia päivämäärän kirjoittamiseksi. Tämäntyyppiset ongelmat johtuvat usein merkintäseikkojen kielikohtaisista eroista.

Jotta tekniikka saataisiin paremmin palvelemaan käyttäjää, käynnistettiin vuonna 2004 Kotimaisten kielten tutkimuskeskuksessa opetusministeriön erityisrahoituksella tietotekniikan kotoistushanke, jonka tarkoituksena on helpottaa kieli- ja kulttuuriympäristön huomioon ottamista tietoteknisissä ratkaisuissa. Syksyllä 2006 sen otti hoitaakseen niin ikään opetusministeriön alainen CSC – Tieteen tietotekniikan keskus. Hankkeella on ohjaus- ja seurantaryhmät, joissa on nykyisellään edustettuina yli 40 asiantuntijatahoa. Seurantaryhmä on kaikille kiinnostuneille avoin.

Yksi kotoistushankkeen tehtävistä on ylläpitää suomen ja Suomessa puhutun ruotsin kielen osalta kansainvälistä kotoistustietokantaa CLDR:ää (Unicoden Common Locale Data Repository). CLDR-tietokantaan syötetään tietoa kielikohtaisista käytänteistä, esim. sellaisista kuin päiväyksen muoto,  kuukausien ja viikonpäivien nimet, valuuttojen, maiden ja kielten nimet ja aakkostusperiaatteet.

Ennen kuin kotoistussuositus syötetään tietokantaan, varmistetaan, että suositus vastaa kieliyhteisössä vakiintunutta käytäntöä.  Kotoistussuositusehdotus lähetetään kannanottokierrokselle, ja  mielipiteensä voivat ilmaista kaikki halukkaat. Lopullinen tietokantaan syötettävä suositus muokataan palautteen perusteella.

Kotoistushanke toimii tiivisti yhteistyössä mm. standardoinnin kanssa. Esimerkiksi kielten nimiä koskevat standardit  SFS-ISO 639-1 ja 639-2  yhtenäistettiin kotoistussuositusten kanssa maaliskuussa 2010. Kotoistushanke on valmistellut myös suomalais-ruotsalaisen monikielisen näppäimistöasettelun, joka vahvistettiin standardiksi (SFS 5966) vuonna 2008.  Kotoistushanke on osallistunut aktiivisesti  kansainväliseen merkistöstandardisointiin.

Osallistumalla toimintaan aktiivisesti voimme parhaiten edistää kansallisten tarpeidemme huomioon ottamista kansainvälisessä standardointityössä. Olemme muun muassa saaneet kotimaista kielentutkimustamme hyödyttävät suomalais-ugrilaiset ja ruotsin landsmålsalfabetetin tarkekirjoitusmerkit tarpeen mukaan nopeasti sisällytetyiksi kansainvälisiin merkistöstandardeihin. Muista  toteutuneista standardointikohteista mainittakoon Suomessa puhutussa romanikielessä käytetty hattu-h (ȟ) sekä karjalan kielen kielikoodin (krl) lisääminen standardiin. Aktiivisuutta osoittaa myös se, että Suomi isännöi kesäkuussa 2011 seuraavaa kansainvälisen standardisointijärjestö ISO:n merkistökokousta.

Kotoistushanke on niin ikään toiminut unilukkarina viranomaiskäytäntöjen parantamiseksi. Kohteena on ollut muun muassa kansallisten merkkien käyttäminen verkko-osoitteissa. Tärkein tämänhetkinen lähikohde on korjata äidinkielen määritteleminen väestörekisterissä. Väestörekisteriin ei  tällä hetkellä voi ilmoittaa äidinkielekseen esimerkiksi Inarin kunnassa virallisesti käytössä olevia inarin- ja koltansaamea (vaikka äidinkielekseen voisi  ilmoittaa  jopa useita tekokieliä!). Toinen, koko Euroopan unionin laajuinen kohde, on henkilönnimien oikeinkirjoitus julkisissa rekistereissä sekä eri maiden rekistereiden yhteentoimivuus. Pelkästään Suomen väestörekisterissä on viisinumeroinen määrä väärin kirjoitetuksi tiedettyjä nimiä. Tekemistä siis riittää.

 

Tero Aalto työskentelee CSC:ssä ja on kotoistushankkeen koordinaattori. Hankkeen aikanaan käynnistänyt Erkki I. Kolehmainen toimii sen riippumattomana konsulttina.

Tero Aalto
Erkki I. Kolehmainen