Uuden sanan pitkä matka Kielitoimiston sanakirjaan
Artikkeli 2/2018

Minna Haapanen

Uuden sanan pitkä matka Kielitoimiston sanakirjaan

Minkälainen on sanan matka sanakirjaan, eli mitä kaikkea uudesta hakusanasta kirjoitetulle sana-artikkelille tapahtuu, ennen kuin se on valmis julkaistavaksi?

Kielitoimiston sanakirjan uusi päivitysversio julkaistiin verkossa kesäkuun 2018 alussa. Päivityksessä sanakirjaan lisättiin lähes 650 uutta hakusanaa ja yli 1 100 vanhaa sana-artikkelia ajantasaistettiin.

Sanakirjan toimitus julkisti jo maaliskuun alussa maistiaisia päivityksen uusista hakusanoista. Median lisäksi myös tavalliset sanakirjan käyttäjät kiinnostuivat uusista sanoista, ja uutuudet valtasivat maaliskuisen hakutilastomme kärjen, vaikka ne tuolloin vielä puuttuivatkin sanakirjasta.

Jos pystyimme jo maaliskuussa kertomaan päivitykseen tulevista uusista sanoista, miksi itse julkaisemiseen kului sen jälkeen vielä kolme kuukautta? Eikö nykytekniikalla voisi lisätä sana-artikkelin verkkosanakirjaan tuosta vain, vaikka samana päivänä?

Nopea julkaiseminen olisi varmasti teknisesti mahdollista, mutta sanakirjan toimitusprosessissa aikaa tarvitaan moneen muuhunkin kuin kirjoittamis- ja julkistamisvaiheeseen.

Kurkistetaanpa tähän toimitusprosessiin eli siihen, mitä kaikkea sana-artikkeleille tapahtuu, ennen kuin ne ovat valmiita julkaistaviksi.

Uusien hakusanojen metsästys

Vaikka teknisiin vaiheisiin kuluukin jokaisella päivityskierroksella kuukausia, eniten aikaa tarvitaan toki itse sana-artikkeleiden toimitustyöhön. Työ alkaa aina uusien hakusanojen metsästyksellä. Suuri osa sanoista saadaan sanastamalla eli järjestelmällisellä aineistonkeruulla. Keräämme tietoa sanoista ja niiden käyttöyhteyksistä eri lähteistä, pääasiassa sanoma- ja aikakauslehdistä.

Uusien sanojen lisäksi sanastamalla poimitaan myös uusia merkityksiä sanakirjassa jo oleville sanoille. Sanastamalla kertyy vuosittain yli 5 000 uutta sanalipputietuetta Kotimaisten kielten keskuksen (eli Kotuksen) Nykysuomen sana-arkistoon. Näiden sanalippujen hakusanoista vain pieni osa päätyy lopulta sanakirjaan.

Sanakirjan käyttäjät lähettävät palautetta.

Uusia hakusanoja saadaan myös käyttäjäpalautteesta. Palaute on toimituksellemme ensiarvoisen tärkeää, sillä juuri käyttämällähän sanakirjan puutteet ja virheet huomataan. Saamme palautetta sähköpostitse ja Kotuksen somekanavien kautta. Kotuksen työntekijöiltäkin, varsinkin kielineuvojilta ja muilta sanakirjantekijöiltä, saamme arvokasta palautetta sanakirjamme sisällöstä.

Myös erikoisalojen sanastot ja asiantuntijayhteistyö vievät uusien hakusanojen äärelle. Toimituksemme jäsenet pysyvät kosketuksissa eri alojen sanoihin mm. osallistumalla Lääketieteen sanastolautakunnan työhön ja Tietotekniikan termitalkoisiin sekä antamalla vuosittain lausuntoja useista eri alojen sanastoluonnoksista. Lisäksi käymme läpi eri aloilla julkaistuja sanastoja sanakirjamme tarpeiden kannalta. – Ja mikään alahan ei voi olla vieras yleiskielen sanakirjan toimitukselle.

Viranomaisten päätökset ja eri hallinnonaloilla tapahtuvat muutokset tuovat sanakirjaan uusia hakusanoja ja aiheuttavat muutoksia vanhoihin artikkeleihin. Näin tapahtui esimerkiksi silloin, kun lääneistä luovuttiin ja AVIt ja ELYt tulivat ajankohtaisiksi. Samoin kävi silloinkin, kun markasta luovuttiin ja siirryttiin euroon.

Päivitystä tehtäessä käydään läpi myös aiemmassa sanakirjan päivityksessä ns. odotushuoneeseen jääneet artikkeliehdotukset, joita päätoimittajan päätöksestä ei vielä tuolloin valittu mukaan. Ehkä hakusanat tai niiden merkitykset eivät olleet kielenkäytössä vielä riittävän vakiintuneita. Odottamaan jääneet sanat saattavat kuitenkin päästä sanakirjaan jo seuraavassa päivityksessä.

Uudet hakusanat eivät aina ole uusia sanoja. Sanakirjaan lisätään jatkuvasti myös ”vanhoja sanoja”, eli sellaisia, jotka sattuvat puuttumaan sanakirjasta, koska niiden puuttumista ei vain ole aiemmin huomattu. Tällaiset sanat siis kuuluisivat kyllä sanakirjaan, mutta ne eivät vain ole osuneet esimerkiksi sanastajan haaviin. Viime päivitysversioihin lisättyjä vanhoja tuttuja sanoja ovat olleet mm. ompelurasia, sorminukke, valepukki ja viimein.

Millaiset sanat otetaan sanakirjaan ja kuinka nopeasti?

Toimitusohjeiden mukaan sanakirjaan valittavien sanojen pitäisi olla laajasti ja yleisesti käytössä. Sanakirjaan ei siis oteta sellaisia sanoja, joita käytetään vain jollakin pienellä maantieteellisellä alueella. Myöskään jonkin suppean erityisryhmän käyttämiä sanoja ei oteta mukaan.

Sanakirjaan valittavien sanojen tulisi olla myös kieleen vakiintuneita eli sellaisia, joiden oletetaan jäävän kielenkäyttöön. Arvioimme toimituksessa sanojen käytön vakiintuneisuutta ja yleisyyttä esimerkiksi erilaisilla verkko- ja arkistohauilla. Mitään tarkkoja esiintymämäärävaatimuksia sanojen mukaan ottamiselle ei kuitenkaan ole, eikä valintakriteerien soveltaminen ole muutenkaan yksiselitteistä.

Sanan sanakirjaan päätymiseen ei liity myöskään mitään aikarajaa tai odotusaikaa. Jotkin sanat (esimerkiksi salarakas) ovat voineet joutua odottamaan sanakirjan odotushuoneessa useammankin päivityksen yli, ennen kuin ne on lopulta todettu riittävän vakiintuneiksi sanakirjaan päästäkseen.

Toiset sanat taas otetaan heti julkitulonsa jälkeen mukaan sanakirjan seuraavaan versioon. Tällaisia ovat vaikkapa viranomaisten päätöksiin ja yhteiskunnallisiin muutoksiin liittyvät sanat, kuten esimerkiksi kansalaisaloite ja yleisradiovero.

Nopeasti sanakirjaan pääsevät myös jotain kokonaisuutta täydentävät sanat. Esimerkiksi saimaannorpan ja laatokannorpan seuraksi lisättiin viimeisimmässä päivityksessä itämerennorppa.

Sanakirjan sisäiset verkot

Myös sanakirjassa jo oleva sisältö vaikuttaa siihen, millaisia lisäyksiä ja muutoksia sanakirjaan tehdään. Uudet artikkelit on sijoitettava loogiseksi osaksi sanakirjakokonaisuutta eli sanakirjan sisäisiä verkkoja. Ei riitä, että uusi artikkeli on sisällöltään ja rakenteeltaan hyvä; sen on myös oltava tyyliltään ja muodoltaan linjassa aiempien artikkelien kanssa. Lisäksi uusi artikkeli pitää kytkeä oikealla tavalla muihin siihen liittyviin artikkeleihin.

Suhteet sana-artikkeleiden välillä voivat olla tiukempia tai löyhempiä. Yhteys voi perustua esimerkiksi samamerkityksisyyteen eli synonymiaan (namiska = namikka), samannäköisyyteen eli homonymiaan (1. appi ja 2. appi) tai vaikkapa yhteiseen perus- tai määriteosaan (harrastelaji, harrasteurheilu). Myös samaan erikoisalaan tai aihekokonaisuuteen kuuluvat sanat on muistettava ottaa huomioon.

Joskus sisäisen verkon muodostavat rakenteeltaan tai muodoltaan samanlaiset artikkelit. Esimerkiksi prepaid-artikkelia kirjoitettaessa otettiin mallia sanakirjassa jo olleen postdoc-artikkelin rakenteesta. Molempiahan käytetään sekä yhdyssanojen alkuosina että itsenäisinä sanoina.

Uuden artikkelin lisääminen aiheuttaa usein muutoksia sanakirjassa jo oleviin artikkeleihin, tai se voi vaatia vielä lisäartikkeleiden kirjoittamista. Kun sanakirjaan lisättiin leivinhiiva ja ravintohiiva, jouduttiin muuttamaan myös vanhoja artikkeleita leipomohiiva ja oluthiiva.

Sanakirjaan lisätään uusia artikkeleita myös sen vuoksi, että sanojen selitteissä käytetään lähinnä vain sellaisia sanoja, jotka esiintyvät itsekin sanakirjassa hakusanoina. Kun lisäsimme hakusanan mantelijuoma, kirjoitimme uuden artikkelin myös sanasta kasvijuoma, koska sanaa tarvittiin mantelijuoman selitteessä.

Uuden sana-artikkelin kirjoittaminen

Kun uusi hakusanaksi sopiva sana on löytynyt, ryhdytään etsimään tietoja sen eri merkityksistä, kirjoitusasuista, ääntämisestä, tyylilajista, erikoisalasta jne. Sisältökysymyksissä saamme apua erikoisalojen kirjallisuudesta, verkkosivustoilta ja asiantuntijoilta. Sanan kirjoitusasua tai ääntämistä pohtiessamme saamme puolestaan apua eri kielten asiantuntijoilta. Myös kurkistus muunkielisten sanakirjojen vastaaviin sana-artikkeleihin voi auttaa artikkelin kirjoittamisessa.

Sanakirjan toimittaja etsii tietoja sanan eri merkityksistä, kirjoitusasuista, ääntämisestä, tyylilajista, erikoisalasta jne.

Kun sanasta on kerätty riittävästi luotettavaa ja ajantasaista tietoa, voidaan ryhtyä laatimaan itse sana-artikkelia. Kielitoimiston sanakirjan artikkeli muodostuu peräkkäisistä ja sisäkkäisistä rakenneosista, joista osa on pakollisia ja osa valinnaisia. Tämän ns. rakenteisuuden avulla sanakirjassa voi esimerkiksi kohdistaa hakuja haluttuihin osiin, vaikkapa vain selitteisiin tai vain yhdyssanahakusanoihin.

Artikkelin kirjoittaminen aloitetaan valitsemalla hakusanalle ensisijainen kirjoitusasu ja lisäämällä artikkeliin mahdolliset muut rinnakkaiset kirjoitusasut. Tarvittaessa sanalle annetaan ääntämisohje ja vaikeasti taivutettaville sanoille myös ns. taivutustiedot eli ongelmallisen taivuttamisen sanallinen kuvaus; mallitaivutussarja lisätään kaikkiin taipuviin hakusanoihin. Tarvittaessa merkitään myös, minkä erikoisalan tai tyylilajin sanasta on kyse.

eagle [iigle t. iigl] (taivutus: eagle/a t. ‑ä, ‑lla t. ‑llä jne.) urh. golfissa: par-luvun kahdella alittava reikäkohtainen tulos.

Sanojen merkitykset kerrotaan selitteissä. Toimituksen tehtävänä on muotoilla sanoille pelkistetyt, mahdollisimman tiiviit selitteet. Toisinaan sanan merkitystä on luontevaa havainnollistaa sanan käyttöyhteyksistä kertovien esimerkkien avulla. Vaikka esimerkit muotoillaankin toimituksessa, niiden pohjana ovat yleensä aidot tekstiesimerkit.

Vanhojen artikkelien muutokset

Kirjoitamme Kielitoimiston sanakirjaa varten vuosittain satoja uusia sana-artikkeleita. Vielä useampiin vanhoihin artikkeleihin teemme erilaisia muutoksia. Lisäämme niihin uusia merkityksiä, ajantasaistamme tyylilajeja, korjaamme artikkeleita kielenhuollon uusimpien suositusten mukaisiksi, päivitämme selitteitä sekä poistamme vanhentuneita esimerkkejä ja lisäämme ajantasaisempia. Sen lisäksi, että korjaamme yksittäisiä artikkeleita, teemme joskus myös laajempia, jotain kokonaisuutta koskevia muutoksia.

Vaikka Kielitoimiston sanakirjaan yleensä lisätään artikkeleita, muutamia artikkeleita myös poistetaan jokaisessa päivityksessä, eri syistä. Poistoja tehdään kuitenkin hyvin vähän. Uusimmassa päivityksessä sanakirjasta poistettiin lumelemmikki, jota käytettiin 1990-luvulla virtuaalilemmikin rinnalla mutta joka on jo aikoja sitten väistynyt käytöstä.

Yleensä vanhentunutta sanaa ei kuitenkaan poisteta sanakirjasta, vaan se saa jäädä uuden sanan seuraan, onhan se kuitenkin vielä monille tuttu. Vanhaan artikkeliin lisätään tieto sanan vanhentuneisuudesta ja yleensä myös sen seuraajasta.

rautajää vanh. teräsjää.

Sana-artikkelien tarkistukset

Kun vanhojen artikkelien muutosehdotukset on kirjoitettu valmiiksi, päätoimittaja tarkistaa (ja mahdollisesti korjaa) ja hyväksyy ne. Tämän jälkeen artikkelit päivitetään, eli tiedostoihin tehdään hyväksytyt muutokset. Myös nämä päivitykset tarkistetaan.

Uusien artikkelien tarkistaminen on hieman monivaiheisempaa. Kun toimittaja on saanut valmiiksi muutamia kymmeniä uusia artikkeleita, ne siirtyvät ns. ristiinlukuun. Ristiinluvussa joku toinen toimituksen jäsen lukee kirjoittajan artikkeliehdotukset ja saattaa esittää niihin parannuksia. Mahdollisten muutosten jälkeen artikkeleilla on vuorossa taivutustarkistus, jossa käydään läpi taivutussarjat, vertailumuodot ja taivutustiedot.

Näiden tarkistusvaiheiden jälkeen artikkelit siirretään sisällölliseen lopputarkistukseen eli päätoimittajalle. Hän joko hyväksyy artikkelin sellaisenaan, tekee siihen lisäkorjauksia tai jättää artikkeliehdotuksen ns. odotushuoneeseen. Hyväksytyt ja lisäkorjatut artikkelit jatkavat seuraavaan tarkistukseen, mutta odotushuonekomennuksen saaneet siirretään odottamaan seuraavaa päivitystä.

Kun kaikkien uusien ja muutettujen sana-artikkelien sisältö on tarkistettu, toimituksessa varmistetaan vielä, että ne ovat rakenteellisesti kunnossa. Tämän jälkeen artikkelit lähtevät Kotuksen tietoteknisten asiantuntijoiden käsittelyyn. He tuottavat toimitukselle koosteet uusista ja muutetuista artikkeleista alustavaa tarkistusta varten sekä tallentavat aineiston jatkokäsittelyn kannalta sopivaan muotoon.

Noin kuukauden jälkikäsittely-, tarkistus- ja korjausvaiheen jälkeen aineisto lähtee Kotuksesta Kielikone Oy:lle, joka vastaa sanakirjan teknisestä toteutuksesta. Kielikoneessa tuotetaan uusien ja muutettujen artikkelien kaikille sanamuodoille ns. perusmuodot. Perusmuotoja tarvitaan, jotta sanakirjasta voidaan hakea sanojen taipuneita muotoja; esimerkiksi taivutusmuoto öitä löytyy haussa sen perusmuodon avulla. Lisäksi Kielikoneessa tehdään erilaisia tarkistuksia, lisätään uusi aineisto vanhaan kokonaisuuteen ja muunnetaan aineisto julkaisuun sopivaan muotoon.

Uuden aineiston testaaminen

Kun sanakirjan päivitysaineistosta on saatu Kielikoneessa valmiiksi demoversio, toimitus aloittaa päivityksen testauksen. Testikierroksiin kuluu vajaa kuukausi, ja sinä aikana käymme läpi sekä sisältöön että ohjelman toiminnallisuuteen liittyviä asioita. Onko uudet hakusanat aakkostettu oikein? Onhan uusien artikkelien ulkoasu kunnossa? Näkyvätkö kaikki erikoismerkit oikein? Toimivathan artikkelien viittauslinkit niin kuin pitää? Löytyväthän myös uudet hakusanat erilaisilla hauilla, myös yleismerkkejä käyttäen? Ovathan hakutulokset oikein ja oikealla tavalla esitettyjä?

Testikierrosten aikana toimitus lähettää Kielikoneeseen huomionsa, ja löydetyt virheet korjataan. Jo ennen testikierrosten alkua sanakirjan ohje- ym. tekstit on muokattu ajantasaisiksi ja niiden käännökset on teetetty toimituksen ulkopuolisilla osaajilla. Testausvaiheessa tarkistetaan vielä, että nämäkin tekstit ovat kaikin puolin kunnossa.

Kun kaikki testikierroksilla huomatut virheet on korjattu ja toimitus on hyväksynyt sanakirjan teknisen toteutuksen, sanakirjan päivitysversio on viimein valmis julkaistavaksi.

Kohti seuraavaa päivitystä

Edellä kuvaamani toimitusprosessi vastaa tämänhetkistä tilannetta (toukokuu 2018) Kielitoimiston sanakirjassa. Lähivuosina otamme käyttöön uuden toimitusjärjestelmän, joka tulee muuttamaan prosessia. Myös yhteen päivityskierrokseen teknisesti tarvittava aika lyhentynee tulevaisuudessa.

Kun luovutimme kuukausia sitten päivitysversion aineiston tietoteknisille asiantuntijoillemme, emme suinkaan jääneet huilaamaan ja odottelemaan päivityksen julkistusta vaan jatkoimme töitä seuraavaa päivitystä varten. Uusia artikkeleita kirjoitetaan ja vanhoja korjataan siis koko ajan.

Uusi sana-artikkeli matkaa julkistukseensa monien välivaiheiden ja yhteistyökumppaneiden kautta. Sanakirjan tekeminen on ennen kaikkea yhteistyötä. Teemme Kielitoimiston sanakirjaa yhdessä Kotuksen kielenhuoltajien, sanakirjantekijöiden ja IT-asiantuntijoiden kanssa sekä Kotuksen ulkopuolisten asiantuntijoiden, kääntäjien ja Kielikone Oy:n kanssa.

On ollut hienoa huomata, miten paljon yhdessä aikaan saatua sanakirjaamme käytetään: viime vuonna siitä tehtiin jo yli 3,5 miljoonaa hakua, jälleen enemmän kuin edellisenä vuonna. Tästä on hyvä jatkaa kohti sanakirjan seuraavaa päivitystä.

Kielitoimiston sanakirja verkossa: www.kielitoimistonsanakirja.fi

Uutinen Kielitoimiston sanakirjan päivityksestä

 

Päivitetyn Kielitoimiston sanakirjan uusia hakusanoja

arganöljy
boulderointi
esikoispitkä
hoitoneuvottelu
huoh
kaasuhyökkäys
katutaide
klikkiotsikko
kyberturvallisuus
laihdutusleikkaus
lokakampanja
lääketurvallisuus
mummopyörä
mökkitalkkari
pikkelöidä
prepaid
ramen
S2
setämies
silmäkarkki
tagata
työkokeilu
valeuutinen
vastamelukuuloke
wifi
viherseinä

Minna Haapanen
Kirjoittaja on Kielitoimiston sanakirjan toimitussihteeri.