Sanat laskukoneessa
Kysyttyä 3/2009

Eero Voutilainen

Sanat laskukoneessa

Kysymys: Montako sanaa on suomen kielessä?

Vastaus: Tämä on usein esitetty ja periaatteessa yksinkertaiselta vaikuttava kysymys. Vastaaminen on kuitenkin vaikeaa: kieli ei ole kuin varasto, jossa olevat esineet voisi täsmällisesti laskea.

Numeroa kaipaaville voi antaa jonkin luvun selaamalla suomen kielestä tehtyjä sanakirjoja: Nykysuomen yleiskieltä kuvaavassa Kielitoimiston sanakirjassa on noin 100 000 sana-artikkelia. Tekeillä olevaan Suomen murteiden sanakirjaan arvioidaan kertyvän artikkeli lähes 400 000 sanasta. Sanakirjojen toimittajat joutuvat kuitenkin tekemään työssään monia sanojen määrää koskevia valintoja.

Sanakirjoihin otettavaan sanamäärään vaikuttavat kyseessä olevaa kielimuotoa koskevat rajaukset. Esimerkiksi Kielitoimiston sanakirjan tavoite on kuvata yleiskielen keskeinen sanasto. On kuitenkin erittäin vaikeaa määritellä, mitkä sanat ovat keskeisiä, ja raja esimerkiksi  yleiskielen, slangin, erikoiskielten ja arkikielen välillä on sumea.

Suomen kieleen syntyy jatkuvasti uusia sanoja: esimerkiksi yhdistämällä (elämystavaratalo, pätkäjohtaja, sikatauti), johtamalla (hihnoa, kotoilla, mokkuloida), lainaamalla (simpukkapuhelin, tuunata, oled-televisio) ja äänen avulla jäljittelemällä (siristä, säristä, söristä). Sanojen vakiintuneisuudessa on kuitenkin suuria eroja. Monet uudet sanat elävät vain hetken pienen piirin käytössä päätymättä koskaan sanakirjoihin. Vain osa vakiintuu ja leviää. Toisaalta menneisiin elämänmuotoihin liittyviä sanoja kuolee, kun niitä lakataan käyttämästä.

Laskemisen kannalta ongelmallisia ovat myös monimerkityksiset sanat: voimme esimerkiksi puhua suussa olevasta kielestä, maailman kielistä, viulun kielistä tai lukon kielestä. Samanmuotoiset sanat taas näyttävät samalta, vaikka ne ovat merkitykseltään aivan erilaisia, kuten nielua ja vihannesta merkitsevät kurkku-sanat. Jotkut pitävät kuitenkin myös edellä mainittuja kieli-sanan esiintymiä neljänä erillisenä sanana.

Sanoja laskettaessa ei voida ottaa huomioon sitä, että jokaisella kielenkäyttäjällä on oma sanavarastonsa. Yksi tuntee paljon tiettyyn ammattiin tai harrastukseen liittyviä sanoja, toinen jonkin murteen sanastoa. Toisaalta jokaisella on ainutlaatuinen suhde kaikkiin äidinkielensä sanoihin. Kaikki oppivat kielensä omien yksilöllisten kokemustensa läpi, ja samaankin sanaan liittyvät eri ihmisillä erilaiset asenteet, tunteet ja mielikuvat.

Elävä kieli joustaa ja muuntautuu jatkuvasti tilanteen ja käyttäjänsä tarpeiden mukaan. Jonkin yhden luvun sijaan vastaus kysymykseen suomen kielen sanamäärästä voisikin olla ytimekäs: tarpeeksi.

Kirjoittaja työskentelee tekstintutkijana Kotimaisten kielten tutkimuskeskuksessa.

Eero Voutilainen