Vierassanojen kirjoitusasusta on keskusteltu toistasataa vuotta eli koko nykysuomen historian ajan. Vuonna 1881 vietettiin Suomalaisen Kirjallisuuden Seuran 50-vuotisjuhlia. Senaatin kielenkääntäjä Ferd. Ahlman alusti juhlassa vierassanojen kirjoitusasusta. Alustus päättyi ponteen, jonka mukaan ”ortografian metodin tulee olla foneetillinen”. Vierassanat on siis kirjoitettava suomen omien sanojen tapaan ääntämyksen mukaisesti. Ahlmanin lausumasta yleisestä periaatteesta on hymisty yksimielisyyttä alusta pitäen: suomea kirjoitetaan niin kuin puhutaan. Vierassanoissa käytäntö on kuitenkin osoittautunut ihannetta hankalammaksi, koska eri kielten äänne- ja kirjoitussysteemit täytyy sovittaa yhdeksi.

Keskustelu kävi erityisen kuumana 1800-luvun lopussa ja 1900-luvun alkupuolella. Silloin suomesta tehtiin sivistyskieltä ja kieleemme tulvi uusia lainasanoja. Kirjoitustavoista riideltiin ankarasti, eikä edes jäljestäpäin katsottuna yksinkertaisilta näyttävistä tapauksista päästy helposti sopuun (”kapteni” vai kapteeni, ”sihteri” vai sihteeri). Viime vuosikymmenet ovat olleet rauhallista aikaa. Perusperiaatteet eivät enää keskusteluta. Teinistä näkyy tulleen aikuinen.

Vierassanatyypit

Käsite sivistyssana on aikansa elänyt, sillä se viittaa menneeseen maailmaan, jossa vain harvoilla oli mahdollisuus koulutukseen ja sivistykseen. Henkinen kulttuuri on tätä nykyä kaikkien saatavilla, eikä sivistyssanalla ole nyky-yhteiskunnassa todellista käyttöä. Suurten kustantajien vierasperäisten sanojen sanakirjat ovat edelleen ilmeisesti mielikuvasyistä sivistyssanakirjoja. Sivistyssanoja kutsuttakoon vierassanoiksi.

Vierassanan ja lainasanan ero on tulkinnanvarainen. Suomen kielen perussanakirja määrittelee lainasanan ”vieraasta kielimuodosta omaksutuksi sanaksi”. Vierassanoja taas ovat ”vieraista kielistä peräisin olevat sanat, joissa usein on suomelle vieraita äänteitä tai äänneyhtymiä”. Yksi erottava tekijä on ikä. Vierassanat ovat lainasanoja, mutta kaikki lainasanat eivät ole vierassanoja. Ikivanhoja lainoja (porsas, kirkko, majakka) ei yleensä kutsuta vierassanoiksi, sillä ne ovat kotiutuneet kieleen täysin eivätkä yhdisty kielitajussa vieraaseen. Terho Itkonen jakaa vierassanat kolmeen ryhmään: kotoistuneihin vierassanoihin (yleislainat), varsinaisiin vierassanoihin (erikoislainat) ja vieraskielisiin sanoihin (sitaattilainat).

Kotoistuneet vierassanat ovat yleisiä sanoja. Ne ovat sulautuneet suomen puhujien yhteisomaisuudeksi suomalaiseen äänne- ja sanahahmoon (hotelli, polio, tiikki, virus). Yleislainat ovat kielitajussa ikivanhojen suomen sanan veroisia. Varsinaiset vierassanat puolestaan ovat kotoistuneiden vierassanojen lähisukulaisia. Ne voivat olla yhtä yleisiä kuin kotoistuneet sanatkin, ja ratkaiseva kriteeri on ennen kaikkea äännerakenne. Erikoislaina tunnistetaan vieraista äänteistä ja äänneyhtymistä: byrokratia, inflaatio, professori. Kolmas pääryhmä ovat kokonaan vieraskieliset sanat. Ne kirjoitetaan samoin kuin lähtökielessä ja periaatteessa myös äännetään alkuperäisen ääntämyksen mukaan (adagio, finnlandisierung, handsfree). Käännöslainat eli sanat, jotka on käännetty suoraan vieraasta kielestä (yksinkertainen ruots. enfaldig; ylipäänsä ruots. överhuvudtaget) ovat vierassanojen puolisukulaisia. Vieraaseen niitä yhdistää merkitys.

Vierassanatyypit jaottelevat sanat kauniisti lokeroihin, mutta todellisuus on sumeampi: vieraan ja oman sanan raja on luonnostaan liukuva. Vieraat sanat muodostavat jatkumon, jossa on eri-ikäisiä ja eriasteisesti kotoistuneita sanoja.

Kirjoitusongelmien syyt

Vierassanan kirjoituspulmien syy on lähtökielen (latina, kreikka, englanti, ruotsi jne.) ja kohdekielen (suomi) erilaisuus. Sekä lähtö- että kohdekielen äänne- ja kirjoitusjärjestelmät vaikuttavat kohdekielen kirjoitusasuun. Ongelmaa pahentaa vielä se, että monet sanat tulevat klassisista kielistä muiden kielten kautta. Myös sekä sanan alkuperäinen että kohdekielinen ääntämys vaikuttavat kohdekielen kirjoitustapaan. Yhtälössä on monta muuttujaa; tulos on sovitteluratkaisu.

Ongelmia ovat grafeemien eli kirjainmerkkien laatu sekä äänteen kesto ja sen merkitseminen. Miten koodataan suomeksi kielemme äännejärjestelmään kuulumaton äänne (suhu-s = sh vai š)?. Mikä on äänteen kesto (paneeli vai paneli)? Entä missä vaiheessa sana on kotiutunut kieleen niin, että se kirjoitetaan ja äännetään kuin suomen sana (teak vai tiikki)?

Pizza ja šokki: kirjainmerkin valinta

Vierassanojen ikuinen kirjoittamispulma on äännettä kuvaavan kirjainmerkin eli grafeemin valinta. Suomen äännejärjestelmän supisuomalaisen ytimen muodostavat 8 vokaalia (a e i o u y ä ö) ja 13 konsonanttia (p t k d m n ŋ r l s h v j). Kirjoitetun kielen tarpeisiin ne eivät riitä, koska vieraissa sanoissa on suomen äänne- ja kirjoitusjärjestelmään kuulumattomia äänteitä ja kirjainmerkkejä. Eron havaitsee jo kaikille tutusta aakkosten rimpsusta, jossa luetellaan tärkeimmät kirjoituksessa tarvittavat merkit: a b c d e f g h i j k l m n o p q r s (š) t u v (w) x y z å ä ö.

Yleiskielen ytimeen kuuluvat kirjainmerkit a d e g h i j k l m n o p r s t u v y ä ö. Merkit d ja g saattavat äkkiseltään herättää kummastusta muuten suomalaisessa joukossa. Ne ovatkin rajatapauksia. d esiintyy nykyäänteenä ja -kirjaimena monissa omaperäisissä sanoissa (edellinen, odottaa, tähdellinen), joiden historiaan nykyinen d ei varsinaisesti kuulu. Vastaavasti grafeemi g on kaksois-äng-äänteen merkkinä n:n kanssa, kengät ääntyy [keŋŋät-].

Ahlmanin ehdotuksen mukaan vierassanoissa on pyritty välttämään kirjaimia x, z ja c ja kirjoitettu niiden sijasta ks, ts ja s. Liioin meillä ei esiinny ks:nä ääntyvää kirjainmerkkiä x. Henkilönnimen johdos marxilainen (mahdollinen on myös marksilainen) on yleiskielen sanojen erityistapaus, ja x esiintyy vierassanoissakin sanan sisällä varsin harvoin (lat. sexta [seksta:] ’kuudes’). Joitakin x-loppuisia, lähinnä ammattikieliin kuuluvia sanoja on (thorax ’rintakehä’), mutta muuten x on erittäin harvinainen (texmex). Suomessa on eri tavuihin kuuluvien k:n ja s:n konsonanttiyhtymä (kak-si), mutta varsinkin vierassanojen alussa ja lopussa oleva ks voidaan tulkita yhdeksi ks-äänteeksi eli affrikaataksi.

Kirjaimella z alkavia sanoja on Suomen kielen perussanakirjassa parikymmentä (zoom, zeppeliini, zeniitti). Kirjain z äännetään meillä yleensä ts:nä, ja voisi tietenkin ajatella, että z korvataan kirjoituksessa järjestään ts:llä. Monet z:n sisältävät sanat ovat kuitenkin vakiintuneet asuunsa, eikä ts-jakson kotiuttaminen onnistu kovin helposti, vaikka sana olisi taajakäyttöinenkin (pitsa ~ pizza). Ilmeisesti z luo mielikuvan jostain hienommasta kuin mistä oikeastaan on kyse (paparazzi). Muutamissa sanoissa z on hupailumerkityksen välttämiseksi pakollinen: mezzosopraano [metso-] ’sopraanon ja alton välinen naisääni’.

Suomen kielen perussanakirjassa on kuutisenkymmentä c-kirjaimella alkavaa hakusanaa. Kirjoituksen c:tä vastaa ääntämyksessä yleisimmin k (café, casanova, catering, cocktail). Latinaisperäisissä vierassanoissa c on korvattu melko systemaattisesti k:lla, esim. auskultoida (lat. auscultare ’kuunnella’) tutkijakollegium (lat. collegium). Sanansisäinen c ei yleensä säily (šokki engl. shock) kuin aivan harvinaisissa vieraissa sanoissa (pinochle ’amerikkalainen korttipeli’). Tosca on poikkeus.

Kirjainyhtymä ch ääntyy suhu-s:nä sanassa charmi [šarmi]. Joskus ch äännetään t:n ja š:n yhteensulautumana eli affrikaattana: cembalo [tšembalo], chili [tšili], chippendale [tšippendeil], chips [tšips]. Joskus se ääntyy t:n ja tavallisen s:n liittona, kuten sanassa cheerleader [tsiliid]. Joidenkin sanojen c ääntyy s:nä (cicero [sisero] ’eräs yleinen kirjainko-ko’, city [siti]), joissakin sekä k:llinen että s:llinen ääntäminen ovat mahdollisia: civis [kii- t. sii-] ’ylioppilaskunnan jäsen’.

Äänteet f, b, g ja š ovat marginaalisia sikäli, että ne esiintyvät vain lainoissa. Suomen kielessä on runsaasti jokamiehen sanaston ytimeen kuuluvia f-äänteellä alkavia sanoja (farmarit, fasismi, filmi, firma). f-äänteen ongelmattomuutta osoittaa se, että vierassanojen konsonanttiyhtymät mukautuvat suomeen yleensä ongelmitta: flanelli (engl. flannel), fregatti (ital. fregata), fragmentaarinen ’katkelmallinen’ (lat. fragmentum ’palanen, katkelma’). Joissakin tapauksissa f ja äänteellisesti samantapainen v kilpailevat, esim. asvaltoida ~ asfaltoida (lat. asphaltum < kreik. asfaltos ’maapiki’). Lainasanojen mukauttamisessa eritoten kaksois-f on sulautunut suomen alkuperäisiksi äänteiksi, kahvi, pihvi, sohva (ruots. kaffe, piff, soffa). Huumoripuhe kuitenkin viljelee ff:ää: Ennen kuin ryhdytään juomaan kaffetta..., Istutaankos me oikein soffaan.

Soinnilliset äänteet b ja g pyritään usein mukauttamaan suomen alkuperäiseen äännejärjestelmään. Siksi nämä ”herraskaiskonsonantit” äännetään tavan takaa soinnittomien vastineittensa tavoin (bussi [pussi], gigantti [kikantti]. Niiden vierautta osoittaa sekin, että äänteet b ja g esiintyvät monilla puhujilla ennen muuta niissä puhetilanteissa, joissa tietoisesti tavoitellaan korrektia ääntämystä. Korrektiuden tavoittelun kääntöpuoli on hyperkorrektius eli tahaton korrektiuden liioittelu: logopediasta tulee [logobedia], pedagogiikasta [bedagogiikka].

Suhu-s on ongelmallinen. Koska š esiintyy vain lainasanoissa, suomen kielessä ei ole s:n ja š:n merkitysoppositiota, eli ne eivät aiheuta merkityseroa. Yksityistapauksia on (sakki ~ šakki), mutta monet merkityserot ovat kommunikaatiossa toisarvoisia: vertaa šikaani (’autourheilussa: kilpa-ajoradalle rakennettu vaikea osa, tav. jyrkkä mutka, joka pakottaa hiljentämään nopeutta’) ja sikaani (’minun sikaani’).

Suhu-s pyrkii ymmärrettävästi suomalaistumaan tavallisen s:n kaltaiseksi, koska š ei ole aito suomen äänne. Tästä syystä Suomen kielen perussanakirjakin antaa vaihtoehtoja (šokki ~ sokki, šekki ~ sekki). Suhu-s merkitään kirjoituksessa tavan takaa sh:n yhdistelmänä, ”Tshekki” pro Tšekki. Syy on kuulemma käytännöllinen: tietokoneiden aikakaudella valitetaan š:n käytön hankaluutta, koska se ei ole suoraan saatavana tietokoneen näppäimistöltä.

Kaksois-v esiintyy vain vierassanoissa (western ’lännenfilmi’, wieninleike). Suomen kielen perussanakirjassa on kymmenkunta w-kirjaimella alkavaa hakusanaa, mutta näistäkin osa on suomalaistunut: wok > vokki. Kotoistumisen tärkeä syy on tietenkin ääntämys, joka kaksois-v:n sisältävissä sanoissa harvoin poikkeaa merkittävästi suomen v:n ääntämisestä.

Jos suomalaisen sanan ääntää tai kirjoittaa w:llisenä, tapa on tyylillisesti tunnusmerkkinen, esim. ylätyylinen. Ylätyylisen muodon ajatellaan kaiketi nostavan statusta (ravintola Wanha Herra, myytävänä wanhoja tavaroita). Kaksois-v yhdistyy usein myös huumoriin ja vierasperäisyyksien imitointiin.

Kirjaimella q alkavat sanat ovat harvinaisia: Suomen kielen perussanakirjassa on vain neljä q-kirjaimella alkavaa hakusanaa. Tutuin lienee quickstep [kuik-] ’eräs nopeatempoinen seuratanssi’. Latinan q kirjoitetaan erikoislainoissa kv:nä (kvaliteetti lat. qualitus, kvartti lat. quartus, kvasirakenne lat. quasi-).

Lainagrafeemien yleisyys

Konsonantit ovat hitusen vokaaleja yleisempiä. Suomen kielen 3 935 153 grafeemia sisältävässä aineistossa konsonantteja oli 2 048 592 (52,06 %) ja vokaaleja 1 886 561 (47,94 %). Sataa vokaalia kohti on siis 108,59 konsonanttia.

Grafeemi q on harvinaisin kirjainmerkki. Sen esiintymistiheys on aivan mitätön, sillä 2 048 592 konsonanttigrafeemia sisältävässä aineistossa q esiintyi vaivaiset 26 kertaa. Grafeemi q esiintyy teksteissä niin harvoin, ettei sitä kannata yksinään havainnollistaa lukuna. Esiintymistiheyden saa havainnollisiksi luvuiksi muiden ”sivistyssanojen” konsonanttien kanssa: grafeemien b, c, f, g, w ja q yhteen laskettu tekstifrekvenssi on 0,26 % kaikista konsonanteista ja 0,17 % kaikista grafeemeista. Tämäkin luku liioittelee, sillä g:n esiintymiin sisältyvät melko runsaat ŋ:n esiintymät. Kaikkein marginaalisimpien grafeemien w:n, å:n ja q:n yhteenlaskettu tekstifrekvenssi on 0,01 %.

Grafeemeja x ja z ei ollut laskuissa mukana, koska niitä käytettiin materiaalin keruun matemaattisissa lausekkeissa ja epäselvien sanojen merkkinä. Varmaa kuitenkin on, etteivät ne järisytä yleisyystilastoa mitenkään.

Kollega ja hierarkia: vokaalin ja konsonantin kesto

Vaikka vierassanojen kirjoitusasun vakiinnuttaminen on ollut kaikkiaan hankalaa, on erottautunut kaksi muita hankalampaa tapausryhmää. Ensiksikin kirjoituspulmia on tuottanut vokaalin keston merkitseminen viimeistä edellisessä tavussa, milloin ruotsissa on pitkä painollinen vokaali. Yleensä kirjoitetaan ja äännetään pitkä vokaali (moduuli, paneeli), mutta tästäkin säännöstä on vakiintuneisuuteen perustuvia poikkeuksia (evankelinen, sikari). Lyhyt vokaali on vakiinnutettu kahdenlaisiin tapauksiin: konsonanttien b, d, f ja g edelle (mikrobi, filosofi ja kollega) sekä sanoihin, joiden lopuissa on -oli, -omi,- oni, -ori (petroli, symboli ja sinfonikko).

Toinen ongelmaryhmä on sanat, joissa on vokaali kolmannessa tavussa sanan lopusta laskien. Ruotsin painollisen pitkän vokaalin mukaisesti kirjoitetaan ja äännetään tietyissä sanoissa pitkä vokaali b:n ja d:n edellä (paraabeli, kateederi). -io-loppuiset sanat jakautuvat kahtia. Sanan -tio ja -sio-lopun edellä on pitkä vokaali (sensaatio, evoluutio), mutta i on kuitenkin lyhyt (ambitio, traditio). -rio-loppuisissa sanoissa a on pitkä (skenaario, planetaario), mutta o lyhyt (auditorio, konservatorio). Kollegiossa on yksi e. Jos sana on -ia-loppuinen, vokaali on lyhyt (afasia).

Konsonanttien äänteellinen kesto ja sen merkitseminen on oma lukunsa. Soinnittomien konsonanttien k, p, t, k ja s kesto oli pitkään horjuva vokaalin ja soinnillisen konsonantin (l, m, n, r) perässä, esim. kaakao, hierarkia, lisensiaatti. Nämä ovat tapauksia, joissa ruotsin kielessä äännetään konsonantti kahdennettuna.

Kaksoiskonsonantti on kahdenalaisissa tapauksissa. Ensiksikin kun suomen sanan loppuvokaali on -i tai -a taikka sana on -inen-johdos (fysiikka, hierarkkinen) ja toisekseen sananloppujen -eli, -eri ja -ori edellä (eetteri, kraatteri). Kummassakin tapauksessa s on kuitenkin lyhyt: analyysi, sponsori. Puoliksi kotoistuneissa sanoissa on kaksoiskonsonantti pääsäännöstä poiketen: kulttuuri, venttiili, ponttoni.

Aggressio ja okkluusio: kirjoituksen ja ääntämisen ristiriita

Jälkitavujen vokaalin ja konsonantin kesto on merkittävin vierassanojen kirjoitusongelma. Se on saanut tyydyttävän ratkaisunsa. Silloin tällöin tulee puheeksi jokin muu sinänsä vakiintunut tapaus, jossa sanan ääntämys ei vastaa suomen kirjoitusta.

Ortografisesti tärkein erillisryhmä on latinalaisperäiset, monesti muiden kielten kautta tulleet vokaalialkuiset vierassanat, joissa lyhyen vokaalin ja likvidakonsonantin (l, r) välissä on alkuperäisen mallin mukaan kaksi samaa kirjainta. Sanat ovat joitakin poikkeuksia lukuun ottamatta ammattikielen sanoja, ja ne äännetään kaiketi yksinäisäänteen veroisesti, vaikka ortografiaan on vakiintunut kaksi kirjainmerkkiä. Nämä muodostavat systemaattisen luokan: affrikaatta ’hankausäänne’ (lat. vox affricata), agglutinaatio ’kielitieteessä affiksin liittäminen sanavartaloon ilman sanavartalon äännevaihteluita (lat. agglutinare ’liimata kiinni), aggregaatti ’esim. koneikko’ (lat. aggregatus ’yhteenliittymä’), aggressio (lat. aggressio ’hyökkäys’), akklamaatio ’huutoäänestys’ (lat. acclamatio ’suosionhuuto’), applikaatio ’päällikekoristelu’ (lat. applicatio ’liitäntä’), akkreditoida ’uskoa jollekulle, valtuuttaa’ (alk. lat. ad ’luo’, creditus ’uskottu’), approksimaatio ’likiarvo’ (lat. myöhäislat. adproximare ’ lähentyä’), attraktio ’vetovoima’ (lat. attractio), attribuutti ’määrite’ (lat. attributum), effluenssi ’virtaaminen’ (lat. effluere ’virrata esiin’) okkluusio ’esim. lääket. ’tukkeutuminen’ (lat. occlusio), oppressiivinen ’sortava’ (lat. opprimere ’painaa alas, tukahduttaa’). Jokaiselle tutut sanat aplodi(t) ja aplodeerata (lat. applaudere, ruots. applåd) on kirjoitettu yhdellä p:llä jo 1900-luvun alkupuolelta.

Toisin päin ei päde: konsonantteja ei tavanmukaisesti sentään lisätä lähtökielen asuihin ensi tavuissa, vaikka sanat ”näyttävät samanlaisilta”. Tämä pätee niin likvidatapauksiin kuin muutenkin (”aggronomi”, ”ikktyologi”). Siksi kirjoitetaan agronomi (agri-, agro ’maa-, maatalous-, pelto-’, kreik. agros ’pelto’). Iktyologi ’kalojentutkija’ (kreik. ikhthys ’kala’, logis ’tieto’), imperatiivi ’käskytapa’ (lat. modus imperativus), inkompetenssi ’epäpätevyys’ (lat. kieltotavu in + competere ’pyrkiä keralla’).

Tähän ongelmaryhmään kuuluvia konsonanttialkuisia sanoja on hyvin vähän. Kaksoiskonsonantti on yleensä suomalaistunut yhdeksi. Jokamiehelle tutuin sana lienee setlementti (< engl. settlement), joka kirjoitetaan vakiintuneesti yhdellä t:llä. Muut ovat kovin harvinaisia, esim. suflee ’kohokas’ (ransk. soufflé < souffler ’puhaltaa’, ruots. suffle), suflööri ’teatterin kuiskaaja (ransk. souffleur), belletristiikka ’kaunokirjallisuus’ (< ransk. belles-lettres). Suffragetti ’naisten äänioikeuden esitaistelija’ (engl. suffragette < lat. suffragium ’annettu ääni, äänioikeus’) on poikkeus. Myöskään sanoissa nukleaarinen (lat. nucleus) ’[hedelmän] sydän’) ja sakramentti ’pyhä toimitus’ (lat. sacramentum) konsonantteja ei lisätä lähtökielen asuihin.

Uusia kirjoituspulmia syntyy kaiken aikaa, koska vierassanojakin tulee suomeen ehtimiseen. Tyydyn antamaan pari kolme ajankohtaista esimerkkiä, joiden perusteella saa käsityksen lähtö- ja kohdekielen ääntämis- ja kirjoitusasun vuoropuhelusta: chatata ~ tsätätä ~ tsatata (engl. chat ’verkkorupattelu’), mailata ~ meilata (engl. mail ’lähettää postia’), shoppailla ~ soppailla (engl. do the shopping ’tehdä ostoksia’).

Miten vieraan kanssa eletään?

Vierassanojen kirjoittaminen on ikuisuusongelma. Kaksi tosiota auttaa ymmärtämään pulmakohtia. Ensiksikin vierassanojen oikeinkirjoituksen vakiintuneisuus tarkoittaa historiaan takautuvia kompromisseja ja epätäydellisyyttä. On helppo osoittaa ”epäjohdonmukaisia”, ”virheellisiä” ja ”ääntämistä vastaamattomia” vierassanojen kirjoitusasuja, joita perustellaan ainoastaan niiden vakiintuneisuudella. Kieli on systemaattinen ja epäsystemaattinen samaan aikaan. Kielen muotosarjat ovat epätäydellisiä, ja niissä on melkein aina poikkeuksia. Yksityistapaukset ja karkulaiset ovat erottamaton osa kieltä.

Toiseksi vakiintuneisuuden vastavoima on kielen muutos. Kieli muuttuu, mutta oikeinkirjoitusnormi ei muutu yhtenään. Ortografian normi on melko staattinen, joskaan ei ikuinen. Kielen muutoksen ja oikeinkirjoitusnormin välissä on luonnostaan jännitettä, ja varsinkin uusien vierassanojen kirjoitusasu elää kieliyhteisössä. Ortografian normi pyrkii ounastelemaan muutosta, mutta sen pitää olla samalla lainkuuliainen vakiintuneisuuden ystävä. Vieras sana muuttuu hitaasti selväpiirteiseksi suomen sanaksi, jos on muuttuakseen. Sen elämään voi myös mahtua monta ulkonäköä.