2.4.2026

Uusi Eino-ääni julkaistu – Näin lukijaäänet syntyvät studiosta valmiiksi tuotteeksi

Edessä tarkennettuna studiomikrofoni. Taustalla sumennettuna mies. joka asettaa kuulokkeita päähänsä.

Meiltä on tasaisesti kyselty suomenkielistä miesääntä yleisäänien valikoimaan. Nyt sellainen löytyy: Eino-ääni on julkaistu suomenkielisen Ilonan sisarukseksi. Tyyliltään Eino on uutisankkurimainen, sillä se on hieman matalampi, rauhallinen, selkeä artikulaatioltaan, mutta ei tietenkään tylsä. Ääni sopii hyvin esimerkiksi uutissovelluksen lukijaääneksi. Seuraavassa lisää siitä, miten Readitin lukijaäänet tehdään.

Pohjana aina ihmisen puheääni

Digitaalisen lukijaäänen valmistusprosessi alkaa aina oikeasta ihmisestä, sillä koulutusmateriaaliksi tarvitaan studiolaatuista puheääntä. Koulutusmateriaalia syntyy, kun nauhoitetaan käyttötarkoituksen mukaista tekstimateriaalia ääneen luettuna. Jos valmiista lukijaäänestä halutaan esimerkiksi uutismainen, ääninäyttelijän tulee lukea uutismaisia tekstejä uutismaiseen tyyliin. Tai jos lukijaäänestä halutaan kuulutusmainen, tekstien tulee olla kuulutusmaisesti luettuja. Studiossa lukijan tulee olla tarkkana, sillä nauhoitetun puheen ja ääneen luettujen tekstien tulee vastata täysin toisiaan. Sen pohjalta koneoppimismalli oppii, miten mikäkin sanotaan.

Studiovaihe on suht hidas vaihe, sillä sen jälkeen kun ääneen luetut tekstit on nauhoitettu ääninäyttelijän kanssa, tallennettua puhetta täytyy editoida, miksata ja konvertoida. Nämä tarkoittavat muun muassa taustaäänien poistamista, taajuuskorkeuksien säätämistä ja äänitiedostojen pilkkomista lyhyemmiksi pätkiksi. Tarkoituksena on saada mahdollisimman korkealaatuinen datasetti äänimallin koulutukseen. Jos äänidatoissa kuuluisi esimerkiksi taustalta epämääräisiä ääniä, ne saattaisivat siirtyä myös valmiiseen lukijaääneen.

Studiovaihe voidaan ohittaa, jos asiakkaalta saadaan suoraan datasetti. Näin on tehty esimerkiksi Svenska Ylen uutisartikkeleissa kuultava lukijaääni, joka kuuluu Ylen toimittajalle. Valmiina saatuun datasettiin täytyy todennäköisesti vielä tehdä joitain muutoksia, kuten:

  • Pitkän audion pilkkominen äänimallin koulutusmateriaaliksi
  • Koulutusmateriaaliaudioiden esikäsittely yhteneväiseksi, jotta äänimalli pystyy käsittelemään sitä
  • Muut pienemmät esikäsittelyt, kuten audion datatyyppien muutokset
  • Ääniesimerkkien transkriptio, jos tekstejä ei ole saatavilla
  • Äänidatan kuuntelu ja laadunvarmistus, jotta tekstit ja audiot vastaavat toisiaan

Kun nämä kaikki ovat kunnossa, päästään kouluttamaan äänimallia.

Äänimallin koulutus omilla malleilla

Äänimallin koulutuksessa ei meillä Readitillä käytetä valmiita kaupallisia alustoja, kuten Azurea, Elevenlabsia tai OpenAI:ta, vaan käytämme avoimen lähdekoodin arkkitehtuureja. Käyttämämme arkkitehtuurit on myös on lisensoitu kaupalliseen käyttöön. Avoimen lähdekoodin käyttö mahdollistaa täyden hallinnan prosessiin ja äänidatat pysyvät oman konesalin palvelimilla eli pystytään varmistamaan kestävät perusteet äänijäljitelmien tekemiselle. Samalla asiakkaalta ja ääninäyttelijältä poistetaan huoli siitä, että henkilön ääntä voisi päätyä tuntemattomiin sijainteihin.

Äänimallin koulutus tarkoittaa käytännössä sitä, että esivalmisteltu äänidata syötetään neuroverkolle, joka alkaa purkaa ääntä osiin. Koulutuksen aikana malli opettelee sanoja, analysoi lukijan puhenopeutta, äänenpainoja ja muuta puheen prosodiaan kuuluvaa, kuten intonaatioita ja rytmiä, oppiakseen jäljittelemään alkuperäistä ihmispuhetta. Tätä tehdään tuhansia toistoja, kunnes lopputuloksena on äänimalli.

Puheessa esimerkiksi intonaatiot, eli puhekorkeuden vaihtelut lauseen sisällä ovat tärkeässä osassa, sillä niistä ihmiskorva kuulee heti, kuinka luonnolliselta puhe kuulostaa. Suomen kielelle on tyypillistä, että intonaatiot ovat melko maltillisia ja tasaista verrattuna englantiin tai ruotsiin, mutta muutama sääntö kuitenkin on. Muun muassa äänenkorkeus yleensä laskee lauseen loppua kohden ja pääpaino on aina sanan ensimmäisellä tavulla.

Kun äänimalli on koulutettu, se osaa jo tuottaa puhetta, mutta se kaipaa vielä hienosäätöä (fine-tuning). Tämä tarkoittaa äänen sävyn ja rytmin hiomista muokkaamalla äänimallin parametrejä, kunnes lopputulos on halutunlainen. Hienosäätö on luova työvaihe, sillä siihen ei ole olemassa mitään tiettyjä ohjeita, vaan hienosäätöä tehdään kokeilujen kautta kunnes lopputulokseen ollaan tyytyväisiä.

Tekstin käsittely ja valmis äänijäljitelmä

Pelkkä valmis äänimalli ei riitä, vaan sen pitäisi myös jollain tasolla ymmärtää sitä, mitä se on lukemassa. Tähän tarvitaan oma tekstinkäsittelyputki, joka valmistelee tekstin luettavaan muotoon. Esimerkiksi lyhenteet, erikoismerkit ja numerot normalisoidaan eli avataan ja taivutetaan oikeaan lausumismuotoonsa. Suomenkielessä haastavuutta tuo juurikin taivutukset, kuten se että numero osataan ääneen luettuna taivuttaa kontekstin mukaan oikein. Tekstinkäsittelyn ansiosta ääneen luettu versio kuulostaa sujuvalta. Meillä Readitillä on käytössä oma tekstinkäsittelyputki, jolloin suomen kielen lukemisesta on saatu mahdollisimman hyvän kuuloista. Tekstin käsittelyyn voidaan myös tarvittaessa lisätä omia sääntöjä ja uusia yksittäisiäkin sanoja, jotka vaativat tarkempia tai poikkeavia lausumisohjeita. Muun muassa erikoisemmat nimet ovat usein tällaisia.

Vaikeimmaksi päätökseksi Readitin uuden lukijaäänen suhteen osoittautui lopulta nimen valitseminen. Readitin yleisäänten valikoimaan kuuluu Ilonan lisäksi suomenruotsia puhuva Amanda ja englanninkielinen Olivia. Nimen tuli siis sopia näihin. Nimiehdotuksia taisi lopulta olla noin 30, joista lähdettiin yksitellen karsimaan. Jäljelle jääneitä kuunneltiin vielä siten, että laitoimme lukijaäänen itse lausumaan nimen. Näin saimme vielä pari ehdokasta pudotettua, kun nimi ei kuulostanutkaan ääneen sopivalta. Viiden parhaimman nimen joukosta voittajaksi valikoitui ensin Tuomo. Viikonlopun yli nimeä hauduteltuamme totesimme kuitenkin, että se ei istunutkaan täydellisesti äänen luonteeseen ja muiden nimien joukkoon. Niinpä Tuomo vaihtui viime metreillä ytimekkäämpään Einoon.

Tässä vielä loppuun ääninäytteet alkuperäisen henkilön ja Einon äänistä:

OG
Eino

Ihminen

–:–
E
Eino

Lukijaääni

–:–

Sinua saattaisi kiinnostaa myös seuraavat artikkelit: