Raportoinnin uudet apuvälineet DX-kuuntelussa
Jouni Keskinen, Pirkkala
Radioasemien raportointi on usein se pakkopulla ja monien mielestä DX-harrasteen tylsin osa. Osa kuuntelijoista onkin luopunut kuuluvuusraporttien kirjoittamisesta kokonaan. Mutta ne rankkisoturit, jotka yhä asemien vastauksia keräävät ja niistä pisteitä laskevat, joutuvat käyttämään paljon aikaa QSLien metsästykseen. Viime vuosina raporttien teko on kuitenkin vähitellen muuttunut uusien apuvälineiden ja tekoälyn tulon myötä. Seuraavassa katsaus muutamiin testaamiini raportoinnin apuvälineisiin, joilla olen yrittänyt tehdä raportoinnista helpompaa ja nopeampaa.
Apua ohjelmakohtien kaiveluun
Klassisessa Kauko Kuuntelijan kuuluvuusraportissa ohjelmakohtina olivat: ”man speaks, beautiful music, woman speaks” ja sitten saattoi tulla se ”station identification”. Tähän ei onneksi enää nykyisin tarvitse tyytyä. Jo pienellä googlailulla voi selvitä paljon ohjelmakohtia, varsinkin jos aseman kotisivulta löytyy esim. ohjelmakartta ja aseman käyttämiä sloganeita.
Musiikkikappaleiden tunnistamiseen on löytynyt apuohjelmia jo pidempään. Ensimmäinen suuren suosion saanut sovellus oli kännyköissä toimiva Shazam. Se kuuntelee musiikkia kännykän kaiuttimen kautta ja tunnistaa hyvin kuuluvan musiikin ongelmitta. DX-kuunteluun Shazam ei kuitenkaan kännykkäappina ollut parhaimmillaan, vaan tarvetta oli ohjelmalle, joka tunnistaa musiikin suoraan tietokoneen audiolinjasta.
Tietokoneella toimivia musiikintunnistusohjelmia löytyy varmasti monia, mutta itse en ole koskaan tarvinnut muita ohjelmia kuin FlairMaxin. FlairMax käyttää ilmeisesti samaa musiikkitietokantaa kuin Shazam ja toimii lähes yhtä hyvin kuin se vanha junan vessa. Käyttö on yksinkertaista: Avataan ohjelma, klikataan Recognize from audio output ja laitetaan audioklippi soimaan. Noin kymmenessä sekunnissa ohjelma kertoo sinulle kappaleen nimen ja esittäjän.
FlairMax on tunnistanut tallenteelta meksikolaisen XERDO La Raza 1060:n soittaman Tiranos del Norte -yhtyeen kappaleen Hermosa Tirana.
FlairMax tunnistaa musiikkikappaleet hämmästyttävän hyvin jopa kohinaisista AM-tallenteista. Tietokannasta löytyy käsittämätön määrä musiikkia kaikista kulttuureista. Argentiinalaiset tangot ja meksikolainen ranchera tunnistuu ongelmitta. Ainut kappale, jota FlairMax ei DX-tallenteiltani viimeisen vuoden aikana tunnistanut oli paikallisen lasten radion soittama slovakialainen lastenlaulu.
Jos kuultu DX-asema siis soittaa musiikkia, musiikkikappaleiden nimet ja esittäjät saa ohjelmakohdiksi raportteihin helposti.
Puheesta tekstiksi
Puheen tunnistus tietokoneella on osoittautunut vaikeammaksi tehtäväksi kuin vanha scifikirjallisuus ja elokuvat antoivat olettaa. Vasta aivan viime vuosina ja erityisesti nyt tekoälyn läpimurron myötä, on peruskäyttäjille alkanut ilmestyä ohjelmia, jotka oikeasti säästävät aikaa esimerkiksi videoiden tekstityksessä ihmisen tekemään työhön verrattuna.
DX-kuuntelijoiden kannalta erityisen käyttökelpoisia ovat ohjelmat, joilla pystyy audiosta litteroimaan puheen suoraan tekstiksi. Mahdollisuus muuttaa puhe tekstiksi helpottaa merkittävästi ohjelmakohtien kaivelua raporttiin, erityisesti kun kyse on kielistä, joita ei itse osaa.
Tällä hetkellä markkinoilla on jo useita litterointiohjelmia ja niiden kielivalikoima kattaa kaikki maailman pääkielet. DX-kuuntelukäytössä Suomessa on käytetty ainakin kolmea seuraavaa:
Riverside Audio & Transcription: https://riverside.com/transcription
Turboscribe : https://turboscribe.ai/
ElevenLabs Voice AI Platform : https://elevenlabs.io
Omaa kokemusta minulla on ensimmäisestä ja viimeisestä. Riverside oli ensimmäisiä ohjelmia, joka tarjosi tekoälytranskriptiota rajallisesti ilmaiseksi selainkäyttöliittymän kautta ja vieläpä ilman rekisteröintiä. Laajempi käyttö toki vaati rekisteröitymistä ja luottokortin vilauttamista, kuten käytännössä kaikissa muissakin vastaavissa ohjelmissa.
Riverside lienee yhä nopein tapa testata koneellista litterointia. Äänitiedosto vain tipautetaan selainikkunaan ja valitaan kieli, jolle puhe halutaan litteroida. Sitten odotellaan vaihteleva aika (ilmaisversio lienee välillä ylikuormitettu, mutta toimii kuitenkin useimmiten nopeasti) ja ruudulle ilmestyy tekstinä äänitiedostossa puhuttu puhe.
ElevenLabs tarjoaa myös pienimuotoisen testimahdollisuuden omiin audio-AI työkaluihinsa, joita on paljon enemmän kuin Riversidessa. ElevenLabsilla saat vaikka oman äänesi puhumaan kiinaa valitsemasi tekoälygeneroidun musiikin soidessa taustalla.
Olen kuitenkin lähinnä käyttänyt ohjelmiston Speech to Text -työkalua. Se litteroi tekstiä äänitiedostosta lähes kaikilla maailmalla laajemmin puhutuilla kielillä. Kertaakaan ei DX-käytössä ole vielä tullut vastaan sellaista kieltä, jota ei ElevenLabsin valikoimasta löydy. Se onko kaikilla kielillä tehty litterointi saman tasoista, onkin sitten jo toinen juttu. Joka tapauksessa ElevenLabsin kielivalikoima on laajempi kuin vaikkapa Turboscripessä.
Rekisteröitymällä ElevenLabsin käyttäjäksi, sai ainakin viime keväänä pienen määrään ”krediittejä”, joilla ohjelman toimintoja saattoi käyttää rajatun määrän. Laajempi, pidempiaikainen käyttö vaatii kuukausimaksun maksamista. Asiakkuuksia on eri hintaisia ja kesän FM-keleille hyvin riittäneen halvimman asiakkuustyypin hinta oli ensimmäiseltä kuukaudelta hyvinkin kohtuullinen viiden euron luokkaa, nousten sitten jonkin verran tilauksen jatkuessa.
Mitkä sitten olivat todelliset käyttökokemukset puheentunnistuksen käytöstä DX-kuuntelussa? Yhdellä sanalla, vaihtelevat. Häiriöttömästä FM-lähetteestä puheentunnistus generoi varsin virheetöntä tekstiä. Kun sitten audioon alkaa tulla feidausta, kohinaa tai muiden asemien aiheuttamia häiriöitä, tuotetun tekstin virheet lisääntyvät tai puhe jää kokonaan litteroimatta. Kun siirrytään AM-asemien audioon ja lisätään pohjakohina, räsähdykset yms. niin koneellisen puheentunnistuksen kyky tuottaa audiosta oikeaa tekstiä, laskee yhä.
Turkkilaisen Küpe FM 98.7 mainoskatkoa ElevenLabsillä litteroituna. Rajatussa kuvassa oikealla näkyy audiotiedoston nimi ja valittu kieli, keskellä litteroitu teksti puhujittain kappaleiksi jaettuna. Vaikkei asema olisikaan tiedossa, litteroinnissa erottuu kieltä osaamattomallekin paljon paikkakuntia aseman kuuluvuusalueelta kuten Cerkezköy, Silivri ja Corlu.
Puheentunnistusohjelma ei ole optimoitu AM-radion äänenlaadulle vaan yleensä niitä ajatellaan käytettävän haastattelujen, puheluiden, podcastien tai radio- ja TV-ohjelmien litterointiin, jolloin audio on oletuksena puhdasta ja häiriövapaata.
Se ei kuitenkaan tarkoita, etteikö AM-klippejäkin voisi koittaa antaa puheentunnistuksen litteroitavaksi. Ei kuitenkaan kannata pettyä, jos se hyttysen huokauksena monen aseman feidailussa kuuluva graveyarder-jenkin idi ei ohjelman tekoälyn neuroverkkoihin rekisteröidy. Olen itse testaillut ElevenLabsia mm. kohtuu häiriöttömästi kuuluvilla kinalaisilla ja saanut niistä ohjelmakohtia esiin kaivettua.
Jotain tekoälypohjaisen puheentunnistuksen tulosta DX-kuunteluun kertovat myös Online Logista viime kesäkuulta löytyvät lähes 130 FM-lokausta Irakista. Enimmäkseen arabian, mutta myös kurdinkielisten Irakilaisasemien tunnistamisessa käytettiin apuna tekoälypohjaista puheentunnistusta. Ilman näitä ohjelmia irakilaislokausten määrä tuskin olisi läheskään noin suuri.
Intialaiset sihteeripalvelut vai sittenkin AI-agentti?
Paljon raportoivat dx-kuuntelijat vitsailevat usein tarvitsevansa intialaisia sihteeripalveluja saadakseen raportoitua kaikki hyvien kelien jälkeen tallenteilta löytyvät asemat. Elokuun lopussa olin myös itse tilanteessa, jossa paljon loppukesän FM-raportteja oli yhtä tekemättä, mutta kaikenlaiset muut hommat ja velvoitteet häiritsivät DX-harrastetta.
Jouduin työn puolesta selvittelemään tekoälyn käytön haasteita ja hyötyjä yliopisto-opetuksessa, ja jossain kohtaa tuli mieleen myös tekoälyn hyödyntäminen kuuluvuusraporttien teossa. Voisiko tekoäly jopa korvata ne intialaiset sihteerit?
Microsoft oli keväällä 2025 lisännyt tekoälypohjaiseen keskustelutyökaluunsa M365 Copilotiin (copilot.microsoft.com) mahdollisuuden rakentaa tekoälyavustajia eli ns. AI-agentteja. Vastaavia agentteja on mahdollisuus luoda myös muilla tekoälyillä kuten ChatGPT:llä (projektit) tai Googlen Geminillä, mutta toistaiseksi agenttien luomien, tai ainakin kaikkien ominaisuuksien käyttöön saaminen, on ollut mahdollista vain ohjelmien maksullisilla versioilla.
Myös käyttämässäni M365 Copilotin organisaatioversiossa osa agenttiominaisuuksista on rajattu vain maksullisella lisenssillä toimivaksi, mutta AI-agentin kevytversion saattoi toteuttaa ja testata myös perusversiolla. Valitettavasti Copilotin kotiversiolla ei vielä toistaiseksi pysty agentteja luomaan.
AI-agentit ovat tietynlaisia chattibotteja, joille on annettu ennalta määritetyt ohjeet vastauksen muodostamiseksi. Agentti vastaa kysymyksiin vain ohjeiden mukaisesti ja käyttäen rajattuja tietolähteitä, kuten antamaasi verkkosivustoa. Erilaisia chattibotteja on toki ollut jo kauan, mutta niiden luominen on vaatinut koodaustaitoja ja työtunteja. Tekoälyllä samaa sujuu nyt hetkessä, ilman koodaustaitoja, pelkästään kuvailemalla tarpeensa.
AI-agentin luonti ja ohjeistus
Copilotissa AI-agentin luonti on varsin suoraviivaista. Pakollisia tietoja ovat ainoastaan nimi, kuvaus ja ohjeet. Lisäksi voi antaa valmiita kehotetekstejä ja periaatteessa myös julkisten www-sivustojen osoitteita, joihin agentti voi perustaa vastauksensa. Käyttämässäni Copilot-versiossa oli kuitenkin niin huomattavia rajoituksia nettilähteiden käytössä, että ominaisuus oli käytännössä käyttökelvoton.
Annoin testiagentilleni nimen: “Reception Report Helper” ja kuvauksen: “Reception Report Helper helps DX-listener hobbyist to quickly write reception reports to the long-distance radio stations. It fills the reception report form with the given details, translates it to radio station's language and finds the contact information to the radio station”.
Tiedot olisi voinut yhtä hyvin antaa myös suomeksi, mutta päädyin käyttämään englantia, koska käyttämäni raporttipohja oli englanninkielinen. Agentilla oli siis kolme tehtävää: 1. täyttää raporttipohja annetuilla tiedoilla, 2. kääntää raportti halutulle kielelle ja 3. etsiä radioaseman yhteystietoja. Näistä onnistuin toteuttamaan vain kaksi ensimmäistä. Yhteystietojen automaattinen nettihaku ei vielä tässä versiossa onnistunut, sillä Copilot-versioni agenteilla oli hyvin rajoitettu pääsy nettiin.
AI-Agentille annetut määrittelytiedot Copilotissa.
AI-agentin
toiminnallisuuden kannalta olennaiset tiedot annettiin ohjeet-kentässä. Ensimmäisen tehtävän ohjeistin seuraavasti:
“Agent fills the reception report form (given below in the end) with the
details given by user in the following form:
[1] Radio station name
[2] Radio station studio location
[3] Frequency
[4] Date
[5] Year
[6] Time
…
After filling the details, agent removes the brackets [] and numbers inside
them.”
Tätä varten “koodasin” raporttipohjaan kaikki vaihtuvan datan kohdat numeroin [1…13]. Agentille syötteenä annettiin raporttiin tarvittavat tiedot numeroittain koodattuna. Lopulta sain 13 kappaletta tarvittavia tietoja. AM-raportissa riitti 12, kun ei tarvittu RDS-koodia.
Olisin halunnut agentin tekevän raportin suoraan annetun Word-raporttipohjan perusteella, mutta Copilot-versioni ei päässyt käsiksi koneellani oleviin tiedostoihin. Niinpä jouduin antamaan koodatun raporttipohjan agentille tekstinä ohjeistuksen lopussa.
Agentin toisena
tehtävänä oli kääntää raportti halutulle kielelle. Tämä
ohjeistettiin seuraavasti:
“Agent then translates the reception report to the language given by user in
the line:
Translate the reception report in (language)
Translation is made in the polite and natural-sounding language but without
changing the technical details.
Kolmantena tehtävä olisi ollut radioaseman
yhteystietojen haku, josta ohjeistin seuraavasti:
Then the agent finds the radio station's (name mentioned in [1]) contact
information:
Web site address
Facebook page
Email addresses (also possible marketing email, director's email, secretary's
email, technical or engineering email).
Tämä ei kuitenkaan siis
ainakaan Copilotin perusorganisaatioversiolla toiminut.
Agentti testiin
Ensimmäisenä testasin AI-agenttiani puolella tusinalla bulgarialaisia FM-raportteja. Kokeilut sujuivat heti jopa paremmin kuin odotin. Agentti tuotti sujuvasti bulgariankielisen raportin, jossa tiedot olivat oikein ja kohdallaan. Kääntelin tekstiä takaisinpäin englanniksi ja suomeksi ja se vaikutti asialliselta ja sujuvalta.
AI-Agentti "Reception Report Helper" valmiina vastaanottamaan syötettä Copilotissa.
Pientä viilattavaa agentissa toki oli. Se esimerkiksi muutti chattibotin käyttämän kielen pyydetyn käännöksen kieleksi eli yritti käännöksen jälkeen keskustella kanssani bulgariaksi.
Puolenkymmentä FM-raporttia Bulgariaan syntyi kuitenkin agentilla nopeasti. Vastauksiakin niihin tuli, joten ne selvästi olivat myös kielellisesti sujuvia. Niinpä käytin agenttia myös muutaman muun FM-raportin tekoon. Hauskin kommentti tuli Kiss FM Slobozian v/s:stä Marius Stroelta, joka vastasi sujuvasti suomeksi ja kirjoitti vastauksensa loppuun: ”Arvostin vaivannäköäsi välittää viestisi äidinkielelläni, romaniaksi, ja siksi käytin tekoälyä kääntääkseni viestini suomeksi. Toivottavasti tällä kertaa ChatGPT teki hyvää työtä”. Hiukan ehkä tarpeettoman kohteliasta, mutta täysin ymmärrettävää ja kielellisesti oikeaa tekoälysuomea!
Toki ensimmäisten raporttien teko AI-agentilla, vei vähintään saman ajan kuin perinteisesti, varsinkin jos otetaan huomioon agentin tekoon mennyt aika. Agentti kuitenkin osoitti tehonsa mitä enemmän raportteja oli tehtävänä. Agentin toimintaa ja raportintekoprosessia on vielä mahdollista edelleen tehostaa, nyt kun on tiedossa mihin agentti kykenee ja mitkä ovat sen rajoitukset.
Ennen kaikkea kokeilu tekoälyagentilla osoitti kuitenkin suunnan, johon jatkossa ollaan menossa tekoälytyökalujen edelleen kehittyessä. Rutiiniprosessien siirtäminen tekoälylle poistaa epäilemättä jossain vaiheessa tarpeen ”intialaisille sihteereille”. Toki ongelmia ja riskejäkin on. Kun tekoäly päästetään käsiksi oman koneen tiedostoihin ja omaan sähköpostiin, on yksityisyyden suoja koetuksella ja riski ”tekoälyhakkerointiin” ilmeinen. Maailma ei tule olemaan entisensä, eikä myöskään kuuluvuusraporttien teko.



