Aihe: Riimisanakirjoja suomenkieliseitä, onko heitä?
1
cubasisti
12.12.2005 16:21:17
Sanakirjan pystyisi tekemään niin, että otetaan iso määrä perusmuotoisia sanoja (tai sanojen "runkoja"), muunnetaan jokainen sana kaikkiin mahdollisiin taivutusmuotoihin (tämä pystytään tekemään ohjelmallisesti), ja laitetaan näin syntynyt jättimäinen sanamassa (varmaan luokkaa miljoonia sanoja) "takaperoiseen" aakkosjärjestykseen (aa-loppuiset ensin, sitten ba-loppuiset, sitten ca, .. jne) jolloin keskenään rimmaavat sanat tulisivat automaagisesti lähekkäin.
 
Tiedän, että ainakin yksi projekti on ollut tehdä suomenkielinen riimisanakirja, mutta siitä ei ilmeisesti koskaan tullut mitään? Yritin etsiä netistä, mutta en löytänyt.
Deadline tekee mestarin.
cubasisti
14.12.2005 10:08:11
Jos sanoja täytyy jonkun lähteä manuaalisesti kuvailemaan, niin työmäärä kasvaa järjettömäksi. Kyllä se pitäisi saada tehtyä jotenkin automaattisesti. Sanojen kategorioimisessa voisi käyttää vaikka hermoverkkoa tai Teuvo Kohosen SOM-härdelliä.
 
Jos välttämättä halutaan tehdä manuaalityötä, niin tekoälylle voitaisiin syöttää esim. oikeiden suomenkielisten laulujen lyriikoita. Syntyvä tietämysmassa ei edes rikkoisi kenenkään tekijänoikeuksia.
 
Lisäksi tässä tarvittaisiin _kunnollinen_ suomen kielen tavutus ja morfologiapulikka. Ei taida löytyä ainakaan ilmaiseksi mistään. Hyvä maksaa ja paljon. MS Officessa on mukana hyvät ja kalliit komponentit suomen vempulointiin, joten ehkä niitä voisi ohjastaa OLE/ActiveX-automaatiolla ja tallentaa valmiiksi taivutetut ja tavutetut sanat johonkin fiksuun jemmaan.
 
No joo. Kyllähän sitä voisi ideoida vaikka kuinka pitkälle, mutta kuka sen sitten tekisi. Ihmisillä on yleensä ns. elämäkin elettävänä. ;)
 
Yhdestä projektista kuulin, mutta se oli aikoinaan tökännyt siihen, että ohjelman sisältö (valmis sanakirjamateriaali) olisi haluttu suojata kopioinnilta yms. ja siihen ei ollut löytynyt tarpeeksi hyvää ja halpaa tekijää. Tai jotain sinne päin. Tällaista on erittäin vaikea tehdä Suomen kokoisessa maassa kaupallisena projektina, jos halutaan saada edes omat takaisin. Mahdollinen ostajakunta on niin pieni ja ohjelmointityö niin kallista.
Deadline tekee mestarin.
Koivulahti
17.12.2005 15:20:08
 
 
Jos sanoja täytyy jonkun lähteä manuaalisesti kuvailemaan, niin työmäärä kasvaa järjettömäksi. Kyllä se pitäisi saada tehtyä jotenkin automaattisesti. Sanojen kategorioimisessa voisi käyttää vaikka hermoverkkoa tai Teuvo Kohosen SOM-härdelliä.
 
Jos välttämättä halutaan tehdä manuaalityötä, niin tekoälylle voitaisiin syöttää esim. oikeiden suomenkielisten laulujen lyriikoita. Syntyvä tietämysmassa ei edes rikkoisi kenenkään tekijänoikeuksia.
 
Lisäksi tässä tarvittaisiin _kunnollinen_ suomen kielen tavutus ja morfologiapulikka. Ei taida löytyä ainakaan ilmaiseksi mistään. Hyvä maksaa ja paljon. MS Officessa on mukana hyvät ja kalliit komponentit suomen vempulointiin, joten ehkä niitä voisi ohjastaa OLE/ActiveX-automaatiolla ja tallentaa valmiiksi taivutetut ja tavutetut sanat johonkin fiksuun jemmaan.
 
No joo. Kyllähän sitä voisi ideoida vaikka kuinka pitkälle, mutta kuka sen sitten tekisi. Ihmisillä on yleensä ns. elämäkin elettävänä. ;)
 
Yhdestä projektista kuulin, mutta se oli aikoinaan tökännyt siihen, että ohjelman sisältö (valmis sanakirjamateriaali) olisi haluttu suojata kopioinnilta yms. ja siihen ei ollut löytynyt tarpeeksi hyvää ja halpaa tekijää. Tai jotain sinne päin. Tällaista on erittäin vaikea tehdä Suomen kokoisessa maassa kaupallisena projektina, jos halutaan saada edes omat takaisin. Mahdollinen ostajakunta on niin pieni ja ohjelmointityö niin kallista.

 
Aivan
 
Kaupallisessa projektissa ei olisi järkeä. Joku voisi kuitenkin tehdä vapaan koodin sellaiseksi että kuka tahansa voisi noita sanoja vehkeelle sitten syötellä. Netissä toimivalle härvelille kyllä noita käyttäjiä löytyisi satoja ja joka riimihrällä on heti heittää parisen sataa riimiä ja moni (esim. minä olisi sinne valmis keksimään uusia vaikka viikoittain)
 
Ainoastaan perusmuodoista tarvitaan lista joka on saatavilla varmaan jostain kielipoliisitoimistosta :) Tämä siksi että voidaan varmistua että ko. sanat ovat olemassa oikeasti ilman että jonkun tarvitsee niitä manuaalisesti tarkistaa. Suomenkielen tavutuksethan ovat jonkinverran murresidonnaisia puhekielessä joten olisi sääli jos niissä pitäydyttäisiin ainoastaan kielioppisäännöissä. Lisäksi foneettiset riimipoikkeukset olisi myös pystyttävä lisäämään (siis ei silmäriimit) mutta poikkeukset pitäisi kai aina kierrättää jollakin ylläpitäjällä.
 
Uskon että tälle hankkeelle ei olisi vaikeakaan saada rahoitusta sillä hommalle on selkeä tilaus. Joku suomenkielen yhdistys tms. auttaisi varmasti sekä kielipainotteiset oppilaitokset. Kulttuuripuolen instituutiotkin saattaisivat mieluusti auttaa, ja jos ei mikään muu auta niin voihan tuosta kai tehdä TEKES-hankkeen :)
 
Voittoa tavoittelemattomana rahoitus järjestyy helpommin tällaisilta tahoilta kun projekti hyödyttää kaikkia, jotka ohjelmaa tarvitsevat.
Koivulahti
16.11.2006 17:27:11
 
 
Terve
 
Siitäpä onkin aikaa kun tähän ketjuun joskus vastasin ja nyt sitten keksin helpon tavan toteuttaa tuon sanakirjan kun selaimet ovat ajan saatossa kehittyneet (eli ei tarvii osata mitään).
 
Jonkin aikaa sitten hankin domainin www.sanoittajat.fi ja nyt pistin sinne tuollaisen pienimuotoisen riimisanakirjan käytettäväksi ( http://www.sanoittajat.fi/Riimisanakirja.html ) .
 
Kokeilkaa tota ja pistäkää mulle riimejä tulemaan s-postilla (ISOILLA KIRJAIMILLA) niin niin saadaan siitä talkoovoimin tarpeeksi kattava.
http://www.sanoittajat.fi/Sanoittaja_Samuli_Koivulahti.html www.sanoittajat.fi
gösplstorm
16.11.2006 20:03:35 (muokattu 16.11.2006 20:03:52)
Mä voin kyllä auttaa riimien ja sanojen syöttämisessä jos semmosta tarvitaan. "Ohjelmointi"-kyvyt tosin rajoittuu HTML:ään :D
 
typo
Kirjoittaja on asiastaan tietämätön hölmö.
Koivulahti
16.11.2006 23:44:49
 
 
Mä voin kyllä auttaa riimien ja sanojen syöttämisessä jos semmosta tarvitaan. "Ohjelmointi"-kyvyt tosin rajoittuu HTML:ään :D
 
typo

 
Musta toi toimii nyt ihan tarpeeksi hyvin noin, eli ohjelmointia ei tarvita, mutta riimejä voi keksiä ja kaivaa lisää ja meilata mulle niin mä sitten päivittelen niitä itse tonne sivuille. Pyydän sitten ylläpitoapua jos homma alkaa revetä käsistä =)
 
Tuon sanaston tulen pitämään aina "avoimena" jotta sitä pääsee kukin lukemaan läpi ja ainoa muutos mitä siihen saattaa tulla on se että tuohon sivuille varmaan tulee oma robotti tuohon + jotain laskureita. Itse sanasto kuitenkin tulee olemaan aina kokonaisuudessaan julkinen, koska hanke on tarkoitettu yleishyödylliseksi.
http://www.sanoittajat.fi/Sanoittaja_Samuli_Koivulahti.html www.sanoittajat.fi
gösplstorm
17.11.2006 09:59:11
Musta toi toimii nyt ihan tarpeeksi hyvin noin, eli ohjelmointia ei tarvita, mutta riimejä voi keksiä ja kaivaa lisää ja meilata mulle niin mä sitten päivittelen niitä itse tonne sivuille. Pyydän sitten ylläpitoapua jos homma alkaa revetä käsistä =)
 
Tuon sanaston tulen pitämään aina "avoimena" jotta sitä pääsee kukin lukemaan läpi ja ainoa muutos mitä siihen saattaa tulla on se että tuohon sivuille varmaan tulee oma robotti tuohon + jotain laskureita. Itse sanasto kuitenkin tulee olemaan aina kokonaisuudessaan julkinen, koska hanke on tarkoitettu yleishyödylliseksi.

 
ei mut tos ei pysty hakemaan niillä sanojen päätteillä mikä ois ainakin mulle se kaikkein tarpeellisin juttu. Aikooko kukaan tehä sit semmosta?
Kirjoittaja on asiastaan tietämätön hölmö.
Tuomas
17.11.2006 13:44:41
 
 
Heikki Salon kotisivuilla on RiimiRenki -niminen riimisanakirja.
 
http://www.heikkisalo.com
 
Testauksen perusteella ihan käypä.
Ajassa irrallaan. @ 14.11.2006 / Fiktiivisiä keskusteluja. @ 14.11.2006
Koivulahti
17.11.2006 18:32:26
 
 
ei mut tos ei pysty hakemaan niillä sanojen päätteillä mikä ois ainakin mulle se kaikkein tarpeellisin juttu. Aikooko kukaan tehä sit semmosta?
 
Terve
 
kyllä pystyy.. ainakin jos käytät firefoxin selainta ja kirjoitatta kenttään vaikka "kka" niin se etsii nimenomaan päätteitä.
 
riimirenki pelaa myös hyvin mutta siinä on puutteena se ettei se tunne kuin perusmuotoja ja se että se toimii vain sanan päätteiden perusteella.
 
Uskon että tästä tulee ajan kuluessa parempi kun sanastoa laajennetaan tarpeen mukaisesti ja manuaalisesti, vaikka siinä onkin vielä tässävaiheessa kovempi työ.
http://www.sanoittajat.fi/Sanoittaja_Samuli_Koivulahti.html www.sanoittajat.fi
‹ edellinen sivu | seuraava sivu ›
1
Lisää uusi kirjoitus aiheeseen (vaatii kirjautumisen)