Aihe: Riimisanakirjoja suomenkieliseitä, onko heitä? 1 | |
---|---|
![]() 12.12.2005 16:21:17 | |
Sanakirjan pystyisi tekemään niin, että otetaan iso määrä perusmuotoisia sanoja (tai sanojen "runkoja"), muunnetaan jokainen sana kaikkiin mahdollisiin taivutusmuotoihin (tämä pystytään tekemään ohjelmallisesti), ja laitetaan näin syntynyt jättimäinen sanamassa (varmaan luokkaa miljoonia sanoja) "takaperoiseen" aakkosjärjestykseen (aa-loppuiset ensin, sitten ba-loppuiset, sitten ca, .. jne) jolloin keskenään rimmaavat sanat tulisivat automaagisesti lähekkäin. Tiedän, että ainakin yksi projekti on ollut tehdä suomenkielinen riimisanakirja, mutta siitä ei ilmeisesti koskaan tullut mitään? Yritin etsiä netistä, mutta en löytänyt. Deadline tekee mestarin. | |
![]() 13.12.2005 23:14:28 | |
Sanakirjan pystyisi tekemään niin, että otetaan iso määrä perusmuotoisia sanoja (tai sanojen "runkoja"), muunnetaan jokainen sana kaikkiin mahdollisiin taivutusmuotoihin (tämä pystytään tekemään ohjelmallisesti), ja laitetaan näin syntynyt jättimäinen sanamassa (varmaan luokkaa miljoonia sanoja) "takaperoiseen" aakkosjärjestykseen (aa-loppuiset ensin, sitten ba-loppuiset, sitten ca, .. jne) jolloin keskenään rimmaavat sanat tulisivat automaagisesti lähekkäin. Tiedän, että ainakin yksi projekti on ollut tehdä suomenkielinen riimisanakirja, mutta siitä ei ilmeisesti koskaan tullut mitään? Yritin etsiä netistä, mutta en löytänyt. Jeps.. Joskus luulin itse keksineeni ko. idean mutta sittemmin olen huomannut että aika monelle kirjoittajalle on tuo vekotin joskus tullut mieleen. Takaperoisen järjestyksen sijaan olisi kuitenkin helpompi tehdä haku-indeksi jolloin voisi määritellä esim. että kuinka monitavuista sanaa etsitään. Tai sitten voisi esim. etsiä hakusanalla "-ta" joka tarkoittaisi että viimeinen tavu on "ta" Tällöin löytyisi vain oikeita riimejä :) tällöin kaikki sanat esiintyisivät luettelossa tavuviivoineneen jotta ohjelman teko ja ylläpito olisi helppoa eikälogiikka jäisi kellekään epäselväksi. Tällaisen tietokantaohjelman tekemiseen voisi käyttää vähän yhteistyötäkin että ne kaikki riimit löytyisivät. luettelon tekeminen yksin olisi liian raskasta kun esim. jo parametrilla: 2-ka (=2 tavua joista viimeinen tavu on "ka") tik-ka tak-ka pak-ka ak-ka lak-ka rek-ka Pek-ka kuk-ka sak-ka pah-ka jah-ka mat-ka saf-ka put-ka mut-ka tut-ka kut-ka lut-ka juts-ka jat-ka p*s-ka Jos siis joku laittaisi ko. kaltaisen ohjelman nettiin käytettäväksi niin olisi varmaan helpointa jos jengi osallistuisi noiden yhteen sopivien sanojen luetteloimiseen. Pelkän takaperoisen aakkosjärjestyksen lukemisella on jo aika vaikea löytää sitä haluttua riimiä kun samaan kirjaimeen päättyviä sanoja on tuhansia. Sillä ei siis käytännössä tekisi mitään. Ohjelmassa siis pitäisi olla tällainen hakutoiminto ja se edellyttäisi sanojen niputtamista ryppäisiin ristiin rastiin ja sitä että niille kaikille annettasiin hierarkiset tasot. Jokainen sana joka ohjelmaan syötetään pitäisi siis myös specifioida ja pitäisi erikseen kunkin kohdalla kertoa että tämä sopii pariksi noiden kanssa. Tälle voitaneen kuitenkin luoda sääntö eli esim. nuo tiedot jotka pitää täyttää voitaisiin aina kysyä vaikka sivuilla olevalla lomakkeella: Sana: Sanan perusmuoto: Sanan viimeinen tavu: Sanassa olevien tavujen märä: Periaatteessa nuo samat määreet voisi olla myös hakuparametrejä, jolloin haku olisi helppoa ja nopeaa ja tarvittaessa kyllin specifioitua. ----- Osallistun mielelläni ohjelman yksityiskohtaisempaankin speksaukseen jos joku ottaa ideasta kiinni ja jos ko. ohjelma on jo tehty niin minua kiinnostaisi ruveta sitä käyttämään, eli vihjaiskaa mulle :) | |
![]() 14.12.2005 10:08:11 | |
Jos sanoja täytyy jonkun lähteä manuaalisesti kuvailemaan, niin työmäärä kasvaa järjettömäksi. Kyllä se pitäisi saada tehtyä jotenkin automaattisesti. Sanojen kategorioimisessa voisi käyttää vaikka hermoverkkoa tai Teuvo Kohosen SOM-härdelliä. Jos välttämättä halutaan tehdä manuaalityötä, niin tekoälylle voitaisiin syöttää esim. oikeiden suomenkielisten laulujen lyriikoita. Syntyvä tietämysmassa ei edes rikkoisi kenenkään tekijänoikeuksia. Lisäksi tässä tarvittaisiin _kunnollinen_ suomen kielen tavutus ja morfologiapulikka. Ei taida löytyä ainakaan ilmaiseksi mistään. Hyvä maksaa ja paljon. MS Officessa on mukana hyvät ja kalliit komponentit suomen vempulointiin, joten ehkä niitä voisi ohjastaa OLE/ActiveX-automaatiolla ja tallentaa valmiiksi taivutetut ja tavutetut sanat johonkin fiksuun jemmaan. No joo. Kyllähän sitä voisi ideoida vaikka kuinka pitkälle, mutta kuka sen sitten tekisi. Ihmisillä on yleensä ns. elämäkin elettävänä. ;) Yhdestä projektista kuulin, mutta se oli aikoinaan tökännyt siihen, että ohjelman sisältö (valmis sanakirjamateriaali) olisi haluttu suojata kopioinnilta yms. ja siihen ei ollut löytynyt tarpeeksi hyvää ja halpaa tekijää. Tai jotain sinne päin. Tällaista on erittäin vaikea tehdä Suomen kokoisessa maassa kaupallisena projektina, jos halutaan saada edes omat takaisin. Mahdollinen ostajakunta on niin pieni ja ohjelmointityö niin kallista. Deadline tekee mestarin. | |
![]() 17.12.2005 15:20:08 | |
Jos sanoja täytyy jonkun lähteä manuaalisesti kuvailemaan, niin työmäärä kasvaa järjettömäksi. Kyllä se pitäisi saada tehtyä jotenkin automaattisesti. Sanojen kategorioimisessa voisi käyttää vaikka hermoverkkoa tai Teuvo Kohosen SOM-härdelliä. Jos välttämättä halutaan tehdä manuaalityötä, niin tekoälylle voitaisiin syöttää esim. oikeiden suomenkielisten laulujen lyriikoita. Syntyvä tietämysmassa ei edes rikkoisi kenenkään tekijänoikeuksia. Lisäksi tässä tarvittaisiin _kunnollinen_ suomen kielen tavutus ja morfologiapulikka. Ei taida löytyä ainakaan ilmaiseksi mistään. Hyvä maksaa ja paljon. MS Officessa on mukana hyvät ja kalliit komponentit suomen vempulointiin, joten ehkä niitä voisi ohjastaa OLE/ActiveX-automaatiolla ja tallentaa valmiiksi taivutetut ja tavutetut sanat johonkin fiksuun jemmaan. No joo. Kyllähän sitä voisi ideoida vaikka kuinka pitkälle, mutta kuka sen sitten tekisi. Ihmisillä on yleensä ns. elämäkin elettävänä. ;) Yhdestä projektista kuulin, mutta se oli aikoinaan tökännyt siihen, että ohjelman sisältö (valmis sanakirjamateriaali) olisi haluttu suojata kopioinnilta yms. ja siihen ei ollut löytynyt tarpeeksi hyvää ja halpaa tekijää. Tai jotain sinne päin. Tällaista on erittäin vaikea tehdä Suomen kokoisessa maassa kaupallisena projektina, jos halutaan saada edes omat takaisin. Mahdollinen ostajakunta on niin pieni ja ohjelmointityö niin kallista. Aivan Kaupallisessa projektissa ei olisi järkeä. Joku voisi kuitenkin tehdä vapaan koodin sellaiseksi että kuka tahansa voisi noita sanoja vehkeelle sitten syötellä. Netissä toimivalle härvelille kyllä noita käyttäjiä löytyisi satoja ja joka riimihrällä on heti heittää parisen sataa riimiä ja moni (esim. minä olisi sinne valmis keksimään uusia vaikka viikoittain) Ainoastaan perusmuodoista tarvitaan lista joka on saatavilla varmaan jostain kielipoliisitoimistosta :) Tämä siksi että voidaan varmistua että ko. sanat ovat olemassa oikeasti ilman että jonkun tarvitsee niitä manuaalisesti tarkistaa. Suomenkielen tavutuksethan ovat jonkinverran murresidonnaisia puhekielessä joten olisi sääli jos niissä pitäydyttäisiin ainoastaan kielioppisäännöissä. Lisäksi foneettiset riimipoikkeukset olisi myös pystyttävä lisäämään (siis ei silmäriimit) mutta poikkeukset pitäisi kai aina kierrättää jollakin ylläpitäjällä. Uskon että tälle hankkeelle ei olisi vaikeakaan saada rahoitusta sillä hommalle on selkeä tilaus. Joku suomenkielen yhdistys tms. auttaisi varmasti sekä kielipainotteiset oppilaitokset. Kulttuuripuolen instituutiotkin saattaisivat mieluusti auttaa, ja jos ei mikään muu auta niin voihan tuosta kai tehdä TEKES-hankkeen :) Voittoa tavoittelemattomana rahoitus järjestyy helpommin tällaisilta tahoilta kun projekti hyödyttää kaikkia, jotka ohjelmaa tarvitsevat. | |
![]() 16.11.2006 17:27:11 | |
Terve Siitäpä onkin aikaa kun tähän ketjuun joskus vastasin ja nyt sitten keksin helpon tavan toteuttaa tuon sanakirjan kun selaimet ovat ajan saatossa kehittyneet (eli ei tarvii osata mitään). Jonkin aikaa sitten hankin domainin www.sanoittajat.fi ja nyt pistin sinne tuollaisen pienimuotoisen riimisanakirjan käytettäväksi ( http://www.sanoittajat.fi/Riimisanakirja.html ) . Kokeilkaa tota ja pistäkää mulle riimejä tulemaan s-postilla (ISOILLA KIRJAIMILLA) niin niin saadaan siitä talkoovoimin tarpeeksi kattava. http://www.sanoittajat.fi/Sanoittaja_Samuli_Koivulahti.html
www.sanoittajat.fi | |
![]() 16.11.2006 20:03:35 (muokattu 16.11.2006 20:03:52) | |
Mä voin kyllä auttaa riimien ja sanojen syöttämisessä jos semmosta tarvitaan. "Ohjelmointi"-kyvyt tosin rajoittuu HTML:ään :D typo Kirjoittaja on asiastaan tietämätön hölmö. | |
![]() 16.11.2006 23:44:49 | |
Mä voin kyllä auttaa riimien ja sanojen syöttämisessä jos semmosta tarvitaan. "Ohjelmointi"-kyvyt tosin rajoittuu HTML:ään :D typo Musta toi toimii nyt ihan tarpeeksi hyvin noin, eli ohjelmointia ei tarvita, mutta riimejä voi keksiä ja kaivaa lisää ja meilata mulle niin mä sitten päivittelen niitä itse tonne sivuille. Pyydän sitten ylläpitoapua jos homma alkaa revetä käsistä =) Tuon sanaston tulen pitämään aina "avoimena" jotta sitä pääsee kukin lukemaan läpi ja ainoa muutos mitä siihen saattaa tulla on se että tuohon sivuille varmaan tulee oma robotti tuohon + jotain laskureita. Itse sanasto kuitenkin tulee olemaan aina kokonaisuudessaan julkinen, koska hanke on tarkoitettu yleishyödylliseksi. http://www.sanoittajat.fi/Sanoittaja_Samuli_Koivulahti.html
www.sanoittajat.fi | |
![]() 17.11.2006 09:59:11 | |
Musta toi toimii nyt ihan tarpeeksi hyvin noin, eli ohjelmointia ei tarvita, mutta riimejä voi keksiä ja kaivaa lisää ja meilata mulle niin mä sitten päivittelen niitä itse tonne sivuille. Pyydän sitten ylläpitoapua jos homma alkaa revetä käsistä =) Tuon sanaston tulen pitämään aina "avoimena" jotta sitä pääsee kukin lukemaan läpi ja ainoa muutos mitä siihen saattaa tulla on se että tuohon sivuille varmaan tulee oma robotti tuohon + jotain laskureita. Itse sanasto kuitenkin tulee olemaan aina kokonaisuudessaan julkinen, koska hanke on tarkoitettu yleishyödylliseksi. ei mut tos ei pysty hakemaan niillä sanojen päätteillä mikä ois ainakin mulle se kaikkein tarpeellisin juttu. Aikooko kukaan tehä sit semmosta? Kirjoittaja on asiastaan tietämätön hölmö. | |
![]() 17.11.2006 13:44:41 | |
Heikki Salon kotisivuilla on RiimiRenki -niminen riimisanakirja. http://www.heikkisalo.com Testauksen perusteella ihan käypä. Ajassa irrallaan. @ 14.11.2006
/
Fiktiivisiä keskusteluja. @ 14.11.2006 | |
![]() 17.11.2006 18:32:26 | |
ei mut tos ei pysty hakemaan niillä sanojen päätteillä mikä ois ainakin mulle se kaikkein tarpeellisin juttu. Aikooko kukaan tehä sit semmosta? Terve kyllä pystyy.. ainakin jos käytät firefoxin selainta ja kirjoitatta kenttään vaikka "kka" niin se etsii nimenomaan päätteitä. riimirenki pelaa myös hyvin mutta siinä on puutteena se ettei se tunne kuin perusmuotoja ja se että se toimii vain sanan päätteiden perusteella. Uskon että tästä tulee ajan kuluessa parempi kun sanastoa laajennetaan tarpeen mukaisesti ja manuaalisesti, vaikka siinä onkin vielä tässävaiheessa kovempi työ. http://www.sanoittajat.fi/Sanoittaja_Samuli_Koivulahti.html
www.sanoittajat.fi | |
‹ edellinen sivu | seuraava sivu › 1 |
› Lisää uusi kirjoitus aiheeseen (vaatii kirjautumisen)