Treba mi spisak svih(sto vise to bolje) reci srpskog jezika u nekom citljivom formatu, po mogucstvu obican text fajl... Zna li neko gde mogu to da nadjem...
Pokusavao sam sa nekim recnicima, ali nisam nasao neki cija je baza u citljivom formatu, ako neko ima neki koji je citljiv neka mi kaze ime, pa cu ga skinuti.
Pravis slagalicu?
Mozes napraviti svoju bazu tako sto ces reci skupljati pomocu skripte sa nekog novinskog sajta koji bar malo drzi do pravopisa.
Na primer izvrtis sve clanke sa Politike koji su napisani u par godina, proveravas rec po rec da li je unkat, a duplikate, interpukcije i ostalo djubre odbacujes. Na kraju bi trebao da imas sasvim pristojnu bazu koju eventualno treba rucno ocistiti.
Nije brute-force, napravio sam neki jquery plugin za prebacivanje web stranica iz latinice u cirilicu, pa mi treba spisak reci koje imaju u sebi slova dj, nj, lj otprilike :)
Pa sam mislio da uzmem neki recnik i da pretrazim takve reci, a ovo sa skupljanjem reci sa recimo politike nije losa ideja, ujedno mogu da filtriram odmah reci koje imaju ove dvoznake...
Ako neko u medjuvremenu ima neki recnik sa citljivom bazom, neka javi da se ne mucim ;)