Zacząłem gromadzić korpus polszczyzny z blogów. Okazało się, że blogi nastolatków na onecie w istocie zawierają bardzo mało czystego tekstu (i ogromną liczbę błędów). Muszę więc zgromadzić tego więcej... Klikając sobie w ustawieniach Bloggera odkryłem jednak perełkę: wyszukiwarkę w tekstach blogów (Google’a). Już nie trzeba wpisywać żadnych specjalnych i wymyślnych składniowo poleceń, wystarczy przejść pod odpowiedni adres .
Strona projektu morfologik - analizator morfologiczny + słownik morfologiczny + korektor gramatyczny + biblioteki