Ponieważ przygotowuję nową wersję LanguageTool (0.9.6) – z wieloma nowymi ciekawymi możliwościami – postanowiłem poprawić trochę słownik, bo jest mi potrzebny do poprawnego działania funkcji unifikacji (uzgadniania) atrybutów. Poprawiłem głównie rzeczowniki – przede wszystkim rodzaju męskiego. Większość z nich, poza rzadkimi nazwami własnymi, jest już prawidłowo przyporządkowana do kategorii rodzaju m1, m2 lub m3 (męskoosobowe, męskożywotne i męskonieżywotne – ujmując ten podział tradycyjnymi kategoriami). Poprawiłem też trochę systematycznych błędów, dodałem trochę form nieregularnych (np. odmianę imienia Pablo).
A o wersji 0.9.6 i unifikacji jeszcze napiszę :)
A o wersji 0.9.6 i unifikacji jeszcze napiszę :)
Komentarze
A mógłbyś zrobić jakieś miejsce do zgłaszania błędów w morfologiku? Na razie siedzi dalej "Nabuttowi", nie jest kompletna lista form czasownika "bać" (brak "bój", a moja Milena lubi mieć kompletną listę jednosylabowych czasowników), błędna pisownia odmienionego "colón"... a pewnie jest tego więcej :(
Rozumiem że morfologik jest generowany automatycznie na podstawie innych źródeł, ale może coś w stylu "errata"?
Pozdrawiam i jeszcze raz dziękuję za miły prezencik.
Różnice między wersjami1 1.4 i 1.5 ujawni diff ;)
Najprościej błędy zgłaszać w trackerze na sourceforge.net - morfologik ma taki i tracker świeci pustkami:
http://sourceforge.net/tracker/?group_id=166344&atid=838650
Z pewnością wszystko uwzględnię, bo teraz to wszystko ma charakter erraty.
Aha, już zauważyłem sporo błędów w wersji 1.5 (błędne oznaczenie "aff" przy niektórych zanegowanych imiesłowach czynnych; brak oznaczenia "aff" i "neg" przy przysłówkach w stopniu równym; brak oznaczenia stopnia równego w przysłówkach; brak wyrazów pisanych z łącznikiem - są ich połówki, typu "cza" - od "cza-cza").
Na razie wrzuciłem to co znalazłem.
Przy okazji dziękuję za "cza-cza" - właśnie wrzucam do słownika Mileny :)