31.12.08

Morfologik 1.5 na Nowy Rok

Ponieważ przygotowuję nową wersję LanguageTool (0.9.6) – z wieloma nowymi ciekawymi możliwościami – postanowiłem poprawić trochę słownik, bo jest mi potrzebny do poprawnego działania funkcji unifikacji (uzgadniania) atrybutów. Poprawiłem głównie rzeczowniki – przede wszystkim rodzaju męskiego. Większość z nich, poza rzadkimi nazwami własnymi, jest już prawidłowo przyporządkowana do kategorii rodzaju m1, m2 lub m3 (męskoosobowe, męskożywotne i męskonieżywotne – ujmując ten podział tradycyjnymi kategoriami). Poprawiłem też trochę systematycznych błędów, dodałem trochę form nieregularnych (np. odmianę imienia Pablo).

A o wersji 0.9.6 i unifikacji jeszcze napiszę :)

6 komentarzy:

ethanak pisze...

Dzięki za nową wersję - już się przymierzam do grepowania :)

A mógłbyś zrobić jakieś miejsce do zgłaszania błędów w morfologiku? Na razie siedzi dalej "Nabuttowi", nie jest kompletna lista form czasownika "bać" (brak "bój", a moja Milena lubi mieć kompletną listę jednosylabowych czasowników), błędna pisownia odmienionego "colón"... a pewnie jest tego więcej :(

Rozumiem że morfologik jest generowany automatycznie na podstawie innych źródeł, ale może coś w stylu "errata"?

Pozdrawiam i jeszcze raz dziękuję za miły prezencik.

Marcin Miłkowski pisze...

Obecna wersja jest jedynie poprawionym wydaniem poprzedniej, bo źródła (słownik alternatywny na sjp.pl) od sierpnia 2008 nie są już aktualizowane.

Różnice między wersjami1 1.4 i 1.5 ujawni diff ;)

Najprościej błędy zgłaszać w trackerze na sourceforge.net - morfologik ma taki i tracker świeci pustkami:

http://sourceforge.net/tracker/?group_id=166344&atid=838650

Z pewnością wszystko uwzględnię, bo teraz to wszystko ma charakter erraty.

Aha, już zauważyłem sporo błędów w wersji 1.5 (błędne oznaczenie "aff" przy niektórych zanegowanych imiesłowach czynnych; brak oznaczenia "aff" i "neg" przy przysłówkach w stopniu równym; brak oznaczenia stopnia równego w przysłówkach; brak wyrazów pisanych z łącznikiem - są ich połówki, typu "cza" - od "cza-cza").

Łukasz pisze...

ja z innej beczki: kiedy bedzie otwarcie tej strony http://openoffice.org.pl/ ?

Marcin Miłkowski pisze...

Ta strona jest prywatną własnością i już ruszyła - chyba nic więcej na niej nie będzie, tylko odnośniki do pobierania.

ethanak pisze...

Zajrzałem do trackera i wcale się nie dziwię że jest pusto - wygląda tak jakby po prostu pozostał sobie taki "difult" do którego nikt nie zagląda (istnienie kategorii "interface" w projekcie który takowego nie posiada i ostatnia wersja 1.0). Jak mogę w takiej sytuacji zgłosić literówkę w wersji 1.5?

Na razie wrzuciłem to co znalazłem.

Przy okazji dziękuję za "cza-cza" - właśnie wrzucam do słownika Mileny :)

Łukasz pisze...

aha, mialem nadzieje, ze cos bedzie wiecej