Przejdź do głównej zawartości

Morfologik 1.5 na Nowy Rok

Ponieważ przygotowuję nową wersję LanguageTool (0.9.6) – z wieloma nowymi ciekawymi możliwościami – postanowiłem poprawić trochę słownik, bo jest mi potrzebny do poprawnego działania funkcji unifikacji (uzgadniania) atrybutów. Poprawiłem głównie rzeczowniki – przede wszystkim rodzaju męskiego. Większość z nich, poza rzadkimi nazwami własnymi, jest już prawidłowo przyporządkowana do kategorii rodzaju m1, m2 lub m3 (męskoosobowe, męskożywotne i męskonieżywotne – ujmując ten podział tradycyjnymi kategoriami). Poprawiłem też trochę systematycznych błędów, dodałem trochę form nieregularnych (np. odmianę imienia Pablo).

A o wersji 0.9.6 i unifikacji jeszcze napiszę :)

Komentarze

Anonimowy pisze…
Dzięki za nową wersję - już się przymierzam do grepowania :)

A mógłbyś zrobić jakieś miejsce do zgłaszania błędów w morfologiku? Na razie siedzi dalej "Nabuttowi", nie jest kompletna lista form czasownika "bać" (brak "bój", a moja Milena lubi mieć kompletną listę jednosylabowych czasowników), błędna pisownia odmienionego "colón"... a pewnie jest tego więcej :(

Rozumiem że morfologik jest generowany automatycznie na podstawie innych źródeł, ale może coś w stylu "errata"?

Pozdrawiam i jeszcze raz dziękuję za miły prezencik.
Obecna wersja jest jedynie poprawionym wydaniem poprzedniej, bo źródła (słownik alternatywny na sjp.pl) od sierpnia 2008 nie są już aktualizowane.

Różnice między wersjami1 1.4 i 1.5 ujawni diff ;)

Najprościej błędy zgłaszać w trackerze na sourceforge.net - morfologik ma taki i tracker świeci pustkami:

http://sourceforge.net/tracker/?group_id=166344&atid=838650

Z pewnością wszystko uwzględnię, bo teraz to wszystko ma charakter erraty.

Aha, już zauważyłem sporo błędów w wersji 1.5 (błędne oznaczenie "aff" przy niektórych zanegowanych imiesłowach czynnych; brak oznaczenia "aff" i "neg" przy przysłówkach w stopniu równym; brak oznaczenia stopnia równego w przysłówkach; brak wyrazów pisanych z łącznikiem - są ich połówki, typu "cza" - od "cza-cza").
Anonimowy pisze…
ja z innej beczki: kiedy bedzie otwarcie tej strony http://openoffice.org.pl/ ?
Ta strona jest prywatną własnością i już ruszyła - chyba nic więcej na niej nie będzie, tylko odnośniki do pobierania.
Anonimowy pisze…
Zajrzałem do trackera i wcale się nie dziwię że jest pusto - wygląda tak jakby po prostu pozostał sobie taki "difult" do którego nikt nie zagląda (istnienie kategorii "interface" w projekcie który takowego nie posiada i ostatnia wersja 1.0). Jak mogę w takiej sytuacji zgłosić literówkę w wersji 1.5?

Na razie wrzuciłem to co znalazłem.

Przy okazji dziękuję za "cza-cza" - właśnie wrzucam do słownika Mileny :)
Anonimowy pisze…
aha, mialem nadzieje, ze cos bedzie wiecej

Popularne posty z tego bloga

Imiesłów przysłówkowy bez orzeczenia

W zdaniach z imiesłowami przysłówkowymi (-ąc i -wszy), zakończonych znakiem interpunkcyjnym, powinno występować orzeczenie. Dopuszczalne jest opuszczenie orzeczenia w tytule. W tytule nie stosuje się jednak kropek na końcu. Na przykład: Czekając na Godota Czekając na Godota, zabawiali się rozmową. Błąd ten jest tym bardziej rażący w zdaniach, w których występuje zdanie podrzędne: !Czekając na Godota, który nie przychodził. Usterka zostanie wykryta także w błędnie formułowanych pytaniach: !Rozmawiając o sporcie, który sport uprawiasz? W powyższym przykładzie podmiot imiesłowu jest inny od podmiotu pytania (my rozmawiamy, a sport uprawiasz tylko ty). Powinno być: Skoro już mowa o sporcie, którą dyscyplinę uprawiasz?

Gromadzimy błędy językowe

Tu zbieram błędy, które mają być wykrywane regułami. Część z tych błędów można dodać także do list autokorekty w Ooo (a nawet w programie MS Word). Warto pamiętać, że na liście muszą być tylko te błędy, których nie wykryje już korektor pisowni (a zatem błędne formy fleksyjne i proste błędy ortograficzne nie muszą być tutaj umieszczane). Zapraszam do komentowania i uzupełniania tej listy, na pewno nie jest wyczerpująca. Mówiąc krótko, to taki negatywny słownik języka polskiego ;) Nowomowa, ale nie błąd: wychodzić|wyjść * naprzeciw -> popierać *, iść na rękę * wprowadzić kogo w co -> zapoznać kogo z czym [fałszywe alarmy] w przypomnieniu -> przypominając [za dużo fałszywych alarmów] do wojny -> przed wojną [fałszywe alarmy, wiele poprawnych zwrotów] więcej chory -> coraz bardziej chory [rzadkie] widzieć się zmuszonym -> być zmuszonym w uzupełnieniu -> uzupełniając do roku -> przed upływem roku [za dużo fałszywych alarmów] trzymać wagę, firmę, mowę ś...

Aktualizacja słownika ortograficznego w programie LanguageTool 5.8

Przygotowałem aktualizację słownika ortograficznego stosowanego w programie LanguageTool (będzie dostępna publicznie w nowym wydaniu, 5.8, planowanym na koniec czerwca). Słownik oparty jest przede wszystkim na słownikach dostępnych na sjp.pl , lecz usunąłem trochę mylących wpisów (np. niezalecaną formę „ grejfrut ”) i dodałem trochę funkcji (typu wyrazy pisane z łącznikiem), które są potrzebne. Zdumiało mnie, że poprzednia wersja słownika pochodziła z roku 2008. No cóż, ta zmiana się po prostu należała. W kolejce jest aktualizacja paczki słowników do LibreOffice/OpenOffice.