LanguageTool 0.9.3

Dzisiaj ukazała się najnowsza wersja LanguageTool, działająca wyłącznie w najnowszych wersjach OpenOffice.org 3.0 (od kompilacji deweloperskiej m26, a więc nie we wcześniejszych wersjach beta!).

Nowością jest możliwość automatycznego sprawdzania błędów językowych w OpenOffice.org po zainstalowaniu korektora. Są one podkreślane na niebiesko.

około 100 nowych reguł dla języka polskiego (obecnie jest ich 819);
prawie 150 nowych reguł dla angielszczyzny (łącznie 383);
wprowadzono podstawy obsługi języka rosyjskiego i kilka reguł dla języka szwedzkiego;
poprawiono drobne błędy;

Instalacja:

W programie OpenOffice.org 3.0 (od wersji m26)

Metoda prosta
Dwukrotnie kliknij pobrany plik LanguageTool-0.9.3.oxt. Jeśli w systemie jest zarejestrowane rozszerzenie .oxt (robią to aktualne wersje OpenOffice.org), nastąpi uruchomienie instalatora.
Metoda tradycyjna
Kliknij polecenie Narzędzia > Menedżer rozszerzeń > Dodaj, a następnie wybierz plik LanguageTool-0.9.3.oxt (bez rozpakowywania). Zamknij pakiet (łącznie z modułem szybkiego uruchamiania). Po ponownym otwarciu OpenOffice.org będzie możliwe automatyczne sprawdzanie tekstu. Jako test wpisz zdanie: „To zdanie zdanie jest z błędem”.

Bez programu OpenOffice.org

Rozpakuj archiwum LanguageTool-0.9.3.oxt (jest to plik w formacie .zip) i uruchom plik LanguageToolGui.jar, klikając go dwukrotnie. Jeśli na danym komputerze nie skonfigurowano skojarzenia dla plików *.jar, uruchom program z wiersza poleceń za pomocą polecenia java -jar LanguageToolGUI.jar. Plik LanguageTool.jar jest natomiast korektorem działającym z poziomu wiersza poleceń.
Rozpakuj znajdujący się w archiwum plik standalone-libs.zip do tego samego katalogu, do którego rozpakowano pliki z archiwum.

W razie problemów

Należy upewnić się, czy w systemie zainstalowana jest Java w wersji co najmniej 1.5.
Ta wersja środowiska Java musi być widoczna dla OpenOffice.org (Narzędzia > Opcje > Java).

Reguły

Nowe reguły dla polszczyzny można obejrzeć tutaj.

Imiesłów przysłówkowy bez orzeczenia

W zdaniach z imiesłowami przysłówkowymi (-ąc i -wszy), zakończonych znakiem interpunkcyjnym, powinno występować orzeczenie. Dopuszczalne jest opuszczenie orzeczenia w tytule. W tytule nie stosuje się jednak kropek na końcu. Na przykład: Czekając na Godota Czekając na Godota, zabawiali się rozmową. Błąd ten jest tym bardziej rażący w zdaniach, w których występuje zdanie podrzędne: !Czekając na Godota, który nie przychodził. Usterka zostanie wykryta także w błędnie formułowanych pytaniach: !Rozmawiając o sporcie, który sport uprawiasz? W powyższym przykładzie podmiot imiesłowu jest inny od podmiotu pytania (my rozmawiamy, a sport uprawiasz tylko ty). Powinno być: Skoro już mowa o sporcie, którą dyscyplinę uprawiasz?

Czytaj więcej

Gromadzimy błędy językowe

Tu zbieram błędy, które mają być wykrywane regułami. Część z tych błędów można dodać także do list autokorekty w Ooo (a nawet w programie MS Word). Warto pamiętać, że na liście muszą być tylko te błędy, których nie wykryje już korektor pisowni (a zatem błędne formy fleksyjne i proste błędy ortograficzne nie muszą być tutaj umieszczane). Zapraszam do komentowania i uzupełniania tej listy, na pewno nie jest wyczerpująca. Mówiąc krótko, to taki negatywny słownik języka polskiego ;) Nowomowa, ale nie błąd: wychodzić|wyjść * naprzeciw -> popierać *, iść na rękę * wprowadzić kogo w co -> zapoznać kogo z czym [fałszywe alarmy] w przypomnieniu -> przypominając [za dużo fałszywych alarmów] do wojny -> przed wojną [fałszywe alarmy, wiele poprawnych zwrotów] więcej chory -> coraz bardziej chory [rzadkie] widzieć się zmuszonym -> być zmuszonym w uzupełnieniu -> uzupełniając do roku -> przed upływem roku [za dużo fałszywych alarmów] trzymać wagę, firmę, mowę ś...

Czytaj więcej

Walery Pisarek — Słownik języka niby-polskiego

Małopolska Biblioteka Cyfrowa udostępnia książkę profesora Walerego Pisarka Słownik języka niby-polskiego w formacie PDF. Co prawda, opisane w niej błędy w większości pochodzą z prasy z lat siedemdziesiątych, ale wiele błędów typowych dla napuszonego i pretensjonalnego języka niestety trzyma się nadal w polszczyźnie.

Czytaj więcej

Komentarze

Anonimowy pisze…

Witam, chciałem się upewnić czy to nie jest błąd - po wklejeniu tekstu do OO "mówi samo przez się" faktycznie podkreśla na niebiesko ale najpierw sugeruje mi, że zdanie nie zaczyna się od dużej litery- niestety jedyna propozycja jaką mi podsuwa jest sam wyraz "Mówi" bez dalszej części - czy będzie coś z tym zrobione?

7.8.08

Marcin Miłkowski pisze…

Proszę zastosować tę poprawkę. Zdanie wtedy zacznie się od "Mówi" (wielką literą). Tu nie ma żadnego błędu, tak to ma działać (reszty zdania nie trzeba zmieniać, jest przecież małymi literami).

mam pyatanie odnośnie lematyztora. Wyczytałem, że możliwe jest zastosowanie go razem ze słownikami innych języków. Gdzie mógłbym się dowiedzieć coś więcej na ten temat jak to zrobic??

27.8.08

Jest możliwe. Pełny opis tutaj: http://languagetool.wikidot.com/developing-a-tagger-dictionary

29.8.08

Zainstalowałem OpenOffice BEB300m3 (build 9328) i LT 0.9.3, słownik języka polskiego. Platforma to Windows XP SP2, Java 1.6.0_07 firmy Sun, widoczna poprawnie. Sprawdzanie na żądanie działa bez zarzutu, niestety nie ma podkreślania.
Co może być nie tak?
P.S. Brawa za projekt, pod tym względem Microsoft Word zostaje daleko w tyle!

Wydaje mi się, że BEB300m3 to za stara wersja. Własnie zainstalowałem LT w OOO300m3 (build 9344) i działa. Uwaga: trzeba OOo uruchomić ponownie (wyłączając szybkie uruchamianie), bo to nie działa od razu. Pobierałem z oficjalnej strony

A i jeszcze jedna rzecz: musi być włączone automatyczne sprawdzanie pisowni (podkreślanie na czerwono). Inaczej nie uruchomi się automatycznie.

wracając do wykorzystywania innych słowników to zrozumiałem jak taki plik słonika przygotować, ale nie bardzo wiem jak miałbym go podpiąć bezpośrednio pod lametyzatora. Jeśli wywołuje, morfologik...nodict (bo tutaj teoretycznie można podpiąć inny słownik) to otrzymuje taki błąd : java.lang.NoClassDefFoundError: org/apache/commons/cli/ParseException

czy moge prosić o jakieś wskazówki

1.9.08

Wskazówki:

(1) ogólny tagger: http://languagetool.cvs.sourceforge.net/languagetool/JLanguageTool/src/java/de/danielnaber/languagetool/tagging/BaseTagger.java?revision=1.3&view=markup

wersja np. włoska:
http://languagetool.cvs.sourceforge.net/languagetool/JLanguageTool/src/java/de/danielnaber/languagetool/tagging/it/ItalianTagger.java?revision=1.14&view=markup

(2) w katalogu wraz z plikiem .dict powinien znajdować się plik .info (przykłady w źródłach LanguageTool)

Witam,

mam problem z instalacja slownika do wersji Ooo 3.0 - po sciagnieciu pliku LanguageTool 0.9.4 z Waszej strony i probie instalacji za kazdym razem pojawia sie okno: (com.sun.star.registry.CannotRegisterImplementationException) { {Message ='''', Context = (com.sun.star.uno.XInterface)@0}}. Dodam jeszcze, ze bez problemu na podobnej zasadzie zainstalowalam slownik czeski, który dziala doskonale. Bede ogromnie wdzieczna za pomoc!

19.10.08

Witam, proszę spojrzeć na ostatnią moją propozycję w komentarzach pod wpisem LanguageTool 0.9.4 i sprawdzić, czy to działa.

Niestety, ja nie jestem w stanie odtworzyć tego błędu, wiem tylko, że czasem się pojawia...

Morfologik

Szukaj na tym blogu