Przejdź do głównej zawartości

LanguageTool 0.9.3

Dzisiaj ukazała się najnowsza wersja LanguageTool, działająca wyłącznie w najnowszych wersjach OpenOffice.org 3.0 (od kompilacji deweloperskiej m26, a więc nie we wcześniejszych wersjach beta!).

Nowością jest możliwość automatycznego sprawdzania błędów językowych w OpenOffice.org po zainstalowaniu korektora. Są one podkreślane na niebiesko.

  • około 100 nowych reguł dla języka polskiego (obecnie jest ich 819);
  • prawie 150 nowych reguł dla angielszczyzny (łącznie 383);
  • wprowadzono podstawy obsługi języka rosyjskiego i kilka reguł dla języka szwedzkiego;
  • poprawiono drobne błędy;
Instalacja:

  • W programie OpenOffice.org 3.0 (od wersji m26)
    • Metoda prosta
      Dwukrotnie kliknij pobrany plik LanguageTool-0.9.3.oxt. Jeśli w systemie jest zarejestrowane rozszerzenie .oxt (robią to aktualne wersje OpenOffice.org), nastąpi uruchomienie instalatora.
    • Metoda tradycyjna
      Kliknij polecenie Narzędzia > Menedżer rozszerzeń > Dodaj, a następnie wybierz plik LanguageTool-0.9.3.oxt (bez rozpakowywania). Zamknij pakiet (łącznie z modułem szybkiego uruchamiania). Po ponownym otwarciu OpenOffice.org będzie możliwe automatyczne sprawdzanie tekstu. Jako test wpisz zdanie: „To zdanie zdanie jest z błędem”.
  • Bez programu OpenOffice.org
    • Rozpakuj archiwum LanguageTool-0.9.3.oxt (jest to plik w formacie .zip) i uruchom plik LanguageToolGui.jar, klikając go dwukrotnie. Jeśli na danym komputerze nie skonfigurowano skojarzenia dla plików *.jar, uruchom program z wiersza poleceń za pomocą polecenia java -jar LanguageToolGUI.jar. Plik LanguageTool.jar jest natomiast korektorem działającym z poziomu wiersza poleceń.
    • Rozpakuj znajdujący się w archiwum plik standalone-libs.zip do tego samego katalogu, do którego rozpakowano pliki z archiwum.
W razie problemów
  1. Należy upewnić się, czy w systemie zainstalowana jest Java w wersji co najmniej 1.5.
  2. Ta wersja środowiska Java musi być widoczna dla OpenOffice.org (Narzędzia > Opcje > Java).
Reguły

Nowe reguły dla polszczyzny można obejrzeć tutaj.

Komentarze

Anonimowy pisze…
Witam, chciałem się upewnić czy to nie jest błąd - po wklejeniu tekstu do OO "mówi samo przez się" faktycznie podkreśla na niebiesko ale najpierw sugeruje mi, że zdanie nie zaczyna się od dużej litery- niestety jedyna propozycja jaką mi podsuwa jest sam wyraz "Mówi" bez dalszej części - czy będzie coś z tym zrobione?
Proszę zastosować tę poprawkę. Zdanie wtedy zacznie się od "Mówi" (wielką literą). Tu nie ma żadnego błędu, tak to ma działać (reszty zdania nie trzeba zmieniać, jest przecież małymi literami).
Anonimowy pisze…
mam pyatanie odnośnie lematyztora. Wyczytałem, że możliwe jest zastosowanie go razem ze słownikami innych języków. Gdzie mógłbym się dowiedzieć coś więcej na ten temat jak to zrobic??
Jest możliwe. Pełny opis tutaj: http://languagetool.wikidot.com/developing-a-tagger-dictionary
Anonimowy pisze…
Zainstalowałem OpenOffice BEB300m3 (build 9328) i LT 0.9.3, słownik języka polskiego. Platforma to Windows XP SP2, Java 1.6.0_07 firmy Sun, widoczna poprawnie. Sprawdzanie na żądanie działa bez zarzutu, niestety nie ma podkreślania.
Co może być nie tak?
P.S. Brawa za projekt, pod tym względem Microsoft Word zostaje daleko w tyle!
Wydaje mi się, że BEB300m3 to za stara wersja. Własnie zainstalowałem LT w OOO300m3 (build 9344) i działa. Uwaga: trzeba OOo uruchomić ponownie (wyłączając szybkie uruchamianie), bo to nie działa od razu. Pobierałem z oficjalnej strony
A i jeszcze jedna rzecz: musi być włączone automatyczne sprawdzanie pisowni (podkreślanie na czerwono). Inaczej nie uruchomi się automatycznie.
Anonimowy pisze…
wracając do wykorzystywania innych słowników to zrozumiałem jak taki plik słonika przygotować, ale nie bardzo wiem jak miałbym go podpiąć bezpośrednio pod lametyzatora. Jeśli wywołuje, morfologik...nodict (bo tutaj teoretycznie można podpiąć inny słownik) to otrzymuje taki błąd : java.lang.NoClassDefFoundError: org/apache/commons/cli/ParseException

czy moge prosić o jakieś wskazówki
Wskazówki:

(1) ogólny tagger: http://languagetool.cvs.sourceforge.net/languagetool/JLanguageTool/src/java/de/danielnaber/languagetool/tagging/BaseTagger.java?revision=1.3&view=markup

wersja np. włoska:
http://languagetool.cvs.sourceforge.net/languagetool/JLanguageTool/src/java/de/danielnaber/languagetool/tagging/it/ItalianTagger.java?revision=1.14&view=markup

(2) w katalogu wraz z plikiem .dict powinien znajdować się plik .info (przykłady w źródłach LanguageTool)
Anonimowy pisze…
Witam,

mam problem z instalacja slownika do wersji Ooo 3.0 - po sciagnieciu pliku LanguageTool 0.9.4 z Waszej strony i probie instalacji za kazdym razem pojawia sie okno: (com.sun.star.registry.CannotRegisterImplementationException) { {Message ='''', Context = (com.sun.star.uno.XInterface)@0}}. Dodam jeszcze, ze bez problemu na podobnej zasadzie zainstalowalam slownik czeski, który dziala doskonale. Bede ogromnie wdzieczna za pomoc!
Witam, proszę spojrzeć na ostatnią moją propozycję w komentarzach pod wpisem LanguageTool 0.9.4 i sprawdzić, czy to działa.

Niestety, ja nie jestem w stanie odtworzyć tego błędu, wiem tylko, że czasem się pojawia...

Popularne posty z tego bloga

Imiesłów przysłówkowy bez orzeczenia

W zdaniach z imiesłowami przysłówkowymi (-ąc i -wszy), zakończonych znakiem interpunkcyjnym, powinno występować orzeczenie. Dopuszczalne jest opuszczenie orzeczenia w tytule. W tytule nie stosuje się jednak kropek na końcu. Na przykład: Czekając na Godota Czekając na Godota, zabawiali się rozmową. Błąd ten jest tym bardziej rażący w zdaniach, w których występuje zdanie podrzędne: !Czekając na Godota, który nie przychodził. Usterka zostanie wykryta także w błędnie formułowanych pytaniach: !Rozmawiając o sporcie, który sport uprawiasz? W powyższym przykładzie podmiot imiesłowu jest inny od podmiotu pytania (my rozmawiamy, a sport uprawiasz tylko ty). Powinno być: Skoro już mowa o sporcie, którą dyscyplinę uprawiasz?

Gromadzimy błędy językowe

Tu zbieram błędy, które mają być wykrywane regułami. Część z tych błędów można dodać także do list autokorekty w Ooo (a nawet w programie MS Word). Warto pamiętać, że na liście muszą być tylko te błędy, których nie wykryje już korektor pisowni (a zatem błędne formy fleksyjne i proste błędy ortograficzne nie muszą być tutaj umieszczane). Zapraszam do komentowania i uzupełniania tej listy, na pewno nie jest wyczerpująca. Mówiąc krótko, to taki negatywny słownik języka polskiego ;) Nowomowa, ale nie błąd: wychodzić|wyjść * naprzeciw -> popierać *, iść na rękę * wprowadzić kogo w co -> zapoznać kogo z czym [fałszywe alarmy] w przypomnieniu -> przypominając [za dużo fałszywych alarmów] do wojny -> przed wojną [fałszywe alarmy, wiele poprawnych zwrotów] więcej chory -> coraz bardziej chory [rzadkie] widzieć się zmuszonym -> być zmuszonym w uzupełnieniu -> uzupełniając do roku -> przed upływem roku [za dużo fałszywych alarmów] trzymać wagę, firmę, mowę ś

Wikipedia history diff as a revision corpus

(As this is of interest not only to the Polish-speaking community, this post is in English.) Recently, after some discussions on the lingucomponent list at OpenOffice.org on the method of finding frequent typos, I did some experiments on the revision history logs. Background. The developers of grammar checkers, and autocorrect lists, have hard times with finding relevant corpora. Revision history is an excellent source about native speakers perception of linguistic norms. Frequently revised typos are perceived as errors that need to be corrected, so using these typos on autocorrect lists is justified. The same goes for style, grammar and usage errors. Method . Experiments involved three steps: Clean the history dump (??wiki-latest-pages-meta-history.xml), to get only relevant parts of the dump. Using XML tools isn't recommended (I tried XSLT, forget it). Using a simple awk script, I was able to clean the > 30GB dump in an hour or so, and got a >17 GB file. The script is simp