Przejdź do głównej zawartości

LanguageTool 0.8.9

Dostępna jest już nowa wersja LanguageTool. Do nowości należy:

  • ponad pół tysiąca polskich reguł (było 452, jest 580),
  • nowa reguła parowania nawiasów i cudzysłowów dla różnych języków,
  • poprawki w regułach francuskich i angielskich,
  • tłumaczenie ukraińskie, hiszpańskie i czeskie,
  • zmniejszenie objętości binarnych wersji słowników (polski słownik zajmuje ok. 2,5 MB, a dawniej prawie 11 MB, a dane są takie same).
Powinno być znacznie mniej fałszywych alarmów. Uwaga: w OpenOffice.org 2.2 PL Menedżer pakietów nazywa się nazwę Menedżer rozszerzeń).

Instalacja:

  • W programie OpenOffice.org 2.x
    • Kliknij polecenie Narzędzia > Menedżer pakietów > Dodaj, a następnie wybierz plik LanguageTool-0.8.9.zip (bez rozpakowywania). Po otwarciu nowego okna edytora OpenOffice.org Writer (naciśnij klawisze Ctrl+N) w menu pojawi się nowe menu LanguageTool, które zawiera polecenie Sprawdź tekst... służące do sprawdzania tekstu.
  • Bez programu OpenOffice.org
    • Rozpakuj archiwum LanguageTool-0.8.9.zip i uruchom plik LanguageToolGui.jar, klikając go dwukrotnie. Jeśli na danym komputerze nie skonfigurowano skojarzenia dla plików *.jar, uruchom program z wiersza poleceń za pomocą polecenia java -jar LanguageToolGUI.jar. Plik LanguageTool.jar jest natomiast korektorem działającym z poziomu wiersza poleceń.
    • Rozpakuj znajdujący się w archiwum plik standalone-libs.zip do tego samego katalogu, do którego rozpakowano pliki z archiwum.
W razie problemów
  1. Należy upewnić się, czy w systemie zainstalowana jest Java w wersji co najmniej 1.5.
  2. Ta wersja środowiska Java musi być widoczna dla OpenOffice.org (Narzędzia > Opcje > Java).

Komentarze

Anonimowy pisze…
Chciałbym dać znać, że LanguageTool 0.8.9 w zestawieniu z OpenOffice.org Novell Edition 2.1.0-7 pracuje bezbłędnie. Nie ma już żadnych kłopotów przeze mnie opisanych we wpisie pod wersją LT 0.8.8. Trudno mi jednak powiedzieć czy programiści Novella naprawili jakiegoś buga czy też może poprawna praca jest zasługą nowej wersji LT. Niestety, nie mam możliwości sprawdzenia.

W każdym razie chciałbym podziękowac za LanguageToola.
Dobrze to słyszeć. Przypuszczam, że to raczej kwestia poprawki w tej wersji OpenOffice.org (wyglądało to na problem z obsługą Javy), ale skoro działa, to nie będziemy tak bardzo dociekać, czemu ;)
Anonimowy pisze…
Niestety wciąż mam problem z parowaniem cudzysłowów (zamianą na drukarskie - zamiast dwóch na górze jeden otwierający na dole, kończący na górze) w OpenOffice 3.0. Ani autokorekta ustawiona w samym OO, ani LT nie pomaga. Dwa cudzysłowy wiszą u góry i nic poza mną nie widzi problemu.

Jeśli ktoś wie, jak temu zaradzić, proszę o kontakt: moj_mail

Dzięki!
W LanguageTool po prostu nie było reguły zastępowania zwykłych cudzysłowów drukarskimi. Ale nie ma przeszkód, żeby dodać - uczynię to w tej wersji :)

Popularne posty z tego bloga

Imiesłów przysłówkowy bez orzeczenia

W zdaniach z imiesłowami przysłówkowymi (-ąc i -wszy), zakończonych znakiem interpunkcyjnym, powinno występować orzeczenie. Dopuszczalne jest opuszczenie orzeczenia w tytule. W tytule nie stosuje się jednak kropek na końcu. Na przykład: Czekając na Godota Czekając na Godota, zabawiali się rozmową. Błąd ten jest tym bardziej rażący w zdaniach, w których występuje zdanie podrzędne: !Czekając na Godota, który nie przychodził. Usterka zostanie wykryta także w błędnie formułowanych pytaniach: !Rozmawiając o sporcie, który sport uprawiasz? W powyższym przykładzie podmiot imiesłowu jest inny od podmiotu pytania (my rozmawiamy, a sport uprawiasz tylko ty). Powinno być: Skoro już mowa o sporcie, którą dyscyplinę uprawiasz?

Gromadzimy błędy językowe

Tu zbieram błędy, które mają być wykrywane regułami. Część z tych błędów można dodać także do list autokorekty w Ooo (a nawet w programie MS Word). Warto pamiętać, że na liście muszą być tylko te błędy, których nie wykryje już korektor pisowni (a zatem błędne formy fleksyjne i proste błędy ortograficzne nie muszą być tutaj umieszczane). Zapraszam do komentowania i uzupełniania tej listy, na pewno nie jest wyczerpująca. Mówiąc krótko, to taki negatywny słownik języka polskiego ;) Nowomowa, ale nie błąd: wychodzić|wyjść * naprzeciw -> popierać *, iść na rękę * wprowadzić kogo w co -> zapoznać kogo z czym [fałszywe alarmy] w przypomnieniu -> przypominając [za dużo fałszywych alarmów] do wojny -> przed wojną [fałszywe alarmy, wiele poprawnych zwrotów] więcej chory -> coraz bardziej chory [rzadkie] widzieć się zmuszonym -> być zmuszonym w uzupełnieniu -> uzupełniając do roku -> przed upływem roku [za dużo fałszywych alarmów] trzymać wagę, firmę, mowę ś

Wikipedia history diff as a revision corpus

(As this is of interest not only to the Polish-speaking community, this post is in English.) Recently, after some discussions on the lingucomponent list at OpenOffice.org on the method of finding frequent typos, I did some experiments on the revision history logs. Background. The developers of grammar checkers, and autocorrect lists, have hard times with finding relevant corpora. Revision history is an excellent source about native speakers perception of linguistic norms. Frequently revised typos are perceived as errors that need to be corrected, so using these typos on autocorrect lists is justified. The same goes for style, grammar and usage errors. Method . Experiments involved three steps: Clean the history dump (??wiki-latest-pages-meta-history.xml), to get only relevant parts of the dump. Using XML tools isn't recommended (I tried XSLT, forget it). Using a simple awk script, I was able to clean the > 30GB dump in an hour or so, and got a >17 GB file. The script is simp