Przejdź do głównej zawartości

LanguageTool 0.8.3 z obsługą polskiego!

Na stronie www.danielnaber.de/languagetool/ do pobrania jest moduł LanguageTool 0.8.3 z prototypową obsługą języka polskiego.

Instalacja:

  • W programie OpenOffice.org (testowano tylko wersję 2.0)
    • Kliknij polecenie Narzędzia > Menedżer pakietów > Dodaj, a następnie wybierz plik LanguageTool-0.8.3.zip (bez rozpakowywania). Po otwarciu nowego okna edytora OpenOffice.org Writer (naciśnij klawisze Ctrl+N) w menu pojawi się nowe menu LanguageTool, które zawiera polecenie Check text... służące do sprawdzania tekstu.
  • Bez programu OpenOffice.org
    • Rozpakuj archiwum i uruchom plik LanguageToolGui.jar, klikając go dwukrotnie. Jeśli na danym komputerze nie skonfigurowano skojarzenia dla plików *.jar, uruchom program z wiersza poleceń za pomocą polecenia java -jar LanguageToolGUI.jar. Plik LanguageTool.jar jest natomiast korektorem działającym z poziomu wiersza poleceń.
Uwaga. Ta wersja to prototyp; zawiera tylko kilkanaście reguł dla języka polskiego. Niektóre nazwy reguł mają niepoprawne nazwy (posypały się polskie literki), które w następnej wersji zostaną poprawione. Również opis błędu "w oparciu o" jest niegramatyczny, ale to też już poprawiono i w kolejnej wersji tego nie będzie.

Komentarze

Anonimowy pisze…
Łatwo się instaluje i nawet w połowie działa. Wpisałem "Ale jeszcze jeszcze go nie mam", i moduł zaznaczył zdublowane słowo. Wpisałem "Ale jeszcze jeszcze go nie mam, chociaż może może już niedługo będę go miał" i okazało się, że moduł nie sprawdza niczego poza pierwszym zdublowanym wyrazem.
Może zamiast je zaznać, mógłby je podkreślać? I nie działa opcja "configuration".
Myślę, że zamiast dodawania takiego menu i "wymuszać" na użytkowniku klikanie, niech dodatek sam sprawdza pisownie automatycznie - a menu, lepiej byłoby ukryć.
Anonimowy pisze…
No i moduł dołącza się tylko do Writera...
Kilka odpowiedzi od razu:

1. Moduł nie może automatycznie sprawdzać gramatyki. OOo jest jeszcze za słabe, dopiero wbudowywane są funkcje do obsługi korektorów gramatycznych (robi to Bruno Sant'anna w ramach Google SOC). Podkreślanie itd. to śpiew przyszłości, ale to będzie. Ja ani Daniel Naber nie możemy nic zrobić, dopóki Bruno nie skończy.

2. Opcja Configuration uruchamia się dosyć powoli. Trzeba poczekać.

3. Co do zdanka "Ale jeszcze jeszcze go nie mam, chociaż może może już niedługo będę go miał", to nie łapię, w czym problem. Błędy pokazują się w okienku po kolei, więc najpierw jest problem "jeszcze jeszcze", a potem problem "może może". Chyba że przycisk "Change" nie działa?

Zob. KNOWN BUGS:

-OpenOffice.org integration:
-cursor first jumps to start of text, only then to the error position
-LanguageTool gets confused when the text is changed while the LanguageTool
dialog is open
-LanguageTool doesn't work if you have a Windows username with special characters
-changing options only takes effect on next check
-some errors trigger two rules at the same position, this makes the "Change text"
button work wrong
-Checking of selected text sometimes throws java.lang.reflect.UndeclaredThrowableException
at $Proxy17.gotoRange(Unknown Source)
-usability: pressing Esc too long will close both dialogs, should close only one
Anonimowy pisze…
Ten komentarz został usunięty przez administratora bloga.
Anonimowy pisze…
Ad3. tak, przycisk "Change" nie działa
Anonimowy pisze…
Ten komentarz został usunięty przez administratora bloga.
Anonymous, no to w takim razie to jest znany błąd, aczkolwiek akurat u mnie się on nie ujawnia. Masz może znaki narodowe w nazwie użytkownika Windows? Hm, wygląda na jakiś błąd (Daniel pracuje nad kilkoma poprawkami, które to mają usunąć).

Luo, rzeczywiście, dołącza się tylko do Writera. Nie wiem, czy łatwe jest dołączenie do innych modułów (dopiszę do listy życzeń :) )
Anonimowy pisze…
nie, user nazywa się "quest" :>
Anonimowy pisze…
Zainstalowałem OO.org 2.0.3 i menu LanguageTool jest we wszystkich składnikach OO.org :| Ale tylko we Writerze działa "check text"

Popularne posty z tego bloga

Imiesłów przysłówkowy bez orzeczenia

W zdaniach z imiesłowami przysłówkowymi (-ąc i -wszy), zakończonych znakiem interpunkcyjnym, powinno występować orzeczenie. Dopuszczalne jest opuszczenie orzeczenia w tytule. W tytule nie stosuje się jednak kropek na końcu. Na przykład: Czekając na Godota Czekając na Godota, zabawiali się rozmową. Błąd ten jest tym bardziej rażący w zdaniach, w których występuje zdanie podrzędne: !Czekając na Godota, który nie przychodził. Usterka zostanie wykryta także w błędnie formułowanych pytaniach: !Rozmawiając o sporcie, który sport uprawiasz? W powyższym przykładzie podmiot imiesłowu jest inny od podmiotu pytania (my rozmawiamy, a sport uprawiasz tylko ty). Powinno być: Skoro już mowa o sporcie, którą dyscyplinę uprawiasz?

Gromadzimy błędy językowe

Tu zbieram błędy, które mają być wykrywane regułami. Część z tych błędów można dodać także do list autokorekty w Ooo (a nawet w programie MS Word). Warto pamiętać, że na liście muszą być tylko te błędy, których nie wykryje już korektor pisowni (a zatem błędne formy fleksyjne i proste błędy ortograficzne nie muszą być tutaj umieszczane). Zapraszam do komentowania i uzupełniania tej listy, na pewno nie jest wyczerpująca. Mówiąc krótko, to taki negatywny słownik języka polskiego ;) Nowomowa, ale nie błąd: wychodzić|wyjść * naprzeciw -> popierać *, iść na rękę * wprowadzić kogo w co -> zapoznać kogo z czym [fałszywe alarmy] w przypomnieniu -> przypominając [za dużo fałszywych alarmów] do wojny -> przed wojną [fałszywe alarmy, wiele poprawnych zwrotów] więcej chory -> coraz bardziej chory [rzadkie] widzieć się zmuszonym -> być zmuszonym w uzupełnieniu -> uzupełniając do roku -> przed upływem roku [za dużo fałszywych alarmów] trzymać wagę, firmę, mowę ś

Wikipedia history diff as a revision corpus

(As this is of interest not only to the Polish-speaking community, this post is in English.) Recently, after some discussions on the lingucomponent list at OpenOffice.org on the method of finding frequent typos, I did some experiments on the revision history logs. Background. The developers of grammar checkers, and autocorrect lists, have hard times with finding relevant corpora. Revision history is an excellent source about native speakers perception of linguistic norms. Frequently revised typos are perceived as errors that need to be corrected, so using these typos on autocorrect lists is justified. The same goes for style, grammar and usage errors. Method . Experiments involved three steps: Clean the history dump (??wiki-latest-pages-meta-history.xml), to get only relevant parts of the dump. Using XML tools isn't recommended (I tried XSLT, forget it). Using a simple awk script, I was able to clean the > 30GB dump in an hour or so, and got a >17 GB file. The script is simp