Przejdź do głównej zawartości

LanguageTool 0.8.7 na Nowy Rok!

Na Nowy Rok przygotowaliśmy nową wersję LanguageTool. Oto kilka nowości:

  1. litewskie reguły interpunkcyjne,
  2. więcej polskich reguł (lista wykrywanych błędów),
  3. tłumaczenie na francuski i słoweński,
  4. usunięcie kilku istotnych błędów (niedostrzegalnych w wersji polskiej na komputerach z polskim systemem operacyjnym).

Instalacja:

  • W programie OpenOffice.org 2.x
    • Kliknij polecenie Narzędzia > Menedżer pakietów > Dodaj, a następnie wybierz plik LanguageTool-0.8.7.zip (bez rozpakowywania). Po otwarciu nowego okna edytora OpenOffice.org Writer (naciśnij klawisze Ctrl+N) w menu pojawi się nowe menu LanguageTool, które zawiera polecenie Sprawdź tekst... służące do sprawdzania tekstu.
  • Bez programu OpenOffice.org
    • Rozpakuj archiwum LanguageTool-0.8.7.zip i uruchom plik LanguageToolGui.jar, klikając go dwukrotnie. Jeśli na danym komputerze nie skonfigurowano skojarzenia dla plików *.jar, uruchom program z wiersza poleceń za pomocą polecenia java -jar LanguageToolGUI.jar. Plik LanguageTool.jar jest natomiast korektorem działającym z poziomu wiersza poleceń.
    • Rozpakuj znajdujący się w archiwum plik standalone-libs.zip do tego samego katalogu, do którego rozpakowano pliki z archiwum.

Komentarze

Anonimowy pisze…
Czy ktoś używa Language Tools z OO w wersji ux.pl 2.1 pod Windows? Przy instalacji dostaję komunikat "could not create java implementation loader", a potem w Menadżerze Pakietów mam "Wyłączony"przy "LanguageTool.uno.jar". Może ktoś sobie z tym poradził?
To kwestia Javy - musi być w systemie Java 5 i musi być widoczna dla OpenOffice.org jako podstawowa Java (JRE).
Anonimowy pisze…
Gdzie można zgłosić dostrzeżone niedoskonałości działania Language Tool i pomysły na jego usprawnienie?
Tutaj :)

Co do propozycji - jeśli to będą kolejne błędy do poprawienia, to można wpisać jako komentarz do tekstu "gromadzimy błędy językowe", dostępnego w panelu z lewej strony. Resztę uwag proszę wpisać tutaj (chyba że to kwestie dotyczące bezpieczeństwa, wtedy proszę kontaktować się ze mną mailowo).

Pozdrawiam -
MM
Anonimowy pisze…
W trakcie pracy nad dokumentem dostrzegłem kilka niedoskonałości w działaniu LanguageTool. Najlepiej będzie to widoczne na przykładach.

1.W tekście był zwrot „po kliknięciu na ikonę”. LanguageTool zauważył, że mówi się „kliknąć coś”, a nie „na coś” i skasował słówko „na”. Po tej operacji brzmiało to następująco: „po kliknięciu ikonę”. Jak widać, odmiana rzeczownika pozostała niezmieniona. Sugerowałbym, żeby w oknie LanguageTool pokazującym błędny fragment tekstu możliwa była jego edycja, aby można było go samodzielnie niejako „doszlifować”. Oczywiście najlepsze rozwiązanie to takie, w którym program automatycznie poprawia odmianę rzeczownika w podobnych sytuacjach.
2.Gdy chciałem samodzielnie poprawić odmianę rzeczownika opisaną wyżej, przeskakując na chwilę z okna LanguageTool do dokumentu, okno LanguageTool schowało się pod dokumentem i w żaden sposób nie dało się go przywrócić na wierzch. Musiałem zwinąć okno dokumentu, zamknąć okno LanguageTool, rozwinąć okno dokumentu i ponownie uruchomić LanguageTool. Dobrze by było, gdyby okno LanguageTool pozostawało cały czas na wierzchu, nawet jeśli jest nieaktywne. Tak, aby możliwe było swobodne przeskakiwanie między tym oknem a dokumentem. Innym rozwiązaniem mogłaby być możliwość bezpośredniej edycji błędnego fragmentu w oknie LanguageTool (wspomniane już okienko edytorskie).
3.LanguageTool uparcie chciał skasować przecinek w zdaniu zaczynającym się od: „Dodam tylko, że należy także rozważyć....” i wstawić go przed słówkiem „tylko”.
I na razie tyle moich uwag. Pozdrawiam.
1. Jest możliwość edycji: wystarczy kliknąć drugą podpowiedź, oznaczoną jako >inny tekst<.

2. Znany błąd. W następnej wersji będzie nieco lepiej, ale to jest też związane z jakąś małą usterką OpenOffice.org.

3. Niestety, w wypadkach dwuznacznych tak bywa; ważne, by nie było za częste. Nie sposób wykluczyć wszystkich dwuznaczności, choć może akurat da się znaleźć grupę czasowników, z którymi najczęściej używa się "tylko" (w funkcji podkreślenia czegoś itd.), wtedy można by to wyłączyć. Sprawdzę.

Dziękuję za komentarze i proszę o więcej :)
Anonimowy pisze…
Nie o taką edycję mi chodziło.
W tej chwili możliwe są dwa sposoby poprawiania tekstu: automatyczny (za pomocą przycisku „Zmień”) i ręczny (za pomocą opcji „>inny tekst<”). Ja miałem raczej na myśli kompilację tych dwóch sposobów. Najpierw błędny fragment poprawiłbym za pomocą przycisku „Zmień”, a potem – na poprawionym już fragmencie tekstu, uwidocznionym w oknie LanguageTool – dokonałbym korekty uzupełniającej (jeśli zachodzi taka potrzeba), np. zmiany formy rzeczownika, jak w przytoczonym wcześniej przykładzie. I dopiero wtedy przeszedłbym do następnego błędu. W tej chwili to jest niemożliwe, gdyż LanguageTool po wciśnięciu przycisku „Zmień”, natychmiast przeskakuje do kolejnego błędu. W mojej propozycji przejście do kolejnego błędu odbywałoby się za pomocą dodatkowego przycisku - „Następny”.
Wiem, że to trochę wydłuży proces sprawdzania tekstu, ale przecież jakość jest ważniejsza niż prędkość.

Poza tym zauważyłem jeszcze dwa uchybienia.

1.Czasami LanguageTool zatrzymując się na jakimś błędzie, ma problem z jego podświetleniem, a co za tym idzie – po skorygowaniu cała fraza wygląda dziwacznie. Znów podam przykład. Jeśli zdanie zaczyna się od słowa „odcinek”, pisanego małą literą, LanguageTool zauważy to, ale niekiedy przy podświetlaniu pomija pierwszą literę (czyli podświetlony zostanie tylko „dcinek”). Po wciśnięciu przycisku „Zmień”, poprawiony wyraz wygląda następująco: „oOdcinek”. A zatem przy kolejnych sprawdzaniach tekstu ten wyraz (początek zdania) znów będzie zaznaczony jako błędny, bo pisany małą literą.
2.Gdy dokument składa się z tekstu ciągłego, który potem przechodzi w tekst wypunktowany (tak jak niniejszy komentarz), LanguageTool przechodząc od błędu do błędu, po drodze samoczynnie chowa się pod oknem dokumentu. Prawdopodobnie ma w tym swój udział pojawiający się dodatkowy pasek narzędziowy „Wypunktowanie i numeracja”. LanguageTool znika pod dokumentem w chwili, gdy ten pasek się pojawia. Dodam tylko, że nie wykonywałem żadnych przeskoków kursorem pomiędzy oknem LanguageTool a dokumentem.

I to by było na razie na tyle, ale to pewnie jeszcze nie koniec. Pozdrawiam (tym razem mniej anonimowo) :)
Co do możliwości edycji tego rodzaju, to warto rzeczywiście wziąć to pod uwagę. Jednak obecnie programiści w OOo pracują nad interfejsem dla korektorów gramatycznych, który umożliwiałby wykorzystanie standardowych okien dialogowych OOo do sprawdzania, podkreślania tekstów kolorem zielonym itd. Dlatego też wprowadzanie tego w LanguageTool odrobinę mija się z celem - niedługo ta funkcja będzie dostępna, więc nie warto za dużo się nad tym męczyć (a zapewniam, że pojawiają się niebanalne problemy, jak choćby z tym znikaniem okna - to problem OOo, nie nasz). Tak więc wszystkie te problemy powinny z czasem zostać usunięte w ramach zwykłych funkcji OOo. Będziemy starali się ulepszyć nasz prototyp, ale ma on wady, wady prototypu właśnie...
Anonimowy pisze…
Hej, mnie się udało zainstalować wasz Language tool, ale nie udaje mi się uruchomić żadnej opcji z niego gdyż za każdym razem wyskakują mi takie błędy: java.lang.nullPointerException
Stacktrace:
de.danielnaber.languagetool.openoffice.ProgressDialog.(ProgressDialog.java:33)
de.danielnaber.languagetool.openoffice.Main$_Main.checkText(Main.java:302)
de.danielnaber.languagetool.openoffice.Main$_Main.trigger(Main.java:112)

Bardzo proszę o pomoc. Pozdrawiam
Przypuszczalnie niewłaściwa wersja Javy. LanguageTool działa tylko z wersją 1.5 i nowszymi.
Anonimowy pisze…
Niestety to nie to bo ja mam najnowszą wersję Javy 5 update 10.
Hm, a OpenOffice.org ją widzi? (Narzędzia > Opcje > OpenOffice.org >Java)

Bo ten błąd wskazywałby, że dzieje się coś dziwnego... Jaki system, jaka wersja OOo, która wersja LanguageTool?
Anonimowy pisze…
System Windows XP; openoffice.ux.pl 2.1.0;Java: J2SE Runtime Environnement 5.0 Update 10. Java jest widziana przez OOo, Language Tool 0.8.7, ale z wcześniejszymi mam ten sam problem. Dzięki za pomoc
Anonimowy pisze…
Co do OOo to przy tej org, działo się to samo
Polska wersja XP z ustawionym językiem polskim jako językiem systemu?
Anonimowy pisze…
tak
Przypuszczam, że inne programy w Javie (poza OOo) działają bez problemu? Np. wersja Web Start, którą można uruchomić kliknięciem w lewym panelu na tej stronie?

(Chcę wykluczyć prostsze hipotezy, potem będziemy szukali wyjaśnienia w kodzie programu).
Anonimowy pisze…
Jeśli chodzi o tą javę którą teraz mam, to wszystko jest ok. Jest tylko jedna rzecz w niej dziwna, mianowicie, nie da sie jej uruchomić za pomocą komendy "javaws" przez Start>Uruchom, tylko musze za kazdym razem pokazywać ścieżkę, ale ona jest normalnie zainstalowana w Program files, poza tym działa bez zarzutu
Anonimowy pisze…
dzisiaj zainstalowałem po raz pierwszy L/T - 0.9 jakież było moje rozczarowanie kiedy nagle O/O zamknął się i znikneła ikona szybkiego uruchamiania.
zmieniłem wersję z 2.2 org. na 2.2.1. ux. jednak błąd powtarza się dalej. O/O widzi jave w wersji 1.6.0.1 - jak temu zaradzić.
Jaki system operacyjny? Proszę poszukać na dysku pliku languagetool.log i napisać, co w nim jest. Tam powinna być jakaś wskazówka, co się dzieje złego.

Jeśli to WinXP, to ja testowałem identyczną konfigurację i LT działa, więc trudno mi powiedzieć, cóż mogłoby się psuć.

Popularne posty z tego bloga

Imiesłów przysłówkowy bez orzeczenia

W zdaniach z imiesłowami przysłówkowymi (-ąc i -wszy), zakończonych znakiem interpunkcyjnym, powinno występować orzeczenie. Dopuszczalne jest opuszczenie orzeczenia w tytule. W tytule nie stosuje się jednak kropek na końcu. Na przykład: Czekając na Godota Czekając na Godota, zabawiali się rozmową. Błąd ten jest tym bardziej rażący w zdaniach, w których występuje zdanie podrzędne: !Czekając na Godota, który nie przychodził. Usterka zostanie wykryta także w błędnie formułowanych pytaniach: !Rozmawiając o sporcie, który sport uprawiasz? W powyższym przykładzie podmiot imiesłowu jest inny od podmiotu pytania (my rozmawiamy, a sport uprawiasz tylko ty). Powinno być: Skoro już mowa o sporcie, którą dyscyplinę uprawiasz?

Gromadzimy błędy językowe

Tu zbieram błędy, które mają być wykrywane regułami. Część z tych błędów można dodać także do list autokorekty w Ooo (a nawet w programie MS Word). Warto pamiętać, że na liście muszą być tylko te błędy, których nie wykryje już korektor pisowni (a zatem błędne formy fleksyjne i proste błędy ortograficzne nie muszą być tutaj umieszczane). Zapraszam do komentowania i uzupełniania tej listy, na pewno nie jest wyczerpująca. Mówiąc krótko, to taki negatywny słownik języka polskiego ;) Nowomowa, ale nie błąd: wychodzić|wyjść * naprzeciw -> popierać *, iść na rękę * wprowadzić kogo w co -> zapoznać kogo z czym [fałszywe alarmy] w przypomnieniu -> przypominając [za dużo fałszywych alarmów] do wojny -> przed wojną [fałszywe alarmy, wiele poprawnych zwrotów] więcej chory -> coraz bardziej chory [rzadkie] widzieć się zmuszonym -> być zmuszonym w uzupełnieniu -> uzupełniając do roku -> przed upływem roku [za dużo fałszywych alarmów] trzymać wagę, firmę, mowę ś

Wikipedia history diff as a revision corpus

(As this is of interest not only to the Polish-speaking community, this post is in English.) Recently, after some discussions on the lingucomponent list at OpenOffice.org on the method of finding frequent typos, I did some experiments on the revision history logs. Background. The developers of grammar checkers, and autocorrect lists, have hard times with finding relevant corpora. Revision history is an excellent source about native speakers perception of linguistic norms. Frequently revised typos are perceived as errors that need to be corrected, so using these typos on autocorrect lists is justified. The same goes for style, grammar and usage errors. Method . Experiments involved three steps: Clean the history dump (??wiki-latest-pages-meta-history.xml), to get only relevant parts of the dump. Using XML tools isn't recommended (I tried XSLT, forget it). Using a simple awk script, I was able to clean the > 30GB dump in an hour or so, and got a >17 GB file. The script is simp