27.11.07

Narzędzia korektorskie

W trakcie dyskusji nad nowymi możliwościami integracji LanguageTool z OpenOffice.org Matthias Bauer zaproponował, aby nieco zmienić terminologię. Do tej pory stosowano termin „korektor gramatyczny” lub „korektor gramatyki” (grammar checker), chociaż większość narzędzi tego rodzaju nie ogranicza się do samej gramatyki, wykrywając skomplikowane błędy ortograficzne widoczne tylko w kontekście; typowe literówki; błędy stylistyczne i usterki interpunkcyjne. Nowy termin lepiej oddaje istotę rzeczy – „narzędzie korektorskie” (proof reading tool).

LanguageTool ma ułatwiać korektę tekstów – nie tylko więc sprawdzanie gramatyki czy pisowni, choć takie funkcje mogą być w nim zintegrowane. Chodzi więc o automatyzację poprawiania najczęstszych, męczących i mechanicznie poprawianych błędów w trakcie korekty i redakcji językowej tekstu.

Obecnie mam za mało czasu, żeby dokończyć wprowadzanie kilku funkcji do LT, ale oprócz mnie działa kilka innych osób. Wiele wskazuje na to, że obsługa języka hiszpańskiego będzie w następnej wersji na całkiem niezłym poziomie :)

4.10.07

Fałszywi przyjaciele tłumacza

Ponieważ ostatnio wprowadzałem kilka zaległych zmian do LT (drobiazgi służące do większej swobody konfigurowania, np. wyłączania całych kategorii reguł), przyjrzałem się naszej, mało rozwijanej przeze mnie funkcji wykrywania tzw. fałszywych przyjaciół tłumacza (wyrazów zdradliwych, tautonimów). Dodałem szybko kilka pułapek polsko-angielskich i napisałem arkusz stylów, dzięki któremu można sobie obejrzeć alfabetyczną listę fałszywych przyjaciół w stylu słowniczka. Powinna ładnie wyglądać w większości najnowszych przeglądarek (Firefox, Opera, pewnie IE). W następnej wersji LT powinno być znacznie więcej fałszywych przyjaciół niż w poprzedniej.

Ale do czego to może służyć? Otóż ta funkcja ma dwa zastosowania. Pierwsze – to sprawdzanie tekstu pisanego przez osobę uczącą się np. angielskiego, której językiem ojczystym jest polski. Taka osoba będzie ostrzegana przy użyciu wyrazu pathetic, że ten wyraz jest zdradliwy dla Polaków. Użycie tej funkcji wymaga ustawienia języka polskiego jako rodzimego (Opcje > Język rodzimy).
Drugie – pomoc przy tłumaczeniu na polski. Wówczas ustawiamy język rodzimy np. na angielski – wtedy przy wyrazie „patetyczny” pojawi się podobne ostrzeżenie.

18.9.07

LanguageTool 0.9.1

Dzisiaj ukazała się najnowsza wersja LanguageTool, lepiej przystosowana do OpenOffice 2.3, które ukazało się również dziś :) Poza tym:

  • prawie sto reguł więcej dla języka polskiego (obecnie jest ich 660, było 569);
  • dodano trochę reguł dla angielszczyzny i niemczyzny (głównie z zakresu typowych literówek i błędów ortograficznych);
  • poprawione błędy i niedociągnięcia formalizmu reguł;
  • poprawiony błąd obsługi języka włoskiego;
  • dodano możliwość tworzenia reguł dla języków jeszcze nie obsługiwanych w LT.
Uwaga: od wersji 2.2 w OpenOffice.org Menedżer pakietów nazywa się Menedżer rozszerzeń.

Instalacja:

  • W programie OpenOffice.org 2.x
    • Kliknij polecenie Narzędzia > Menedżer pakietów > Dodaj, a następnie wybierz plik LanguageTool-0.9.1.zip (bez rozpakowywania). Po otwarciu nowego okna edytora OpenOffice.org Writer (naciśnij klawisze Ctrl+N) w menu pojawi się nowe menu LanguageTool, które zawiera polecenie Sprawdź tekst... służące do sprawdzania tekstu.
  • Bez programu OpenOffice.org
    • Rozpakuj archiwum LanguageTool-0.9.1.zip i uruchom plik LanguageToolGui.jar, klikając go dwukrotnie. Jeśli na danym komputerze nie skonfigurowano skojarzenia dla plików *.jar, uruchom program z wiersza poleceń za pomocą polecenia java -jar LanguageToolGUI.jar. Plik LanguageTool.jar jest natomiast korektorem działającym z poziomu wiersza poleceń.
    • Rozpakuj znajdujący się w archiwum plik standalone-libs.zip do tego samego katalogu, do którego rozpakowano pliki z archiwum.
W razie problemów
  1. Należy upewnić się, czy w systemie zainstalowana jest Java w wersji co najmniej 1.5.
  2. Ta wersja środowiska Java musi być widoczna dla OpenOffice.org (Narzędzia > Opcje > Java).
Reguły

Można obejrzeć reguły wdrożone w wersji 0.9.1.

Błędy wykrywane w wersji 2.4

Łączna liczba reguł: 1065
W tym z podpowiedziami: 958
Liczba widocznych typów reguł: 712

Błędy fonetyczne (9)

Błędy frazeologiczne (23)

Błędy interpunkcyjne (44)

Błędy leksykalne (122)

Błędy odmiany (36)

Błędy ortograficzne (177)

Błędy rodzaju gramatycznego (5)

Błędy różne (7)

Błędy składniowe (55)

Błędy typograficzne (21)

Błędy w szyku wyrazów (4)

Formatowanie liczb (3)

Pisownia małą i wielką literą (15)

Pleonazmy (46)

Prawdopodobne literówki (125)

Wyrazy modne i nadużywane (20)