31.12.08

Morfologik 1.5 na Nowy Rok

Ponieważ przygotowuję nową wersję LanguageTool (0.9.6) – z wieloma nowymi ciekawymi możliwościami – postanowiłem poprawić trochę słownik, bo jest mi potrzebny do poprawnego działania funkcji unifikacji (uzgadniania) atrybutów. Poprawiłem głównie rzeczowniki – przede wszystkim rodzaju męskiego. Większość z nich, poza rzadkimi nazwami własnymi, jest już prawidłowo przyporządkowana do kategorii rodzaju m1, m2 lub m3 (męskoosobowe, męskożywotne i męskonieżywotne – ujmując ten podział tradycyjnymi kategoriami). Poprawiłem też trochę systematycznych błędów, dodałem trochę form nieregularnych (np. odmianę imienia Pablo).

A o wersji 0.9.6 i unifikacji jeszcze napiszę :)

23.12.08

LT 0.9.5 a OpenOffice 3.0.1

Uwaga! Najnowsza wersja OpenOffice.org, 3.0.1 (dostępna obecnie w wersji testowej RC1), jest niezgodna z LanguageTool 0.9.5! Użytkownicy OpenOffice.org 3.0.0 przed zainstalowaniem nowej wersji OpenOffice powinni usunąć LanguageTool w Menedżerze Rozszerzeń. W przeciwnym razie po aktualizacji OpenOffice.org usunięcie niedziałającej wersji LT będzie niemożliwe bez pełnej deinstalacji OpenOffice.org i usunięcia jego wszystkich katalogów!

Wkrótce nowa wersja 0.9.6, która w pełni wykorzysta nowe możliwości OpenOffice.org :) Usunięto w niej też mnóstwo fałszywych alarmów i dodano sporo reguł.

13.12.08

Film: instalacja LT w OpenOffice.org

Tomasz Smykowski stworzył film instruktażowy o instalacji korektora LanguageTool w OpenOffice.org. Co prawda, wspomina o wersji 0.9.4, ale wszystkie instrukcje poza tym są aktualne :) Aha, okienko dialogowe LanguageTool niedługo zniknie (w wersji OOo 3.0.1), a jego funkcje przejmie po prostu okno Pisownia i gramatyka pakietu, w którym nie będzie niektórych denerwujących błędów. Ale to kwestia przyszłych wersji.



10.12.08

Morfologik 1.4

Wydałem dziś aktualizację słowników w projekcie Morfologik – okazało się, że sporo systematycznych błędów wkradło się do wersji 1.3, dlatego była pora na ich poprawienie (najzabawniejszą pomyłką było oznaczenie wyrazu „mężczyzna” jako mającego rodzaj żeński). Wykryłem je przy okazji implementowania mechanizmu unifikacji w programie LanguageTool.

Nowe słowniki wejdą do LanguageTool 0.9.6. Użytkownicy nie muszą nic aktualizować, ale programiści mogą sobie zajrzeć – zmienionych wyrazów jest sporo (plik diff ma kilka dobrych megabajtów).

6.11.08

LanguageTool 0.9.5

Znaleźliśmy niedawno błąd w LanguageTool 0.9.4, który niekiedy powodował poważne problemy przy sprawdzaniu tekstów angielskich z dużą ilością nadmiarowych spacji i tabulatorów. Dlatego przygotowaliśmy wydanie 0.9.5.

  • poprawione i nowe reguły dla języka angielskiego i polskiego;
  • poprawiony błąd w dzieleniu zdań kończących się skrótami (w języku polskim);
  • poprawiona obsługa znaku przypisu na końcu zdania.
Instalacja:

  • W programie OpenOffice.org 3.0 (od wersji m26)
    • Metoda prosta
      Dwukrotnie kliknij pobrany plik LanguageTool-0.9.5.oxt. Jeśli w systemie jest zarejestrowane rozszerzenie .oxt (robią to aktualne wersje OpenOffice.org), nastąpi uruchomienie instalatora.
    • Metoda tradycyjna
      Kliknij polecenie Narzędzia > Menedżer rozszerzeń > Dodaj, a następnie wybierz plik LanguageTool-0.9.4.oxt (bez rozpakowywania). Zamknij pakiet (łącznie z modułem szybkiego uruchamiania).
Po ponownym otwarciu OpenOffice.org będzie możliwe automatyczne sprawdzanie tekstu. Jako test wpisz zdanie: „To zdanie zdanie jest z błędem”.
  • Bez programu OpenOffice.org
    • Rozpakuj archiwum LanguageTool-0.9.5.oxt (jest to plik w formacie .zip) i uruchom plik LanguageToolGui.jar, klikając go dwukrotnie. Jeśli na danym komputerze nie skonfigurowano skojarzenia dla plików *.jar, uruchom program z wiersza poleceń za pomocą polecenia java -jar LanguageToolGUI.jar. Plik LanguageTool.jar jest natomiast korektorem działającym z poziomu wiersza poleceń.
    • Rozpakuj znajdujący się w archiwum plik standalone-libs.zip do tego samego katalogu, do którego rozpakowano pliki z archiwum.
W razie problemów
  1. Należy upewnić się, czy w systemie zainstalowana jest Java w wersji co najmniej 1.5.
  2. Ta wersja środowiska Java musi być widoczna dla OpenOffice.org (Narzędzia > Opcje > Java).
  3. Nazwa użytkownika w systemie Windows nie może zawierać polskich liter (błąd OpenOffice.org od wersji 2.3).

6.10.08

LanguageTool dostaje złotą nagrodę

W czerwcu spieszyliśmy się bardzo, aby zdążyć na konkurs Community Innovation Program ogłoszony przez Sun Micrososystems, gdzie suma nagród miała wynieść milion dolarów. Zgłosiliśmy we dwóch z Danielem Naberem LanguageTool i dwie jego nowe funkcje: integrację z OpenOffice.org 3.0 (tj. podkreślanie na bieżąco błędów wykrytych przez LT) oraz witrynę Community do poprawiania i testowania reguł przez społeczność użytkowników. Pierwszą rzecz robiłem ja, drugą - Daniel.
I udało się :) Dostaliśmy złotą nagrodę.

2.10.08

LanguageTool 0.9.4

Parę dni temu ukazała się najnowsza wersja LanguageTool, działająca wyłącznie w najnowszych wersjach OpenOffice.org 3.0 (zalecamy wersję co najmniej RC 3, w poprzednich występował poważny błąd w pakiecie).

Nowa wersja została wydana z powodu odnalezienia błędu, który mógł powodować zawieszenie pakietu OpenOffice.org. Obecnie używanie korektora LanguageTool nie grozi już ani zawieszeniem, ani awarią pakietu :)

  • nowe reguły dla języka rosyjskiego i szwedzkiego;
  • poprawiono drobne błędy.
Instalacja:

  • W programie OpenOffice.org 3.0 (od wersji m26)
    • Metoda prosta
      Dwukrotnie kliknij pobrany plik LanguageTool-0.9.4.oxt. Jeśli w systemie jest zarejestrowane rozszerzenie .oxt (robią to aktualne wersje OpenOffice.org), nastąpi uruchomienie instalatora.
    • Metoda tradycyjna
      Kliknij polecenie Narzędzia > Menedżer rozszerzeń > Dodaj, a następnie wybierz plik LanguageTool-0.9.4.oxt (bez rozpakowywania). Zamknij pakiet (łącznie z modułem szybkiego uruchamiania). Po ponownym otwarciu OpenOffice.org będzie możliwe automatyczne sprawdzanie tekstu. Jako test wpisz zdanie: „To zdanie zdanie jest z błędem”.
  • Bez programu OpenOffice.org
    • Rozpakuj archiwum LanguageTool-0.9.4.oxt (jest to plik w formacie .zip) i uruchom plik LanguageToolGui.jar, klikając go dwukrotnie. Jeśli na danym komputerze nie skonfigurowano skojarzenia dla plików *.jar, uruchom program z wiersza poleceń za pomocą polecenia java -jar LanguageToolGUI.jar. Plik LanguageTool.jar jest natomiast korektorem działającym z poziomu wiersza poleceń.
    • Rozpakuj znajdujący się w archiwum plik standalone-libs.zip do tego samego katalogu, do którego rozpakowano pliki z archiwum.
W razie problemów
  1. Należy upewnić się, czy w systemie zainstalowana jest Java w wersji co najmniej 1.5.
  2. Ta wersja środowiska Java musi być widoczna dla OpenOffice.org (Narzędzia > Opcje > Java).

23.9.08

Za chwilę dalszy ciąg programu

Niestety, okazało się właśnie, że w OpenOffice.org 3.0 jest błąd, który ujawnia się w obecności najnowszej wersji LanguageTool i powoduje awarię programu. Wystarczy usunąć wiersz lub połączyć dwa wiersze, aby się to stało.

Z tego względu radzimy poczekać na kolejną wersję OOo 3.0. Poprawka jest już gotowa i wejdzie do ostatecznej wersji pakietu, która niebawem zostanie udostępniona. Za chwilę dalszy ciąg programu ;)

7.8.08

LanguageTool 0.9.3

Dzisiaj ukazała się najnowsza wersja LanguageTool, działająca wyłącznie w najnowszych wersjach OpenOffice.org 3.0 (od kompilacji deweloperskiej m26, a więc nie we wcześniejszych wersjach beta!).

Nowością jest możliwość automatycznego sprawdzania błędów językowych w OpenOffice.org po zainstalowaniu korektora. Są one podkreślane na niebiesko.

  • około 100 nowych reguł dla języka polskiego (obecnie jest ich 819);
  • prawie 150 nowych reguł dla angielszczyzny (łącznie 383);
  • wprowadzono podstawy obsługi języka rosyjskiego i kilka reguł dla języka szwedzkiego;
  • poprawiono drobne błędy;
Instalacja:

  • W programie OpenOffice.org 3.0 (od wersji m26)
    • Metoda prosta
      Dwukrotnie kliknij pobrany plik LanguageTool-0.9.3.oxt. Jeśli w systemie jest zarejestrowane rozszerzenie .oxt (robią to aktualne wersje OpenOffice.org), nastąpi uruchomienie instalatora.
    • Metoda tradycyjna
      Kliknij polecenie Narzędzia > Menedżer rozszerzeń > Dodaj, a następnie wybierz plik LanguageTool-0.9.3.oxt (bez rozpakowywania). Zamknij pakiet (łącznie z modułem szybkiego uruchamiania). Po ponownym otwarciu OpenOffice.org będzie możliwe automatyczne sprawdzanie tekstu. Jako test wpisz zdanie: „To zdanie zdanie jest z błędem”.
  • Bez programu OpenOffice.org
    • Rozpakuj archiwum LanguageTool-0.9.3.oxt (jest to plik w formacie .zip) i uruchom plik LanguageToolGui.jar, klikając go dwukrotnie. Jeśli na danym komputerze nie skonfigurowano skojarzenia dla plików *.jar, uruchom program z wiersza poleceń za pomocą polecenia java -jar LanguageToolGUI.jar. Plik LanguageTool.jar jest natomiast korektorem działającym z poziomu wiersza poleceń.
    • Rozpakuj znajdujący się w archiwum plik standalone-libs.zip do tego samego katalogu, do którego rozpakowano pliki z archiwum.
W razie problemów
  1. Należy upewnić się, czy w systemie zainstalowana jest Java w wersji co najmniej 1.5.
  2. Ta wersja środowiska Java musi być widoczna dla OpenOffice.org (Narzędzia > Opcje > Java).
Reguły

Nowe reguły dla polszczyzny można obejrzeć tutaj.

Reguły wykrywania błędów w wersji 0.9.3

Łączna liczba reguł: 819
W tym z podpowiedziami: 751
Liczba widocznych typów reguł: 550

Błędy fonetyczne
(9)

Błędy frazeologiczne
(16)

Błędy interpunkcyjne
(33)

Błędy leksykalne
(111)

Błędy odmiany
(31)

Błędy ortograficzne
(155)

Błędy rodzaju gramatycznego
(5)

Błędy różne
(4)

Błędy składniowe
(52)

Błędy typograficzne
(4)

Błędy w szyku wyrazów
(4)

Pleonazmy
(39)

Prawdopodobne literówki
(68)

Wyrazy modne i nadużywane
(19)