Przejdź do głównej zawartości

Posty

Wyświetlanie postów z maj, 2007

LanguageTool 0.9

Pojawiła się nowa wersja LanguageTool. Zmiany liczne: więcej polskich reguł; większy zestaw reguł francuskich; lepsze podpowiedzi angielskie i polskie - wyrazy w podpowiedziach są odmieniane; możliwość podglądu plików reguł w przeglądarce internetowej; możliwość edycji plików reguł w edytorze XXE (w trybie niemalże WYSIWYG, a może raczej WYSYWIM - what you see is what you mean); dezambiguator regułowy (na razie tylko dla francuskiego); możliwość używania zmiennych w regułach XML; rozpoznawanie złożonych wyrazów niemieckich; zaczątki obsługi słoweńskiego. Uwaga: w OpenOffice.org 2.2 PL Menedżer pakietów nazywa się nazwę Menedżer rozszerzeń ). Instalacja: W programie OpenOffice.org 2.x Kliknij polecenie Narzędzia > Menedżer pakietów > Dodaj , a następnie wybierz plik LanguageTool-0.9.zip (bez rozpakowywania). Po otwarciu nowego okna edytora OpenOffice.org Writer (naciśnij klawisze Ctrl+N) w menu pojawi się nowe menu LanguageTool , które zawiera polecenie Sprawdź tekst ... służąc

Morfologik-stemming 1.1

Dawid postanowił uporządkować nieco kod Stempelatora i zmienić jego nazwę. Obecnie biblioteka nosi dumną nazwę „morfologik-stemming” i zawiera najnowszy słownik Morfologika (1.2). Dokonano zmian w API, wprowadzono specjalne pliki metadanych, charakteryzujące typy słowników. Jest też możliwość łatwiejszego użycia z wiersza polecenia. Wszystkie pliki dostępne na serwerach sourceforge, czyli tutaj .

Plany i aktualne prace

W aktualnie opracowywanej wersji LanguageTool (0.9) wprowadzamy wiele nowych możliwości. Jedną z najważniejszych – dla Polaków – będą lepsze podpowiedzi. Jeśli na przykład błędnie użyty zostanie jakiś czasownik w utartym zwrocie frazeologicznym, reguła może tworzyć podpowiedź zawierającą prawidłowy czasownik w odpowiedniej formie gramatycznej. Weźmy błędne zdanie: Pełni naprawdę istotną rolę w żegludze różnych typów statków Program obecnie podpowiada następujące poprawki: Pełni naprawdę istotną funkcję Odgrywa naprawdę istotną rolę I można dzięki temu szybko poprawić błędne zdanie. To samo dotyczy innych części mowy, co widać na stronie z listą wykrywanych przez reguły błędów , gdzie udokumentowałem większość podpowiedzi tworzonych przez reguły LanguageTool dla polszczyzny. Piszę „większość”, bo jest jeszcze garść reguł, nad którymi muszę popracować. Problem pojawia się bowiem w razie poprawki wymagającej zmiany przypadka. Gdy wiadomo, że chodzi o jeden rzeczownik, sprawa

Morfologik 1.2

Ponieważ eksperymenty ze słownikiem syntezy gramatycznej były utrudnione przez niechlujne znaczniki w wersji 1.1 słowników, wczoraj poświęciłem pół godziny na ujednolicenie ich. Przy okazji usunąłem wiele drobnych błędów, dodałem czasownik „iść” do słownika form nieregularnych oraz usunąłem znacznik „aglt”, którym błędnie oznaczana była forma trybu przypuszczającego. Obecnie tryb przypuszczający jest oznaczony znacznikiem „pot:praet” (pot od łacińskiego potentialis , a praet od praeteritum ). Liczba kombinacji znaczników zmniejszyła się przeto znacznie. Oczywiście, korzystałem z najnowszych wersji słownika ze strony Kurnika, że zarymuję na dobry dzionek ;) Pliki niebawem pojawią na sourceforge.net.

Morfologik 1.1

Opublikowałem kolejną wersję słownika morfologicznego. Nowości: ujednolicenie oznaczenia form finitywnych (znacznik „fin” zagubił się wcześniej przy wielu czasownikach); ujednolicenie oznaczenia potencjalnej negacji (zmiana z „pneg” na stosowany w tagsecie IPI znacznik „aff”), dodanie znacznika „pos” na oznaczenie stopnia równego przymiotników, poprawki dotyczące dopełniacza l. mn. wielu rzeczowników rodzaju męskiego (męskoosobowych i niemęskoosobowych), dodanie nietypowego znacznika „refl” dla czasowników zwrotnych, aktualizacja zgodnie z nową wersją słownika na stronie kurnik.pl/slownik. To jednak nie koniec nowości. Wśród słowników binarnych jest słownik syntezy gramatycznej, który potrafi generować wyrazy odmienione dla zadanej formy podstawowej i znacznika formy. W wypadku użycia w programie fsa_morph należy podać następujący ciąg na wejściu: wyraz|znacznik (np. „niemiecki|adjp”). Na wyjściu pojawi się forma przymiotnika niemiecki będąca przymiotnikiem poprzyimkowym, tj. „niemieck