Morfologik to:
Za projektem stoją Marcin Miłkowski (słownik morfologiczny, reguły korekty gramatycznej) i Dawid Weiss (biblioteka Stempelator).
Parę słów więcej: słownik morfologiczny jest generowany ze słownika ortograficznego w formacie ispell - słownika alternatywnego, który jest pielęgnowany na stronie kurnik.pl. Wygenerowana wersja tekstowa oraz skrypty potrzebne do jej utworzenia (wraz z bazą danych, która zawiera konieczne przyporządkowania anotacji morfologicznych flagom ispella i końcówkom wyrazów) zostaną udostępnione wraz ze słownikiem w formacie FSA (który można obsługiwać za pomocą programów Jana Daciuka i biblioteką stempelator). Docelowo planujemy tworzenie conocnych wersji słownika morfologicznego – w miarę aktualizacji słownika ortograficznego.
Anotacje w słowniku morfologicznym są wzorowane na zbiorze znaczników korpusu IPI PAN (nie są jednak wierną ich kopią). Anotacje niektórych wyrazów w korpusie różnią się od anotacji w słowniku morfologicznym morfologik.
Na stronie będą się też znajdować reguły korektora gramatycznego – polskiego modułu programu LanguageTool. Marcin pracuje aktualnie nad modyfikacją DTD dla plików gramatyki LanguageTool. Prototypy reguł jednak działają świetnie i współpracują ze stempelatorem 1.0.1.
- słownik morfologiczny, który może służyć także do anotacji części mowy (tzw. POS tagger);
- biblioteki Lametyzatora do obsługi słownika morfologicznego;
- reguły korektora gramatycznego, który korzysta ze słownika morfologicznego.
Za projektem stoją Marcin Miłkowski (słownik morfologiczny, reguły korekty gramatycznej) i Dawid Weiss (biblioteka Stempelator).
Parę słów więcej: słownik morfologiczny jest generowany ze słownika ortograficznego w formacie ispell - słownika alternatywnego, który jest pielęgnowany na stronie kurnik.pl. Wygenerowana wersja tekstowa oraz skrypty potrzebne do jej utworzenia (wraz z bazą danych, która zawiera konieczne przyporządkowania anotacji morfologicznych flagom ispella i końcówkom wyrazów) zostaną udostępnione wraz ze słownikiem w formacie FSA (który można obsługiwać za pomocą programów Jana Daciuka i biblioteką stempelator). Docelowo planujemy tworzenie conocnych wersji słownika morfologicznego – w miarę aktualizacji słownika ortograficznego.
Anotacje w słowniku morfologicznym są wzorowane na zbiorze znaczników korpusu IPI PAN (nie są jednak wierną ich kopią). Anotacje niektórych wyrazów w korpusie różnią się od anotacji w słowniku morfologicznym morfologik.
Na stronie będą się też znajdować reguły korektora gramatycznego – polskiego modułu programu LanguageTool. Marcin pracuje aktualnie nad modyfikacją DTD dla plików gramatyki LanguageTool. Prototypy reguł jednak działają świetnie i współpracują ze stempelatorem 1.0.1.
Komentarze