21.10.06

Wykrywane błędy

Oto lista błędów, jakie wykrywa najnowsza wersja LanguageTool, 0.9 (listę wygenerowano i posortowano 20 maja 2007). Poniżej rodzaje błędów i przykłady z zaznaczonymi błędnymi fragmentami. W wypadku niektórych reguł podano proponowane poprawki (nie zawsze możliwe jest zasugerowanie poprawki, a niżej jest tylko wybór - w postaci rozwijanej, wystarczy kliknąć nazwę kategorii).
Liczba reguł: 569
W tym z podpowiedziami: 525

Błędy fonetyczne

Błędy frazeologiczne

Błędy interpunkcyjne

Błędy leksykalne

Błędy odmiany

Błędy ortograficzne

Błędy rodzaju gramatycznego

Błędy różne

Błędy składniowe

Błędy typograficzne

Błędy w szyku wyrazów

Pleonazmy

Prawdopodobne literówki

Wyrazy modne i nadużywane

11 komentarzy:

ts pisze...

Oprócz pełnej listy przydałaby się jeszcze informacja, co nowego w wersji 0.8.6 w stosunku do wersji 0.8.5.

Witia pisze...

W "mimo że" i podobnych zwrotach nie stawia się przecinków:
http://so.pwn.pl/zasady.php?id=629776

Morfologik pisze...

witia: to prawda, to właśnie mówi reguła 4. :)

Morfologik pisze...

ts - jak pokaże się nowa wersja, to będzie informacja, co nowego :) Na razie jest tylko w CVS.

Witia pisze...

Upps, myślałem, że 4 punkt sugeruje taką formę. Kajam się.

Anonimowy pisze...

Gratuluję projektu.
Testowałem regułę 30 z błędów składniowych.
Używać + Dopełniaćz

Program wprawdzie znajduję błąd w zdaniu
Używam książkę.

Reguła nie działa już w odmianach:
Używam dobrą książkę.
Używam tę książkę.
Długo tę książkę używam.

Reguła też nie działa dla rzeczowników rodzaju męskiego.
Np: Używam młotek.

Nie jestem całkiem pewny czy regułę w grammar.xml można jeszcze uzupełnić, czy też poprostu ten rodzaj korektury już osiągną swoją granicę.
Czyli czy można znaleźć błędy składniowe bez głebokiej analizy składniowej?
W tym przykładzie relatywnie proste grupowanie "chunking" może by już pomogło [dobrą ksiązkę]=Biernik.
Chociąż w polskim zawsze trzeba brać pod uwagę, że kolejność wyrazów w zdaniu jest prawie dowolna.
"Oni tej książki już długo używali."

Artur

Morfologik pisze...

Ta reguła da się ulepszyć. Prawdę mówiąc, początkowo też sądziłem, że sprawa jest raczej beznadziejnie skomplikowana, ale po sformalizowaniu kilku reguł interpunkcyjnych (w istocie znacznie bardziej złożonych, niż podają w książkach), jestem dobrej myśli.

Postaram się poprawić tę regułę i może już będzie w nowej wersji (na Nowy Rok pewnie będziemy mieli 0.8.7).

aku pisze...

Ciekawy projekt. Jednak zastanawia mnie dlaczego niby forma "kliknąć na" jest niepoprawna. Ten, kto to wymyślił chyba w życiu nie widział komputera ze środowiskiem windowsowatym. Nawet w języku angielskim (z którego ten zwrot jest wzięty) mówi się "click on sth." a nie "click in" czy "into". Jakiś Miodek się o tym wypowiadał czy co?

Morfologik pisze...

Nie Miodek, tylko terminolog firmy Microsoft. Radzę dokładniej przyjrzeć się pomocy w systemie Windows.

Wiem, bo sam jestem zawodowym tłumaczem informatyki (w tym kawałków systemu Windows), z dziesięcioletnim doświadczeniem i naprawdę się na tym znam. - Autor morfologika :)

Andrzej pisze...

Wykrywanie nie zawsze działa poprawnie. niektóre błędy są liczone podwójnie np:

Nie rozumiał tego właśnie że upadł na głowę.

W powyższym zdaniu narzędzie wykrywa 2 błędy:

1. Należy postawić przecinek w zależności od intonacji i sensu zdania: „tego właśnie, że” lub „tego, właśnie że.”

po kliknięciu "zmień" mamy:

Nie rozumiał tego właśnie, że upadł na głowę.

wtedy narzędzie pokazuje drugi błąd który już jest nieaktualny.

2. Przed spójnikiem „że” stawiamy przecinek: właśnie, że.

Nie byłby to może problem gdyby program nie ignorował pierwszej litery, bo obecnie zamienia "łaśnie że" na "właśnie, że" skutkiem czego pojawia się podwójne "w"

Nie rozumiał tego wwłaśnie, że upadł na głowę.

P.S.
przydałby się jakiś odnośnik do zgłaszania błędówf

Morfologik pisze...

Witam,

zrobię miejsce do zgłaszania błędów.

Do rzeczy:

1. Rzeczywiście, poprawianie tekstu powoduje zaburzenie działania LT. To zniknie jednak w momencie wyposażenia OOo w dodatkowe funkcje (zapewne jeszcze w połowie tego roku). Niespecjalnie to jest zależne od nas.

2. Co do podwójnego wykrywania, to zaraz to naprawię i nie będzie w następnej wersji.