Przejdź do głównej zawartości

Dwa poziomy korekty stylistycznej

Tradycyjne korektory gramatyczne i stylistyczne operują na poziomie pojedynczego zdania (rzadziej: akapitu). Natomiast w polszczyźnie istnieją trzy rodzaje błędów występujących na poziomie nie tylko pojedynczych zdań, akapitów, ale nawet całego tekstu:
  1. powtórzenia wyrazów – błędem są powtórzenia tych samych sformułowań czy wyrazów w sąsiedztwie, ale też nasycenie takimi samymi środkami stylistycznymi całego tekstu jest niewłaściwe;
  2. rymy wewnątrz zdań i akapitów;
  3. za długie zdania, za długie akapity, za długie wyrazy (te też mogą być zbyt trudne do czytania).
Pierwszy rodzaj błędów można wychwycić przez analizę frekwencyjną pojedynczych wyrazów oraz n-tek wyrazów (zapewne najczęściej dwójek i trójek uporządkowanych). Innymi słowy, mogą tu zadziałać standardowe algorytmy wykrywania kolokacji. Jest to hipoteza do sprawdzenia; dokładniej – należałoby sprawdzić, czy zbyt częste powtórzenia jednostki n w małym fragmencie tekstu są widoczne na tle częstości innych jednostek. Zapewne są; test należałoby przeprowadzać, zmieniając stopniowo „okno”, czyli długość testowanego tekstu – od zdania, po zdania sąsiadujące, przez akapit, po cały tekst.

Drugi rodzaj błędów jest nieco niższego poziomu, bo nie liczą się rymy między tytułem a ostatnim wyrazem np. w książce o objętości 200 stron maszynopisu. Dla języka polskiego prawdopodobnie wystarczy sprawdzenie, czy pokrywają się końcówki wyrazów (pokrywanie należy sprawdzać przy użyciu odpowiednio zdefiniowanej relacji podobieństwa fonetycznego). Wstępnie wydaje mi się, że w grę wchodzi podobieństwo co najmniej czterech ostatnich głosek. Nie mogę znaleźć jednak żadnych bardziej formalnych prac na ten temat. Za wszelkie komentarze będę wdzięczny.

Trzeci rodzaj błędów jest wykrywany przez niektóre korektory, a nawet proste makra do Ooo.

Komentarze

Popularne posty z tego bloga

Imiesłów przysłówkowy bez orzeczenia

W zdaniach z imiesłowami przysłówkowymi (-ąc i -wszy), zakończonych znakiem interpunkcyjnym, powinno występować orzeczenie. Dopuszczalne jest opuszczenie orzeczenia w tytule. W tytule nie stosuje się jednak kropek na końcu. Na przykład: Czekając na Godota Czekając na Godota, zabawiali się rozmową. Błąd ten jest tym bardziej rażący w zdaniach, w których występuje zdanie podrzędne: !Czekając na Godota, który nie przychodził. Usterka zostanie wykryta także w błędnie formułowanych pytaniach: !Rozmawiając o sporcie, który sport uprawiasz? W powyższym przykładzie podmiot imiesłowu jest inny od podmiotu pytania (my rozmawiamy, a sport uprawiasz tylko ty). Powinno być: Skoro już mowa o sporcie, którą dyscyplinę uprawiasz?

Gromadzimy błędy językowe

Tu zbieram błędy, które mają być wykrywane regułami. Część z tych błędów można dodać także do list autokorekty w Ooo (a nawet w programie MS Word). Warto pamiętać, że na liście muszą być tylko te błędy, których nie wykryje już korektor pisowni (a zatem błędne formy fleksyjne i proste błędy ortograficzne nie muszą być tutaj umieszczane). Zapraszam do komentowania i uzupełniania tej listy, na pewno nie jest wyczerpująca. Mówiąc krótko, to taki negatywny słownik języka polskiego ;) Nowomowa, ale nie błąd: wychodzić|wyjść * naprzeciw -> popierać *, iść na rękę * wprowadzić kogo w co -> zapoznać kogo z czym [fałszywe alarmy] w przypomnieniu -> przypominając [za dużo fałszywych alarmów] do wojny -> przed wojną [fałszywe alarmy, wiele poprawnych zwrotów] więcej chory -> coraz bardziej chory [rzadkie] widzieć się zmuszonym -> być zmuszonym w uzupełnieniu -> uzupełniając do roku -> przed upływem roku [za dużo fałszywych alarmów] trzymać wagę, firmę, mowę ś...

Aktualizacja słownika ortograficznego w programie LanguageTool 5.8

Przygotowałem aktualizację słownika ortograficznego stosowanego w programie LanguageTool (będzie dostępna publicznie w nowym wydaniu, 5.8, planowanym na koniec czerwca). Słownik oparty jest przede wszystkim na słownikach dostępnych na sjp.pl , lecz usunąłem trochę mylących wpisów (np. niezalecaną formę „ grejfrut ”) i dodałem trochę funkcji (typu wyrazy pisane z łącznikiem), które są potrzebne. Zdumiało mnie, że poprzednia wersja słownika pochodziła z roku 2008. No cóż, ta zmiana się po prostu należała. W kolejce jest aktualizacja paczki słowników do LibreOffice/OpenOffice.