16.7.06

Blogi i błędy

Zacząłem gromadzić korpus polszczyzny z blogów. Okazało się, że blogi nastolatków na onecie w istocie zawierają bardzo mało czystego tekstu (i ogromną liczbę błędów). Muszę więc zgromadzić tego więcej...
Klikając sobie w ustawieniach Bloggera odkryłem jednak perełkę: wyszukiwarkę w tekstach blogów (Google’a). Już nie trzeba wpisywać żadnych specjalnych i wymyślnych składniowo poleceń, wystarczy przejść pod odpowiedni adres.

4.7.06

Gromadzimy błędy językowe

Tu zbieram błędy, które mają być wykrywane regułami. Część z tych błędów można dodać także do list autokorekty w Ooo (a nawet w programie MS Word). Warto pamiętać, że na liście muszą być tylko te błędy, których nie wykryje już korektor pisowni (a zatem błędne formy fleksyjne i proste błędy ortograficzne nie muszą być tutaj umieszczane).

Zapraszam do komentowania i uzupełniania tej listy, na pewno nie jest wyczerpująca. Mówiąc krótko, to taki negatywny słownik języka polskiego ;)

 1. Nowomowa, ale nie błąd: wychodzić|wyjść * naprzeciw -> popierać *, iść na rękę *
 2. wprowadzić kogo w co -> zapoznać kogo z czym [fałszywe alarmy]
 3. w przypomnieniu -> przypominając [za dużo fałszywych alarmów]
 4. do wojny -> przed wojną [fałszywe alarmy, wiele poprawnych zwrotów]
 5. więcej chory -> coraz bardziej chory [rzadkie]
 6. widzieć się zmuszonym -> być zmuszonym
 7. w uzupełnieniu -> uzupełniając
 8. do roku -> przed upływem roku [za dużo fałszywych alarmów]
 9. trzymać wagę, firmę, mowę
 10. śledzić za -> śledzić coś
 11. szukać za, szukać coś -> szukać czegoś
 12. na czyjąś szkodę -> szkoda komuś, u kogo
 13. rozbijać się za -> rozbijać się o coś
 14. ręce precz od -> przez z rękami od...
 15. jak raz -> akurat, właśnie [setki fałszywych alarmów]
 16. raczej jak -> raczej niż [fałszywe alarmy]
 17. ostatnia przysługa -> ostatnia posługa [rzadkie]
 18. trudno mu przetłumaczyć -> trudno mu wytłumaczyć
 19. służyć przy wojsku -> w wojsku
 20. postulat o -> postulat czegoś
 21. poszukiwać za czym -> czego
 22. Zbyt oficjalne: podjąć kroki -> poczynić kroki
 23. po mojemu -> według mnie (częste)
 24. okryć w coś -> czymś [artefakt?]
 25. obowiązkowo -> koniecznie, bezwarunkowo
 26. po linii -> za pośrednictwem
 27. w pierwszej linii -> przede wszystkim [bardzo rzadkie jako błąd]
 28. liczyć za -> uważać za [dużo fałszywych alarmów]
 29. lamentować na co -> lamentować nad czymś [rzadkie]
 30. kolejka za + rzeczownik w narzędniku -> kolejka po co, do czego
 31. za jakie x dni -> za jakieś [odmienione "jakie"] x dni (rzadkie)
 32. jak słowo daję -> słowo daję (średnio częste)
 33. być na chorobie -> chorować (rzadkie)
 34. na bazie -> lepiej: na podstawie
 35. aż nie -> dopóki nie [fałszywe alarmy, np. czasem aż nie mogę...]
 36. pleonazm: dwie równe połowy (rzadkie)
 37. zrobić byk -> zrobić byka
 38. pod czyjś adres -> pod czyimś adresem
 39. bez ulicę -> przez ulicę (i podobne, bardzo rzadkie)
 40. wejście za biletami -> wyjście tylko z biletami (rzadkie)
 41. z Nowym Rokiem –> w Nowym Roku
 42. przed pół godziną -> przed pół godziny (rzadkie)
 43. około godzinę|miesiąc|tydzień|rok -> około godziny|miesiąca|tygodnia|roku
 44. około + rzeczownik|liczebnik w mianowniku -> około + dopełniacz
 45. cieszyć się złą|nie najlepszą sławą|opinią|marką -> mieć złą, nie najlepszą opinię, sławę; być owianym złą sławą
 46. ponieść zwycięstwo|sukces -> odnieść zwycięstwo, sukces (rzadkie)
 47. odnieść klęskę -> ponieść klęskę (rzadkie)
 48. błąd polegający na myleniu celownika l.mn. rzeczowników rodzaju żeńskiego z narzędnikiem (np. „dzięki uwagą” → „dzięki uwagom”, „wbrew regułą” → „wbrew regułom”, „wszystkim|szanownym|drogim panią” → „wszystkim paniom”); można go wykrywać przez sprawdzanie, czy zachodzi związek rządu między przyimkiem a rzeczownikiem („dzięki” wymaga celownika, a nie narzędnika), może: [cas!=inst] [orth=".*ą" & cas=inst & pos=subst] [pos=adj & cas=dat & number=pl] [cas!=dat] lub [pos=prep & case=dat] [pos=subst & case=inst & number=sg & orth=".*ą" & base=".*a"]
 49. jestem|jesteś piany → jestem|jesteś pijany (kilkaset trafień)
 50. na dziś|dzisiaj → do dzisiaj lub dziś
 51. (ależ|tak) jak najbardziej tak|OK → oczywiście, tak
 52. „niż” zamiast „zanim” („niż poszłam do pracy, zjadłam rogalik”), trudno wykryć
 53. „także” → więc, zatem (w zdaniach "Jestem chory, także nie przyjdę do ciebie")
 54. „państwo” + czasownik 3 os. l.poj. → zamiast państwo + czasownik l.mn. 3 os. (mylenie państwa=kraju z państwem=ludźmi)
 55. kości niezgody → kość niezgody [możliwość fałszywego alarmu]
 56. dokonać zdjęcie → wykonać zdjęcie
 57. hamulec dla x → hamulec x
 58. komitet|komisja dla x → komisja|komitet (do x|x)
 59. w porównaniu do → w porównaniu z
 60. reakcja wobec czegoś → reakcja na coś
 61. reakcja w stosunku do czegoś → reakcja na coś
 62. być na leczeniu → leczyć się
 63. autentykacja → uwierzytelnianie
 64. wraz nie → wciąż nie
 65. wybrać kim → wybrać na kogo (analogicznie do istniejącej zasady UZNAC_JAKIMS)
 66. analogiczny okres → ten sam okres
 67. artykułować, asortyment, aspekt, aura, generować, generacja, image, komfort, kompatybilny, kompleksowy, kreować, kreator, kreatywny, kultowy, lider, optować, transformować, trendy, topowy, destynacja, prezydencja... - wyrazy nadużywane
 68. by night, come back, defensor... - wyrażenia pretensjonalne
 69. kultywator tradycji → osoba kultywująca tradycję
 70. benefit → korzyść, profit
 71. wartość praktyczna → znaczenie praktyczne
 72. przegadane: tak szybko, jak to * możliwe → jak najszybciej
 73. wątpliwość do czego → wątpliwość co do czego
 74. autor bramki|gola → zdobywca bramki|gola
 75. autorka bramki|gola → zdobywczyni bramki|gola
 76. rzadki pleonazm: bajdurzyć bez sensu
 77. baza dla czego → baza czego
 78. pleonazm: usilnie|pokornie błagać → błagać
 79. Panie Tomek (imię w mianowniku) → Panie Tomku
 80. półtora + mianownik (r.m.) → półtora + dopełniacz
 81. półtorej + mianownik → półtorej + dopełniacz
 82. obcojęzyczne nazwy miast, które mają nazwy spolszczone (Aachen, Mainz itd.)
 83. Warszawiak|Gdańszczanin → warszawiak... (nazwy mieszkańców miast małą literą)
 84. był|jest|była|będzie... pełni + przymiotnik|imiesłów przym. → był w pełni
 85. prawie ponad + liczba | ponad prawie + liczba → ponad (pleonazm)
 86. obijać piłeczkę → odbijać piłeczkę
 87. ochrona|chronić przeciw czemu → przed czym
 88. mich → moich (konieczne wyszczególnienie kontekstów)
 89. pojąc → pojąć
 90. !(na|w) poprzek → w poprzek
 91. dla minie → dla mnie
Najbardziej aktualna lista błędów wykrywanych przez już sformalizowane reguły znajduje się tutaj.

Wykrywa korektor, więc wyrzucam: (zaczym -> zanim, niesposób -> nie sposób, tą razą - tym razem, podło ->podle (rzadkie chyba), odkrytka ->pocztówka, za wczasu -> zawczasu)
UWAGA. Niestety przy kolejnej edycji znikły komentarze, nie usuwałem ich umyślnie :(