Przejdź do głównej zawartości

Gromadzimy błędy językowe

Tu zbieram błędy, które mają być wykrywane regułami. Część z tych błędów można dodać także do list autokorekty w Ooo (a nawet w programie MS Word). Warto pamiętać, że na liście muszą być tylko te błędy, których nie wykryje już korektor pisowni (a zatem błędne formy fleksyjne i proste błędy ortograficzne nie muszą być tutaj umieszczane).

Zapraszam do komentowania i uzupełniania tej listy, na pewno nie jest wyczerpująca. Mówiąc krótko, to taki negatywny słownik języka polskiego ;)

  1. Nowomowa, ale nie błąd: wychodzić|wyjść * naprzeciw -> popierać *, iść na rękę *
  2. wprowadzić kogo w co -> zapoznać kogo z czym [fałszywe alarmy]
  3. w przypomnieniu -> przypominając [za dużo fałszywych alarmów]
  4. do wojny -> przed wojną [fałszywe alarmy, wiele poprawnych zwrotów]
  5. więcej chory -> coraz bardziej chory [rzadkie]
  6. widzieć się zmuszonym -> być zmuszonym
  7. w uzupełnieniu -> uzupełniając
  8. do roku -> przed upływem roku [za dużo fałszywych alarmów]
  9. trzymać wagę, firmę, mowę
  10. śledzić za -> śledzić coś
  11. szukać za, szukać coś -> szukać czegoś
  12. na czyjąś szkodę -> szkoda komuś, u kogo
  13. rozbijać się za -> rozbijać się o coś
  14. ręce precz od -> przez z rękami od...
  15. jak raz -> akurat, właśnie [setki fałszywych alarmów]
  16. raczej jak -> raczej niż [fałszywe alarmy]
  17. ostatnia przysługa -> ostatnia posługa [rzadkie]
  18. trudno mu przetłumaczyć -> trudno mu wytłumaczyć
  19. służyć przy wojsku -> w wojsku
  20. postulat o -> postulat czegoś
  21. poszukiwać za czym -> czego
  22. Zbyt oficjalne: podjąć kroki -> poczynić kroki
  23. po mojemu -> według mnie (częste)
  24. okryć w coś -> czymś [artefakt?]
  25. obowiązkowo -> koniecznie, bezwarunkowo
  26. po linii -> za pośrednictwem
  27. w pierwszej linii -> przede wszystkim [bardzo rzadkie jako błąd]
  28. liczyć za -> uważać za [dużo fałszywych alarmów]
  29. lamentować na co -> lamentować nad czymś [rzadkie]
  30. kolejka za + rzeczownik w narzędniku -> kolejka po co, do czego
  31. za jakie x dni -> za jakieś [odmienione "jakie"] x dni (rzadkie)
  32. jak słowo daję -> słowo daję (średnio częste)
  33. być na chorobie -> chorować (rzadkie)
  34. na bazie -> lepiej: na podstawie
  35. aż nie -> dopóki nie [fałszywe alarmy, np. czasem aż nie mogę...]
  36. pleonazm: dwie równe połowy (rzadkie)
  37. zrobić byk -> zrobić byka
  38. pod czyjś adres -> pod czyimś adresem
  39. bez ulicę -> przez ulicę (i podobne, bardzo rzadkie)
  40. wejście za biletami -> wyjście tylko z biletami (rzadkie)
  41. z Nowym Rokiem –> w Nowym Roku
  42. przed pół godziną -> przed pół godziny (rzadkie)
  43. około godzinę|miesiąc|tydzień|rok -> około godziny|miesiąca|tygodnia|roku
  44. około + rzeczownik|liczebnik w mianowniku -> około + dopełniacz
  45. cieszyć się złą|nie najlepszą sławą|opinią|marką -> mieć złą, nie najlepszą opinię, sławę; być owianym złą sławą
  46. ponieść zwycięstwo|sukces -> odnieść zwycięstwo, sukces (rzadkie)
  47. odnieść klęskę -> ponieść klęskę (rzadkie)
  48. błąd polegający na myleniu celownika l.mn. rzeczowników rodzaju żeńskiego z narzędnikiem (np. „dzięki uwagą” → „dzięki uwagom”, „wbrew regułą” → „wbrew regułom”, „wszystkim|szanownym|drogim panią” → „wszystkim paniom”); można go wykrywać przez sprawdzanie, czy zachodzi związek rządu między przyimkiem a rzeczownikiem („dzięki” wymaga celownika, a nie narzędnika), może: [cas!=inst] [orth=".*ą" & cas=inst & pos=subst] [pos=adj & cas=dat & number=pl] [cas!=dat] lub [pos=prep & case=dat] [pos=subst & case=inst & number=sg & orth=".*ą" & base=".*a"]
  49. jestem|jesteś piany → jestem|jesteś pijany (kilkaset trafień)
  50. na dziś|dzisiaj → do dzisiaj lub dziś
  51. (ależ|tak) jak najbardziej tak|OK → oczywiście, tak
  52. „niż” zamiast „zanim” („niż poszłam do pracy, zjadłam rogalik”), trudno wykryć
  53. „także” → więc, zatem (w zdaniach "Jestem chory, także nie przyjdę do ciebie")
  54. „państwo” + czasownik 3 os. l.poj. → zamiast państwo + czasownik l.mn. 3 os. (mylenie państwa=kraju z państwem=ludźmi)
  55. kości niezgody → kość niezgody [możliwość fałszywego alarmu]
  56. dokonać zdjęcie → wykonać zdjęcie
  57. hamulec dla x → hamulec x
  58. komitet|komisja dla x → komisja|komitet (do x|x)
  59. w porównaniu do → w porównaniu z
  60. reakcja wobec czegoś → reakcja na coś
  61. reakcja w stosunku do czegoś → reakcja na coś
  62. być na leczeniu → leczyć się
  63. autentykacja → uwierzytelnianie
  64. wraz nie → wciąż nie
  65. wybrać kim → wybrać na kogo (analogicznie do istniejącej zasady UZNAC_JAKIMS)
  66. analogiczny okres → ten sam okres
  67. artykułować, asortyment, aspekt, aura, generować, generacja, image, komfort, kompatybilny, kompleksowy, kreować, kreator, kreatywny, kultowy, lider, optować, transformować, trendy, topowy, destynacja, prezydencja... - wyrazy nadużywane
  68. by night, come back, defensor... - wyrażenia pretensjonalne
  69. kultywator tradycji → osoba kultywująca tradycję
  70. benefit → korzyść, profit
  71. wartość praktyczna → znaczenie praktyczne
  72. przegadane: tak szybko, jak to * możliwe → jak najszybciej
  73. wątpliwość do czego → wątpliwość co do czego
  74. autor bramki|gola → zdobywca bramki|gola
  75. autorka bramki|gola → zdobywczyni bramki|gola
  76. rzadki pleonazm: bajdurzyć bez sensu
  77. baza dla czego → baza czego
  78. pleonazm: usilnie|pokornie błagać → błagać
  79. Panie Tomek (imię w mianowniku) → Panie Tomku
  80. półtora + mianownik (r.m.) → półtora + dopełniacz
  81. półtorej + mianownik → półtorej + dopełniacz
  82. obcojęzyczne nazwy miast, które mają nazwy spolszczone (Aachen, Mainz itd.)
  83. Warszawiak|Gdańszczanin → warszawiak... (nazwy mieszkańców miast małą literą)
  84. był|jest|była|będzie... pełni + przymiotnik|imiesłów przym. → był w pełni
  85. prawie ponad + liczba | ponad prawie + liczba → ponad (pleonazm)
  86. obijać piłeczkę → odbijać piłeczkę
  87. ochrona|chronić przeciw czemu → przed czym
  88. mich → moich (konieczne wyszczególnienie kontekstów)
  89. pojąc → pojąć
  90. !(na|w) poprzek → w poprzek
  91. dla minie → dla mnie
Najbardziej aktualna lista błędów wykrywanych przez już sformalizowane reguły znajduje się tutaj.

Wykrywa korektor, więc wyrzucam: (zaczym -> zanim, niesposób -> nie sposób, tą razą - tym razem, podło ->podle (rzadkie chyba), odkrytka ->pocztówka, za wczasu -> zawczasu)
UWAGA. Niestety przy kolejnej edycji znikły komentarze, nie usuwałem ich umyślnie :(

Komentarze

Anonimowy pisze…
Podobne do "pomarańcz": "rodzynka". Jak mi się coś jeszcze przypomni, to nie omieszkam zgłosić.
Obawiam się, że akurat „rodzynka” jest wyrazem zupełnie poprawnym, zob.:

http://sjp.pwn.pl/haslo.php?id=53584
Anonimowy pisze…
Co prawda błąd ten najczęściej występuje w niechlujnej mowie, niemniej jednak spotkałem się także z przenoszeniem go do formy pisemnej. Chodzi mianowicie o nieodmienianie jednostek miary, czyli np.: 15 amper (zamiast 15 amperów), 15 wolt (zamiast 15 woltów) itd. Tak samo jest z resztą w przypadku polskiego złotego - słyszy się (i czasem czyta), że coś kosztuje 15 złoty, zamiast 15 złotych.

Kolejny błąd jaki przychodzi mi do głowy, to dodawanie końcówek fleksyjnych przy odmianie liczebników porządkowych - czyli takie potworki jak: 3-ci, 5-ego, 5-tego itp.
Co do pierwszego, to już jest to błąd nr 157, ale dodam "wolt" i "złoty". Drugi zaś to błąd 228. :)
Anonimowy pisze…
Od siebie dorzucę jeszcze nieprawidłową odmianę wyrazu 'ta' (często słyszy się 'tą książkę' zamiast 'tę książkę').

Nie jestem pewien czy irytującą mnie kalkę językową można zaliczyć do błędów, byłoby miło gdyby program ostrzegał przed używaniem "dokładnie" i podpowiadał nasze rodzime "właśnie".
Jasne, już dopisałem, są to błędy tak ewidentne, że myślałem, iż mam je na liście ;)
Anonimowy pisze…
Kolejny błąd: odnieść klęskę zamiast ponieść klęskę.
Anonimowy pisze…
dwutysięczny piąty, dwutysięczny szósty itd. Mówi się oczywiście: dwa tysiące piąty, dwa tysiące szósty...
Anonimowy pisze…
Czy jest możliwe kontekstowe odróżnienie słów "cyfra" i "liczba"? Na przykład w układzie dziesiętnym cyfr jest tylko dziesięć (od 0 do 9) i są to znaki graficzne składające się na liczby. Tymczasem bardzo często ludzie mówią i piszą o "cyfrach", w rzeczywistości mając na myśli liczby, czyli wyrażenia opisujące "ile czegoś jest".
Dla utrudnienia, np. "1" może być cyfrą (jedynka) ale też liczbą (jeżeli opisuje, że czegoś jest "jedna sztuka").
hm, pewnie jest możliwe, ale trzeba będzie poszukać w korpusach... np. "wielka cyfra" odnosi się prawie zawsze naprawdę do cyfr.
Anonimowy pisze…
A czy dałoby się łatwo wyłapać błąd polegający na użyciu słowa 'bynajmniej' w znaczniu 'przynajmniej'? Po przejrzeniu kilkudziesięciu pierwszych wyników z blog.onet.pl szacuję, że takich błędnych użyć może być kilkanaście procent.
- A może poprawnie użytemu 'bynajmniej' zawsze towarzyszy partykuła 'nie'?
- Bynajmniej.
Anonimowy pisze…
Pomarańcz jako nazwa koloru to nie błąd:
http://slowniki.pwn.pl/poradnia/lista.php?id=7343
Anonimowy pisze…
z wielkiej|dużej|małej litery –> wielką|małą|dużą literą
Może jeszcze być od wielkiej (małej) litery. Nie wiem, skąd zaczerpnięto tu (w Morfologiku) dużą literą:
http://slowniki.pwn.pl/poradnia/lista.php?id=7420
Anonimowy pisze…
Superczęstym błędem jest używanie jakiś zamiast jakichś, np.:
Nie widziałeś tam jakiś dziewczyn?
Pozdrawiam, na gościnnych występach.
Co do „dużą literą”, proszę bardzo, „Słownik poprawnej polszczyzny” PWN, cytuję:

litera [wym. litera, nie: lytera] ż IV, lm D. liter Pisać coś małą literą a. od małej (nie: z małej) litery zaczynać pisać wyraz małą literą Pisać coś dużą, wielką literą a. od dużej, od wielkiej (nie: z dużej, nie: z wielkiej) litery zaczynać pisać wyraz dużą literą


Co się zaś tyczy „pomarańczu”, to znam empiryczne nastawienie szefa redakcji słowników PWN (i je podzielam), aczkolwiek reguły zamieszczane w korektorze są nieco konserwatywne: lepiej stosować formy nieco bardziej wyśrubowane, aby nie narażać się na niepotrzebne dyskusje z purystami. Myślę, że wprowadzę do LanguageTool różnicowanie norm: styl oficjalny, styl bardzo staranny, styl potoczny (tu wyłączone będą niektóre normy stylu starannego).
Koalarze, błąd rzeczywiście wyśmienity. Dodam :)

Pozdrawiam,
MM
Anonimowy pisze…
Na blog.onet.pl 1440 razy jest "doczynienia" zamiast "do czynienia".
"Doczynienia" jest wykrywane przez standardowy korektor. Tak więc w tym wypadku dodatkowa reguła jest niepotrzebna.
Anonimowy pisze…
"ad. " + liczba - powinno być bez kropki

oraz Aachen zamiast Akwizgran itd.
Anonimowy pisze…
Taki byk:
te dziecko, tamte dziecko, jedne dziecko
W sumie nie taki superczęsty błąd, ale zgłaszam, bo usłyszałem z ust Mielcarskiego "jedne podanie" podczas transmisji meczu Polska-Serbia, więc trzeba działać, pomyślałem ;)
Pozdrawiam
Trafne, ale już jest :P

Numer 170 wśród niezakodowanych jeszcze.
Anonimowy pisze…
Ja zdębiałem, kiedy usłyszałem z głośnika zapowiedź spikera Rozgłośni Centralnej Polskiego Radia: A teraz usłyszymu suitę z opery "Miłość do trzech pomarańcz".
Niedawno sprawdziłem, można to spotkać w programach instytucji muzycznych:
http://www.muzykologia.uj.edu.pl/biblioteka/Kurs419/Strony_muzyczne/Fitelberg/aktualnosci.html
Zdębienie niesłuszne, bo "pomarańcz" jest poprawną formą dopełniacza liczby mnogiej. Jest niepoprawne jako mianownik (gdy na myśli mamy owoc cytrusowy).
Anonimowy pisze…
W każdym bądź razie -> kontaminacja 'w każdym razie' z 'bądź co bądź'
Już jest, wyżej są tylko niewykrywane błędy, proszę spojrzeć na listę "wykrywane błędy" :)
Anonimowy pisze…
"po porostu" i inne kombinacje z "porostu" zamiast "po prostu"
"wyjechać zagranicę" → wyjechać za granicę
"zagranicę Polski", "zagranice kraju" → za granicę Polski
"być zagranicą" → być za granicą
odrabiać starty → odrabiać straty
wielkie, kolosalne, poważne, przynoszące starty → \1 straty
do starty → do straty
Anonimowy pisze…
po kątem -> pod kątem
Anonimowy pisze…
czasowniki zwrotne w zdaniu bez "się".
Anonimowy pisze…
"Sposób zamocowania" zamiast "rodzaj zamocowania" (rodzaj mechanizmu mocującego).
Anonimowy pisze…
Proszę dodać "my z Jankiem", kiedy wypowiadane w znaczeniu "ja i Janek".
JSz.
Hong Kong - > Hongkong
Anonimowy pisze…
zapas prowiantu - > prowiant
Anonimowy pisze…
zwycięstwo z -> zwycięstwo nad
Anonimowy pisze…
niskie zwycięstwo -> niewielkie zwycięstwo
Anonimowy pisze…
Pleonazmy:

cofać wstecz -> cofać
cofać do tyłu -> cofać
cofać w tył -> cofać

kontynuować dalej - > kontynuować
Anonimowy pisze…
wolny wakat - wakat
wolny vacat - vacat

(cyt. z Leppera)
Anonimowy pisze…
plus dodatni -> plus

(cyt. z Wałęsy)
Anonimowy pisze…
zażymać się -> zżymać się
komentarz do pleonazmów:

1. „kontynuować dalej” już od dawna jest wykrywane;

2. „plus dodatni” używa się chyba tylko ironicznie, więc nie ma co tego poprawiać;

3. resztę dopiszę.

Co do „zwycięstwo z” - to skąd ta norma? W słowniku poprawnej polszczyzny PWN jej nie widzę...
aha, cofać się do tyłu też jest (http://morfologik.blogspot.com/2006/10/wykrywane-bdy.html, sekcja „Pleonazmy”)
Anonimowy pisze…
@Marcin Miłkowski

"Cofać" powtórzyłem, bo była tylko forma zwrotna i bez wszystkich wariantów (np. bez "wstecz").

"Kontynuować" - przeoczyłem.

"Zwycięstwo z" - w moim "Słowniku poprawnej polszczyzny PWN" (wyd. osiemnaste, Warszawa 1996) nie występuje ten wariant. Słownik zaleca tylko formę z "nad". Ta forma występuje najczęściej w literaturze.
Formę z "z" można z kolei usłyszeć w języku potocznym i coraz częściej w żargonie dziennikarskim. Nie jestem pewien, czy już upowszechniła się na tyle, by mogła na równych prawach funkcjonować w języku pisanym.

A może po prostu mam już stary słownik? Nie kupowałem nowszych wydań, bo to pamiątka jeszcze z czasów szkolnych.

Pozdrawiam :-)

PS. Jeśli mógłbym jakoś pomóc w pracach nad tym użytecznym narzędziem, proszę o kontakt przez maila.
Anonimowy pisze…
dać za wygranę/ wygrane -> dać za wygraną

w poważnej/wysokiej mierze -> w dużej mierze
Anonimowy pisze…
wychwyt -> wychwytywanie
Anonimowy pisze…
motyw/temat wiodący/przodujący -> motyw/temat przewodni

Proszę zwrócić uwagę na przykład 7 w sekcji: "Wyrazy modne i nadużywane".
to jest wykrywane i nawet sugestia jest poprawna; uwaga: jeszcze nie wszystkie sugestie są udokumentowane na stronie "wykrywane błędy"
Anonimowy pisze…
bardzo warto -> warto
na pewno "bardzo warto" to błąd?
Anonimowy pisze…
"Bardzo warto" brzmi nieco sztucznie. Nie przypominam sobie, bym spotkał połączenie tych wyrazów w jakimś autorytatywnym źródle. Analiza znaczeniowa słowa "warto" nie daje jednoznacznej odpowiedzi, ale skłania do ostrożności w łączeniu tych dwóch wyrazów. Warto skonsultować problem z językoznawcą, lub dobrym słownikiem :-)
Anonimowy pisze…
wartać -> być wartym;
wartałoby, wartowałoby, warto by -> warto by było;
bez rękawa, bez rękaw -> bez rękawów;
kibic sportowy -> kibic;
protokół z zaliczenia/ zebrania -> protokół zaliczenia/zebrania;
taniej/drożej płacić -> mniej/więcej płacić (podobne zwroty są już częściowo wykrywane);
każden -> każdy (błąd jest wykrywany przez narzędzie sprawdzania pisowni OpenOffice, jednak nie sugeruje ono prawidłowej formy);
przyprzeć kogoś do ściany -> przyprzeć kogoś do muru;
patrzeć na telewizję -> oglądać telewizję/oglądać coś w telewizji;
oglądać telewizor -> oglądać telewizję (oczywiście, oglądanie telewizora np. w sklepie przed zakupem jest poprawne, a nawet wskazane :-);
czerwo -> czerwień (kolor karciany);
oglądnąć -> obejrzeć (regionalizm);
ściślej mówiąc/biorąc -> ściśle mówiąc/biorąc.
dziękuję, niezła lista, będę wprowadzał powolutku
Co do "kibic sportowy", to jednak może istnieć kibic, który ogląda grę w karty (hazardową) lub kibicuje komuś w jakiejś innej niesportowej grze. Ergo: to nie jest raczej pleonazm (przykłady są w słowniku Doroszewskiego).

Co do "ściślej mówiąc", to chyba można tak poprzedzić wypowiedź precyzująca... A regionalizmy (np. "oglądnąć") nie są błędami i nie należy ich potępiać.
Anonimowy pisze…
Przepraszam, że dopiero teraz ustosunkowuję się do Pana uwag. Nie zaglądałem tu jakiś czas i nie widziałem tego komentarza.

"Kibic sportowy" oczywiście może być wyrażeniem poprawnym, choć chyba częściej występuje jako pleonazm (zwłaszcza w języku mówionym).

Poprawność wyrażenia "ściślej mówiąc/biorąc" jest kwestionowana w "Słowniku poprawnej polszczyzny PWN" (wyd. osiemnaste, Warszawa 1996).

Słownik ten potępia również zwrot "w rzeczy samej/w samej rzeczy", wskazując, że "rzeczywiście",bądź "istotnie" byłoby w tym przypadku zgrabniejsze stylistycznie. Zastrzeżenie do "ściślej mówiąc" ma, jak sądzę, również stylistyczny charakter.

Regionalizmów NIE potępiam, wręcz przeciwnie - czasem ich nawet używam.
Wykazując je jako błędy, myślałem, że zamiarem twórców LanguageTool jest stworzenie narzędzia korygującego pisownię na podstawie tzw. ogólnopolskiego wzorca języka. Zgodnie z tym kryterium użycie regionalizmów w pewnych kontekstach można by uznać za błąd stylistyczny.

Argumentem przemawiającym za umieszczeniem tu regionalizmów jest też fakt, że występują one częściej w języku mówionym. Większość osób używających regionalizmów w tekstach przeważnie świadomie z nich rezygnuje, zastępując je wariantem ogólnopolskim. A przecież LanguageTool przeznaczone jest do pracy ze słowem pisanym. Notabene, argument ten podważa zasadność umieszczenia w spisie błędów "kibica sportowego" (przyczyny objaśniam powyżej).

Uzupełniając zaś listę błędów, chciałbym dodać wyrażenie, które w moim przekonaniu jest pleonazmem: "sam osobiście". Proszę rozważyć zasadność umieszczenia go na liście wykrywanych błędów.

Pozdrawiam

PS. Sądzę, że nie do końca przemyślał Pan wczorajszy wpis na blogu.

Dobrej nocy
Co do potępiania "w rzeczy samej", to w jakimś nowszym wydaniu (czy bodaj w Poradni PWN) wycofano się z tego, bo okazało się, że uzasadnienie - pozorny rusycyzm - było kiepskie.

Tak, "sam osobiście" to ewidentny błąd.

Co do wczorajszego wpisu, to akurat zabawnie się składa, że krakowską komisją egzaminacyjną kieruje Legutko. Maciej Legutko :) Zabawna zbieżność, bo trafiłem na drugiego krakowskiego Legutkę w dniu, gdy pierwszy został ministrem.
A co do regionalizmów, to na razie takich rzeczy nie wprowadzam z takiej racji, iż możliwość domyślnego wyłączania niektórych reguł (czy też ustawiania ich czułości) jest obecnie w LT niespecjalnie wielka :( Tzn. po prostu byłoby zbyt wiele fałszywych alarmów, a potępianie regionalizmów jest potępiane przez większość językoznawców :) W tekście urzędowym rażą, ale w wielu innych rejestrach językowych są zdecydowanie na miejscu. A na razie w LT rejestru ustawić nie można :(

Ale pewnie za jakiś czas taka możliwość się pojawi. I wtedy rzeczywiście trzeba będzie dodać trochę takich wyrażeń.
Anonimowy pisze…
Małe sprostowanie: krakowską OKE kieruje Marek Legutko, nie Maciej :-) Uważam jednak, że ostatnie zdanie tego komentarza niewiele wnosi dla wyjaśnienia trudności językowych, a może rodzić wątpliwości co do intencji piszącego.



Pozdrawiam z okazji święta niezwyciężonej armii Najjaśniejszej Rzeczypospolitej!
Anonimowy pisze…
Dzień dobry,

w związku z systematycznym rozwojem projektu Morfologik (LanguageTool), chciałbym zaproponować pewne drobne zmiany w wyglądzie i funkcjonowaniu wortalu.

Stale powiększająca się liczba wykrywanych błędów i związanych z nimi reguł sprawia, że dla części internautów witryna Morfologik stała się miejscem, gdzie mogą znaleźć odpowiedź na wiele nurtujących ich wątpliwości językowych.

Aby ułatwić korzystanie z serwisu, proponuję wyposażyć dział: "Wykrywane błędy" w zaawansowaną wyszukiwarkę, choćby podobną do tej znanej ze strony: synonimy.ux.pl.

Druga moja propozycja może okazać się pomocna również dla Pana w codziennej pracy nad udoskonalaniem LanguageTool. Chodzi mianowicie o utworzenie odrębnej zakładki z odnośnikami do internetowych poradni językowych. Należałoby wyodrębnić z zakładki "Odnośniki" znajdujące się tam odsyłacze do:

- Poradni Językowej Insytutu Filologii Polskiej UWr;

- witryny: "Obcy język polski";

- strony z felietonami Prof. Jana Miodka

oraz słownika błędów z Allegro.

Zestaw ten można wzbogacić o następujące odnośniki:

- Zasady pisowni i interpunkcji polskiej w opracowaniu Prof. Edwarda Polańskiego dla "Wielkiego Słownika Ortograficznego PWN":
http://so.pwn.pl/zasady.php

- Poradnia Językowa Wydawnictwa Naukowego PWN:
http://poradnia.pwn.pl/

- Poradnia Językowa Wydziału Polonistyki UJ:
http://poradnia.polonistyka.uj.edu.pl/

- Poradnia Językowa Instytutu Języka Polskiego Uniwersytetu Śląskiego:
http://www.poradniajezykowa.us.edu.pl/

- Poradnia Językowa Zakładu Etnolingwistyki Instytutu Polonistyki i Kulturoznawstwa Uniwersytetu Szczecińskiego:
http://www.us.szc.pl/e/?xml=load_page&st=9740

- Poradnik językowy Prof. Mariana Bugajskiego
(kierownik Zakładu Komunikacji Językowej Uniwersytetu Zielonogórskiego):
http://www.zachod.pl/questions

- Opinie i porady językowe Rady Języka Polskiego:
http://www.rjp.pl/?mod=oip&type=inne

- Uchwały ortograficzne Rady Języka Polskiego:
http://www.rjp.pl/?mod=uchwaly

- Poradnia językowa Agape:
http://www.agape.com.pl/poradnia/poradnia2.html

- Lekarski poradnik językowy:
http://www.bibl.amwaw.edu.pl/Lpj/index.html

- Poradnia Językowa Wydawnictw Szkolnych PWN:
http://www.wszpwn.com.pl/wszpwn/index.jsp?place=Menu13&news_cat_id=31&layout=13

- Poradnia Językowa Instytutu Języka Polskiego Uniwersytetu Warszawskiego:
http://www.poradniajezykowa.uw.edu.pl/
(projekt dopiero w powijakach, ale trzymajmy kciuki za jego rozwój).

Kolejność poradni przypadkowa.

Do zakładki "Odnośniki" (m. in. Słownik synonimów i inne) proponuję dodać wortal:
http://www.frazeologia.pl/frazeologia/.
Nazwa wortalu mówi sama za siebie.



Mam nadzieję, że powyższy zestaw wartościowych stron internetowych ułatwi Panu pracę i pomoże wielu użytkownikom polszczyzny w codziennych zmaganiach z językiem.


Łączę serdeczne pozdrowienia,


Karol Osuchowski
Dobry pomysł. Spróbuję to dziś wprowadzić w życie :)
Anonimowy pisze…
w okolicach kogoś -> wokół kogoś


Zastanawia mnie także, czy dość często używane w języku mówionym "namiary" (Pluralis) doczekały się sformalizowanej reguły użycia: w mowie potocznej można spotkać zarówno "namiary na kogoś", jak i "namiary czyjeś". Z kolei w Korpusie IPI PAN występuje tylko wariant "namiary na". A co Pan o tym sądzi?


Wątpliwości może również budzić bardzo często występujące wyrażenie "na krótki rękaw". Skoro poprawne - zarówno z logicznego, jak i językowego punktu widzenia - jest wyrażenie "bez rękawów", (a nie "bez rękawa"; zgłaszałem to już wcześniej), to - per analogiam - powinniśmy mówić "z krótkimi rękawami", a nie "na krótki rękaw", nieprawdaż?


Pozdrawiam
Anonimowy pisze…
- w cudzysłowiu -> w cudzysłowie;
- kupywać -> kupować;
- ustąpić miejsce -> ustąpić miejsca (np. starszej osobie w autobusie);
- wyrażenia typu: "skakać przez kozła (-> kozioł) na sali gimnastycznej", "trzymać węża ( -> wąż), podlewając ogród" (nieżywotne: B.= M., choć trzeba przyznać, że sporo tu wyjątków).
Anonimowy pisze…
chłopacy -> chłopcy
forma „chłopacy” jest poprawna, zob. http://slowniki.pwn.pl/poradnia/lista.php?szukaj=ch%B3opacy&kat=16
Anonimowy pisze…
Pleonazmy:

rok czasu -> rok
miesiąc czasu -> miesiąc
okres czasu -> albo okres albo czas
dodałem "rok czasu", pozostałe już są wykrywane :)
Anonimowy pisze…
Pleonazm: "wracać z powrotem".

Wiem, że "wrócić z powrotem" jest już wykrywane. Jednak Google wskazuje, że błąd z użyciem "wracać" także występuje dość często.

Pozdrawiam :-)
Dziękuję, dodałem dzisiaj ten drugi wariant! :)
Anonimowy pisze…
"tym niemniej jednak" -> "niemniej jednak"
Smakowite. Dodałem :)
Anonimowy pisze…
Kolejny pleonazm:

"X lat temu wstecz" -> "X lat temu", "X lat wstecz"

Czy nowe wersje LT oraz polskiego thesaurusa zostaną włączone do pakietu OpenOffice 2.4?
1. LT nie jest w ogóle dołączany do pakietu, bo jeszcze nie jest całkiem gotowy i zintegrowany. Ale może od wersji 3.1 OOo da się to zrobić?

2. Nie, źródła OOo zostały "zamrożone" jakieś trzy miesiące temu i nie było szansy na wcielenie nowej wersji tezaurusa. Na pewno nowa będzie w 3.0, może też wcześniej (w zależności, czy będzie wcześniejsza wersja).
Anonimowy pisze…
Kolejny pleonazm:

"x lat temu wstecz" -> "x lat temu', "x lat wstecz"

Czy nowe wersje LT i polskiego thesaurusa zostaną włączone do pakietu OpenOffice 2.4?

Pozdrawiam :-)
Anonimowy pisze…
Przepraszam za zaśmiecanie bloga ;-) Mój wczorajszy post dość długo się nie ukazywał, więc uznałem, że dziś rano wyślę go ponownie... Powinienem jednak dla pewności wcześniej sprawdzić wyświetlone wpisy :-) Dziękuję za odpowiedź.
Anonimowy pisze…
Co niepoprawnego jest w numerze 46 ("pod czyjś adres")?
Cytuję Słownik poprawnej polszczyzny PWN:

"Wysyłać listy pod czyimś adresem a. na czyjś adres (nie: pod czyjś adres)"

Innymi słowy, to jest kwalifikowane w słownikach jako błąd i tyle.
Anonimowy pisze…
To taki drobiazg:
Poszedł do domu, do, którego zawsze chodził.
Korektor traktuje poprawnie zarówno formę "do którego", jak i "do, którego", przy czym druga jest niepoprawna.
Anonimowy pisze…
większa/mniejsza połowa
Anonimowy pisze…
Tą zamiast tę. Ludzie nie myślą juz wcale. W sklepie:
-Poproszę tę drożdżówkę
-Tą?
Anonimowy pisze…
W mowie potocznej zaimek "tą" jest akceptowalny.
Tak, już widzę, jak ktoś mówiący potocznie najpierw wpisuje do komputera swoje kwestie, aby je sprawdzać korektorem gramatycznym :P

LanguageTool służy do sprawdzania tekstów pisanych, standardowych, a nie poetyckich czy literackich z ogromną stylizacją na potoczny język ze wszelkimi błędami itd.
Anonimowy pisze…
„PLN” zamiast „zł”. PLN ma sens głównie w tabelach…
Anonimowy pisze…
Do błędów typograficznych można by dorzucić:
— twardą spację w wyrażeniach „Mieszko I”, „LXXXVI LO”
— zbiegające się nawiasy okrągłe (takie jak tutaj)(wyglądają bardzo brzydko): powinna zostać jedna para z członami rozdzielonymi średnikiem (tak jak tutaj; tak zwykle się robi).


A poza tym to obsługa sierot (jednoliterowych przyimków i spójników sterczących na końcu wersu) przydała by się, choć to akurat nie w Morfologiku a w edytorze tekstu. Ech…
Anonimowy pisze…
Często spotykane:
Kogoś tu pop*******ło.
Kogoś tu pop...ło

Opuszczenia liter w wyrazach nieprzystojnych oznaczamy kropkami, ilość kropek powinna odpowiadać liczbie opuszczonych liter. Ponadto opuszczenia nie powinny być wieloznaczne. :)
Anonimowy pisze…
Jeszcze „deinstalacja”

http://poradnia.pwn.pl/lista.php?szukaj=dezinstalacja&kat=18
Anonimowy pisze…
Częsty i koszmarny błąd stylistyczny:

i/lub

W literackiej polsczyźnie „lub” oznacza alternatywę niewykluczającą. Tak samo jest w języku prawniczym i w tekstach „okołomatematycznych”.
Anonimowy pisze…
I jeszcze warto byłoby chyba wskazywać na konieczność użycia sekwencji łącznik opcjonalny — dywiz nierozdzielający :) w zestawieniach typu biało-czerwony (żeby się poprawnie przenosiły).
Anonimowy pisze…
Marki samochodów… („Przyjechał Renaultem” zamiast „Przyjechał renaultem”)
Anonimowy pisze…
Gdyby była możliwość zaznaczania rejestrów języka, przydałoby się sugerowanie (w języku ogólnym) lub odradzanie (w języku urzędowym, potocznym) form „rękoma”, „oczyma”.
Anonimowy pisze…
Nowomowa, a właściwie nowopismo:

— O tym zdecydują mieszkańcy/obywatele.

zamiast:

— O tym zdecydują mieszkańcy (obywatele).
Anonimowy pisze…
„Przemądrzejszy” — generalnie stopniowanie imiesłowów (zdarza się czasem przy tłumaczeniach z niemieckiego)
Anonimowy pisze…
„dziewczyny” — „dziewczęta”.

(Bardzo zależy od kontekstu i rejestru.)
O, widzę, że zebrało się wiele kwestii. A więc po kolei:

(1) Twarde spacje. Cóż, można by to robić, ale to może generować tysiące alarmów, a błąd jest, szczerze mówiąc, dosyć mało rażący. Istnieje dodatek do OpenOffice.org, który może takie rzeczy robić automatem (napisał go w Pythonie Robert Vojta), ale mogę też zrobić takie reguły do LT, ale będą one na pewno domyślnie wyłączone, bo generowałyby zbyt dużo szumu.

(2) PLN/zł - to kwestia raczej przyjętej konwencji redakcyjnej niż poprawności językowej. Planowane jest wprowadzenie opcjonalnych modułów do ujednolicania redakcyjnego (np. pod konkretny format bibliografii) - i tam mogłoby się to znaleźć. Nie widzę sensu gdzie indziej, bo to nie jest błąd językowy.

(3) Cudzysłowy wewnętrzne - niby można, ale nowy LT będzie już sprawdzał cudzysłowy typograficzne, więc to może generować za dużo szumu. Może jako opcjonalna reguła. Tak naprawdę wymaga to niewielkiej zmiany w samej składni reguł - obecna generuje dwa zgłoszenia dla każdego cudzysłowu, a zmiana pierwszego generuje potem alarm reguły "niesparowane cudzysłowy". Dlatego najpierw muszę zmienić regułę zmiany cudzysłowów, aby zmieniała je oba za jednym zamachem. To wymaga zmiany składni.

(4) Meksyk '75 - nie mam pewności co do pisowni, bo sprawdzałem to kilkakrotnie w różnych źródłach i zdania są podzielone. Mogę prosić o źródło autorytatywnego rozstrzygnięcia, że to Meksyk ’75?

(5) Trzydzieści gram już lat... - Cóż, czasownika nie ma też tu:

"Trzydzieści gram szyneczki!"

Albo tu:

"Trzydzieści gram bakterii na litr roztworu" (w podpisie do tabeli lub rysunku)

Ale szczerze mówiąc, szyk zdania jest tutaj tak pokrętny, że autor zasłużył na podkreślenie. Powinno być "Trzydzieści już lat gram na fortepianie", inny szyk jest niejasny i bardzo rzadki (a poezja nie powinna być sprawdzana LT). Innymi słowy, większość reguł będzie słabo działać w tekście, w którym szyk wyrazów jest zbyt zawiły. Ale i czytelnik nie będzie miał przyjemności w czytaniu takiego tasiemca.

(5) Adres zamieszkania - no cóż, może i racja, zmienię.

(6) Golonko jest formą potępianą przez któryś słownik poprawnej polszczyzny lub poradnik; nie pamiętam teraz który. Nie wykluczam, że to regionalizm - proszę tylko podać źródło. „We Wiedniu” i „we środę” są formami akceptowanymi („we środę” chyba nawet jest zalecana).

(7) Zbieg nawiasów - rzeczywiście, można by to zakodować - choć w tekstach matematycznych będzie to na pewno niepoprawne.

(8) Kropkowanie przekleństw - cóż, jak ktoś chce to zrobić opcjonalnie, proszę bardzo, ale nie wiadomo, czy chodzi o „popieprzyło”, czy „popierdoliło” - dlatego nie da się jednoznacznie nic podpowiadać. To raczej kwestia redakcyjna niż poprawnościowa, jak sądzę. Co najwyżej program może - kiedy zostaną wprowadzone rejestry językowe do reguł – sugerować kropkowanie przekleństw w rejestrze oficjalnym lub urzędowym.

(9) „Usiadłszy zapłakałem” jest formą niezalecaną od roku 1993, kiedy to Komisja Kultury Języka Komitetu Językoznawstwa PAN zaleciła oddzielanie przecinkami każdego imiesłowu na -ąc, -łszy, -wszy. LanguageTool realizuje to zalecenie. Nagminnym błędem jest niestosowanie się do tego zalecenia.

(10) Czas zaprzeszły. Wydaje mi się, że jest on formą przestarzałą i osoba, która się nią posługuje, powinna to robić na własną odpowiedzialność. Jest ona odczuwana jako pretensjonalna i raczej nie znajdzie się jej w "Gazecie Wyborczej" w normalnym rejestrze językowym, a kto się nią potrafi posługiwać, będzie wiedział, że może zignorować sygnał LT. Inny problem jest z „trzeba było”, gdzie to zwykły czas przeszły. Byłbym zrobił itd. powinno być filtrowane jako poprawne, ale nie dam za to głowy. Będę starał się to stopniowo poprawiać - dopiero teraz umożliwia to unifikacja i ulepszone ujednoznacznianie. W każdym razie problem znany.

(11) „Deinstalacja” jest już podkreślane przez korektor ortograficzny, nie trzeba go dublować.

(12) "i/lub" to nie tyle oryginalny błąd, co kalka z angielskiego, gdzie też jest bzdurą (and/or - logicznie to jest i tak "or"). Dziwne, że tak piszą matematycy, przecież mogą sobie w tabelce sprawdzić (lub zrobić dowód założeniowy w czterech krokach). Ale to nie jest kwestia poprawności językowej (no, można by to nazwać logicznym pleonazmem, bo to konstrukcja nadmiarowa).

(13) biało-czerwony: poprawione reguły przenoszenia wyrazów będą mogły generować biało-/-czerwony, ale stosowanie tego drugiego znaku jest całkowicie opcjonalne według reguł interpunkcji zamieszczonych na stronie PWN, więc nie ma sensu tego wymuszać, bo to nie jest żaden błąd, a co najwyżej konwencja redakcyjna.

(14)„Jemu się wydaje żeś kiep i pacan.” - rzeczywiście, LT nie rozpoznaje form „żeś” jako skrótów od „że jesteś”, ale to dlatego, że może być też:

„Jemu się wydaje, żeś to zrobił”

Więc to musi być warunkowa reguła (przy braku innego czasownika). Nie wiem tylko, na ile często te partykuły typu „żeśmy” są w polszczyźnie formami żywymi, chyba raczej są rzadkie („żeś” w demo korpusu NKJP ma częstość o jedną trzecią mniejszą od „że jesteś”, a tam przecież jest chyba cała „Trylogia” wrzucona).

(15) „Dzięki dr Kowalskiemu” - istotnie błąd w regule, powinno wykrywać. Poprawię.

(16) Marki samochodów. Wiem, niby sensowne, ale cała ta reguła to horrendalne nieporozumienie - przez nią językoznawcy sieją niepotrzebne zamieszanie (z kontekstu zawsze wiadomo, o co chodzi, więc to tylko okazja do zrobienia byka, a nie konieczne ujednoznacznienie) - i przez to debatują, czy pisać „Internet” małą czy wielką literą. Dlatego mam opory, czy to formalizować, bo choć by się dało, to nie wiem, po co w ogóle taka reguła istnieje, skoro i tak nazwy własnej od pospolitej i tak nie da się zawsze odróżnić wyłącznie pisownią wielkimi literami. No ale dodam, nie będę walczył ze słownikami.
Cd.

(17) Bałbym się tak prostej reguły z ukośnikiem (patrz np. "i/lub") - czasem może być w innym znaczeniu i to nie jest żaden błąd. Lepiej traktować to jako opcjonalną konwencję redakcyjną.

(18) "Przemądrzejszy" wykrywa już korektor ortograficzny, nie ma sensu go dublować.

(19) „Dziewczyny”/„dziewczęta” - sądzę, że to jest zbyt subtelna kwestia, żeby można było wyłącznie oprzeć się na zgrubnej ocenie rejestru (w gazecie napisze się raczej "dziewczyny", a w tekście szkolnym w stylu profesora Pimki "dziewczęta", a te oba rejestry są w miarę oficjalne).
Anonimowy pisze…
(4) Nie jestem pewien (nie mam pod ręką), ale Chwałowski w „Typografii typowej książki” chyba o tym wspomina. Z pewnością jest tutaj potrzebny znak analogiczny elizji (’).

(5) To może inaczej — „gram” blisko rzeczownika niepoliczalnego? I nie związanego z brydżem, futbolem ani z muzyką… Tak, to jednak trudne.
Co do szyku — może i autor zasłużył na podkreślenie, ale z pewnością nie na wytykanie błędu. Tuszę, iż autor meandry takie konstruujący, rad by docenionym zostać, że wyżynami stylu na które wzbić się raczył, nie każdemu się zachwycać jest dane. Moim zdaniem powinna (przepraszam za to słowo) być sugestia, że składnia odbiega od języka oficjalnego. Zdanie to poza tym nie ma nic wspólnego z poezją. W końcu w OpenOffisie pisuje się nie tylko wnioski, insturkcej, okólniki i zażalenia, pozwy i podania — bywa też przydatny do pisania artykułów prasowych, listów do znajomych i — last but not least — wypracowań szkolnych. Zawsze mogą się pojawić jakieś cytaty, mowa zależna itp. — program nie powinien jako błąd pokazywać czegoś, co błędem nie jest.

(6) źródła nie jestem w stanie podać, ale akurat jestem na miejscu i — tu się tak mówi!

(7) A to matematycy przygotowując tekst w OO piszą wzory w konwencji techowej i zostawiają je czytelnikom w takiej postaci!?

(9) Dzięki za oświecenie. Nie miałem pojęcia, ale chyba w swojej niewiedzy nie jestem osamotniony (wiele redakcji pisze po staremu).

(10) W wywiadach w GW widywałem... Forma nie jest neutralna stylistycznie, ale moduł sprawdzania gramatyki powinien być gotów się z nią zmierzyć.

(11) Racja, nie zauważyłem. Ale brakuje tam wskazania poprawnej formy (swoją drogą powinno to być w atokorekcie chyba).

(13) U Chwałowskiego w „Typografii typowej książki” można znaleźć stosowne zalecenie oparte o normę branżową. Ponadto literatura obcojęzyczna poświęcona typografii wskazuje że po polsku robi się to właśnie w ten sposób (por. np. Forssman, Jong „Detailtypographie”). Ponadto pamiętam opinię prof. Bańki bodaj, że zwyczaj ten jest wart podtrzymywania. Od studentów wielu promotorów wymaga takiego właśnie przenoszenia. A od siebie dorzucę, że to daje Polakom przewagę w składzie tekstów, gdy zdarza się dłuższy adres internetowy :)

(14) Być może byłoby lepiej potraktować właśnie -(e)ś jako czasownik? Nie chodzi tu tylko o formę "żeś". "Przestań, boś głupi kiej trep z lewej nogi". Wiem, że „argumenta ad google” mają małą wartość ale tysiące, dziesiątki i setki tysięcy wystąpień pozwalają przypuszczać, że komuś może przyjść nagle do głowy takiej konstrukcji użyć.
Spieszę donieść, że reguły "i/lub", o dr. Kowalskim w przypadku zależnym tudzież ta dotycząca zbiegu nawiasów zostały właśnie zapisane w LT :)

Zaraz stuknie 900 reguł, proszę o jeszcze ;)

A co do uwag:

Golonko - cóż, żaden dostępny mi słownik nie notuje takiej formy, a skądś wziąłem zalecenie, żeby to potępiać. Tylko teraz nie widzę skąd :/

Co do gramów - to pewnie znajdzie się co jakiś czas wpadki podobnego typu przy innych regułach (bardzo wiele z nich jest typu heurystycznego i są uproszczeniami). Istotne jest to, żeby eliminować najczęstsze fałszywe alarmy. Sporadyczne zawsze się zdarzą, taki los heurystyk - a na pełną analizę gramatyczną niestety nie można liczyć, bo to za trudne obliczeniowo i teoretycznie.

Czas zaprzeszły (oraz tryb przypuszczający i pokrewne) - teraz mam mechanizm uzgadniania, który mi to ułatwi, więc pewnie w kolejnej wersji to zrobię. Niestety, to wymaga ruszenia jednej z najlepszych reguł w LT (tej od przecinków w zdaniach złożonych), a ona jest dosyć skomplikowana. Pomyślę nad tym, ale mam już zarys rozwiązania.

Przenoszenie wyrazów - odpowiednie poprawki do OOo są tak naprawdę w drodze, więc tym bardziej to nie jest sprawa LT. Kod zostanie chyba lada dzień zintegrowany (o ile już nie jest). Tak więc będzie ten zwyczaj podtrzymany automatycznie, bez żadnych dodatkowych dywizów.

Żesie - tak, ale to wymaga wstępnego przetworzenia całego zdania. To znowu jest możliwe dopiero od paru tygodni i jeszcze trochę poczeka ;) A "boś" jako forma "bo" może być łatwiej zintegrowana. I zostanie.
Anonimowy pisze…
Super!

Na deser poproszę jeszcze taką typograficzną drobnostkę: wielu użytkownikom warto by przypominać, że nie używa się podkreślenia, tylko rozstrzelenia. Do wyjątków można podejść analfabetycznie wymieniając je — np. podkreślenia w pismach urzędowych:

======================
Dot: Nadania uczelni imienia Martina Heideggera

Wasz znak

Nasz znak

Pouczenie

Postanowienie

Zażalenie

Podanie
======================

…albo przyjmując, że reguła odnosi się do krótkich wyróżnień (do powiedzmy pięciu wyrazów).
Anonimowy pisze…
A na poprawę humoru takie coś:

<brednie>
„dla najbardziej wymagających użytkowników” — sprawdzanie zgodności przypadków gramatycznych rzeczowników łacińskich:

===============
Dni Twórczości Hegla, Huserla, Heideggera i Habermasa w wąbrzezińskiej Alma Matre.
=============== (zamiast Alma Mater)

Może niezgodnie z kanonem literatury, ale:
===============
…iurem primæ noctis nad nimi sprawować…
===============(zamiast ius)

No i w końcu wpisanie zdania
===============
Romanes eunt domus
===============
powinno skutkować wyświetleniem okna z żądaniem stukrotnego wpisania frazy "Romani ite domum" bez użycia skrótów klawiaturowych.
</brednie>

pozdrawiam

PS.: Niektórym autorom taki uzgadniacz na prawdę by się przydał.
Co do podkreśleń, to LT nie dostaje żadnych informacji o atrybutach tekstu w OOo, a więc taka reguła nie jest możliwa do zapisania.

A co do łaciny, to kilka podobnych reguł jest (chyba w wersji angielskiej też dopisałem) - lecz pełna wersja wymagałaby po prostu napisania modułu łacińskiego do LanguageTool, co nie jest pewnie trudne, ale nie stanowi, hm, mojego priorytetu ;)
Anonimowy pisze…
Ta łacina to oczywiście konwencja redakcyjna (zalecenia odradzają odmianę), dosyć zresztą urokliwa, ale nie zawsze można sobie na nią pozwolić. W zdaniu: „Kartezjusz odróżnia «ego cogito» jako res cogitans od «res corporea»” [Martin Heidegger, Bycie i czas, tłum. B. Baran, s. 114, Warszawa 2008], można byłoby pokusić się o formy odmienione, czasem nawet podnosiłoby to czytelność (przynajmniej dla niektórych czytelników), np.: „Do substantiae finitae jako rei corporeae jest pierwotnie i w konieczny sposób «przydana» extensio”. Jednak w tekście, gdzie zwrotów łacińskich jest więcej, wzrasta prawdopodobieństwo wystąpienia kolizji albativ-genitiv (gdy słowo polskie rządzi dopełniaczem pełniącym w polszczyźnie funkcję ablatywu) i wątpliwości co do tego, którego przypadka użyć — a zatem do konieczności odwołania się do oficjalnych zaleceń, które powiadają: nie odmieniać!

Szkoda, że LT nie ma dostępu do informacji o formatowaniu. Jeśli miałby być narzędziem pomocnym przy pracy redakcyjnej, to informacje o zastosowanych wyróżnieniach byłyby bardzo pomocne.

Inny błąd: „Gratulacje dla Zsolta Nagya.”, ale: „Szacowne Gremium składa gratulacje Zsoltowi Nagyowi.”, nie „Szacowne Gremium składa gratulacje dla Zsolta Nagya”.

Odmiana tego nazwisko zresztą sprawia zresztą wiele problemów, słownik zaś nie sugeruje właściwych form. W związku z tym nasuwa się pewne spostrzeżenie, ale o tym w wątku obok.

Błędnie powtórzone w powyższym akapicie „zresztą” nie jest wykrywane. Mając gonitwę myśli, często zostawia się takie powtórzenia partykuł i „partykułoidów” (w gruncie rzeczy, wobec tego itp.).
Jedni zalecają, inni odradzają odmianę. Ja zawsze odmieniam wtręty łacińskie według rzędu, jakiego wymaga polski czasownik. Obawiam się, że tego rodzaju reguła nie da się łatwo zmechanizować - po prostu niedouczony redaktor czy tłumacz i tak sobie nie poradzi z taką materią.

Podobnie z sekretarkami - po prostu na głupotę nie ma rady. Nazwisk obcojęzycznych jest na tyle wiele i tak mają różne odmiany (w zależności od wymowy), że trudno coś ogólnego wymyślić.
Anonimowy pisze…
A co ze „składaniem gratulacji dla…”?

Co do odmiany nazwisk (zwłaszcza obcojęzycznych) — myślę, że należałoby wprowadzić odmianę nazwisk najczęściej spotykanych – na pewno tych, które podane są w przykładach w Wielkim słowniku ortograficznym.

Ponadto wartałoby wskazywać na niepoprawność zdań takich jak to (forma gwarowa).

Dodatkowo przydałaby się funkcja ujednolicania CMs.lp. rzeczowników na -ha (głównie nazwiska — Sapieha, Yamaha, Saha, Taha, Blaha) — czy odmieniać zgodnie z tradycją („wataże”, „Sapieże”, „Yamaże”), czy zgodnie z nową modą („Sasze”, „Tasze”, „Blasze”).

Jeszcze dwa bezużyteczne „falsche Freunde” („fałszywe przyjacioły”?), z cyklu które możliwości popełnienia błędu zostaną zmarnowane:
— ang. „to postpone” nie znaczy «postponować»; niem. „frankieren” to «nakleić znaczek», a nie «ofrankować» (niem. freimachen).
Postponowanie zostało dodane.

Co do odmiany, to w ogóle funkcja ujednolicania odmian (np. jednolicie "toneru", "filtru", a nie raz "toneru", raz "tonera" itd.) byłaby przydatna. Ale to musi poczekać, aż słownik morfosyntaktyczny będzie miał lepszą jakość :( Na razie trzeba poznajdować wszystkie przypadki "pługu" ;)

Aha, odmiany nazwisk obcojęzycznych są już w minimalnym stopniu sprawdzane (przypadek apostrofu po literach, które nie mogą być niemym "e" ani "y"), ale będę to sukcesywnie ulepszać.
Anonimowy pisze…
Wyraz nadużywany: akronim.

Inny błąd: „celem” zamiast „w celu”.

Nazwy miejscowości:
Synod w Aix-la-Chapelle (Synod w Akwizgranie),
katedra w Aachen (katedra w Akwizgranie), drukarz z Mainz (z Moguncji), chrześniak z Regensburga (z Ratyzbony), fenomenolog z Freiburga¹ (fenomenolog z Fryburga [Bryzgowijskiego, Badeńskiego]). Wyjątkiem są nazwy drużyn sportowych.

___
¹ Chodzi o tego pana.
"celem" jest poprawne w takim kontekście - to ścisły synonim, cytuję Słownik poprawnej polszczyzny PWN:

urzęd. W celu, celem po to, aby: Napisał to ogłoszenie w celu matrymonialnym. Proszę się stawić w urzędzie celem wyjaśnienia pańskiej sprawy. · Nadużywane w języku potocznym.

Można co najwyżej (po wprowadzeniu rejestrów) zalecać unikanie "celem/w celu", ale wydaje mi się, że to akurat byłoby pewne czepialstwo.

Co do obcojęzycznych nazw miejscowości, to pełna racja, zwyczaj nakazuje je podawać w wersji spolszczonej, o ile takowa istnieje.
Anonimowy pisze…
Zdarza się niekiedy usterka składniowa:
— wypowiedź rozwlekła i długa (powinno być: długa i rozwlekła ),
— manewr gwałtowny i szybki (powinno być: szybki i gwałtowny)
— czyn występny i zły (powinno być: zły i występny).

Chodzi o to, że przy wymienianiu członów równorzędnych pierwszeństwo ma wyraz krótszy.


Ponadto zastanawiam się, czy w poszukiwaniu reguł gramatycznych nie można by rzucić okiem na wyniki automatycznych tłumaczeń.
Co do krótkości i długości przymiotników: prawdę mówiąc, pierwsze słyszę. Może to jest kwestia stylistyki, ale chyba trudno mówić o błędzie... Prosiłbym o jakieś uzasadnienie tej zasady.

Co do automatycznych tłumaczeń - rozumiem, że chodzi o pewną automatyzację znajdowania reguł? Cóż, wbrew pozorom trochę tego już robię, ale zobaczymy, co będzie z tym dalej. Bo nie sądzę, żeby warto było skupiać się po prostu na błędach z translatorów automatycznych.
Anonimowy pisze…
Miał być link, coś mi go zjadło:

http://archiwum.wiz.pl/2001/01011600.asp
Anonimowy pisze…
À propos tej zasady: por. „Zielone bezbarwne idee wściekle śpią” i „śpią wściekle zielone bezbarwne idee”.

Niedorzeczność tego zdania widać bardziej w drugim przykładzie, tam gdzie w orzeczenia zachowany został naturalny rytm. Wersja pierwsza jest logiczna — absurdalna treść jest podkreślona „synkopowanym” rytmem.

Wiem że może nie jest to najwałściwsze miejsce, ale podpisuje się Pan pod polskim słownikiem ortograficznym w open-offisie, więc piszę tutaj. Słownik ten nie pozwala on na doklejanie partykuł czasu przeszłego do wcześniejszych wyrazów w zdaniu. Dziwne to o tyle, że formy te są zdecydowanie częstsze niż formy „konstytucyj”, „nacyj”, które słownik dopuszcza.

Przydałoby się jeszcze doklejanie przedrostka „prze-” do superlatywu przymiotników (aż dziw, co ludzie potrafią wymyślić: „O borze przenajzieleńszy!”). Niewiele jest przymiotników, z którymi takie coś nie zadziała („przenajmniejszy”).
Poza tym brakuje w słowniku wyrazu na to coś między chomątem a hołoblą, coś co w wymowie przypomina dopełniacz odpowiednika łacińskiego „spiritus”.
Anonimowy pisze…
Przy porównaniach: „niż by” zamiast „niżby”
Anonimowy pisze…
Co ujednolicania pisowni, przydałoby się sprawdzanie konsekwencji w stosowaniu ä ü ö (ø) å ß ž ř ae ue oe aa ss ż rz.
(tj. „Søren Kierkegård, Jürgen H., A. Dworzak” albo „Soeren Kierkegaard, Jüregn H., A. Dvořak”; Slavoj Žižek albo Sławoj Żiżek – ostatni przykład trochę dyskusyjny, daję dla porządku.)

Rzecz jest pewnie trudna bo dotyczy „ciał obcych”, więc potrzebny byłby osobny słownik. Ponieważ chodzi głównie o nazwiska (?), myślę że dobrą podstawą byłaby tutaj polska Wikipedia: hasła z kategorii „Urodzeni w…” liczące powyżej np. 210 znaków.
Anonimowy pisze…
{przepraszam za bzdurę z Kierkegaarem; chodziło mi o inne duńskie nazwiska:

zdarza się tak

a powinno być tak}

pozdrawiam
Anonimowy pisze…
«Chcieli nie tylko dróg, alei drzew, nowych chodników oraz częstszych patrolów drogówki. Jak sami mówią…»

Niby z sensem, ale może być również:
«Chcieli nie tylko dróg, alei, drzew, nowych chodników oraz częstszych patrolów drogówki. Jak sami mówią…».

Jak też:

«Chcieli nie tylko dróg, ale i drzew, nowych chodników oraz częstszych patrolów drogówki. Jak sami mówią…»


Innymi słowy:

«Chcieli nie tylko zagadek, ale i rebusów» zamiast «Chcieli nie tylko zagadek, alei rebusów».
Google w odpowiedzi na "nie tylko * alei" pokazuje mnóstwo dorodnych błędów. Z pewnością dodam regułę do wersji 0.9.7 (wersja 0.9.6 będzie dostępna lada dzień).
Anonimowy pisze…
Pojawiają się takie zdania:
"Epatował wewnętrznym ciepłem"

Epatować to znaczy: szokować, wywoływać duże wrażenie.

Powinno być: "Emanował wewnętrznym ciepłem"
Anonimowy pisze…
Witam.Znalazłam kilka błędów w mediach,prasie i nie jestem pewna czy mam rację nazywając je błędami.
Pomóżcie w weryfikacji tego.
"korektor nie wykrył nic".


„Zapalił się w trakcie jazdy i doszczętnie spłonął”.(kto lub co?)

„Zobacz ile więcej wydasz na prąd"

· „Monika jest przekonana, że będzie śpiewać, ale na razie nie robi planów, kiedy to nastąpi”

· „Po naszej publikacji urzędasy z Ministerstwa Obrony Narodowej zrezygnowały...”
· „Mężczyzna wparował do banku i zażądał natychmiastowej pożyczki...”
· „...trzeba będzie sporo zadawnionych spraw poodkręcać...”.
· „Wciągu dnia we wszystkich regionach słaby opad śniegu”.
· „Lepiej, aby więcej osób miała szansę na stypendium, choćby niskie, niż garstka na lepsze”.
· „Wygląda, jakby partia, której przewodniczy Jarosław Kaczyński miała ochotę na rozszerzenie nazwy”.
· „...diabli wzięli dowód, który miał powiedzieć, czy to zabójstwo zostało przygotowane”.
· „Oczywiście zdrowie wydolnościowe nie jest takie, jak trzeba, ale trzeba wygrać”.

· „... dotkniemy nieznanych smaków...”.

· „... jest nie tylko zimniej, ale i sucho...”.

· „Jogurty „danon” dobre dla Ciebie, dobre dla twojej kieszeni”.
Anonimowy pisze…
Witam! Od mojej ostatniej wizyty upłynął już chyba rok. Bardzo się cieszę, że projekt LT rozwija się w tak szybkim tempie. Serdecznie gratuluję wszystkim, którzy przyczynili się do jego rozwoju.

Poniżej zamieszczam kolekcję błędów językowych.

1-3. Wyrażenia logicznie sprzeczne:
a) „wszystkie najważniejsze”;
b) „prawie ponad” i „ponad prawie” (np. „Kurs akcji Banku Zachodniego spadał o 12:00 o prawie ponad 5 proc”.

4. „niezwykle bardzo istotne” – „niezwykle istotne”, „bardzo istotne”
(Por. http://poradnia.pwn.pl/lista.php?id=13 ).

5. „na przestrzeni” (wieków, stuleci, dekad) - „w ciągu”, „podczas”
Reguła już jest, ale brak niektórych wariantów. Można też uzupełnić sugestię poprawy.

6. „na czołowe miejsce” (wysuwają się następujące czynniki)- „na czoło”.

8. „zapisy Konstytucji” - „postanowienia Konstytucji”

9. „postanowienia testamentu” - „zapisy testamentu”

10. (pisownia) z wielkiej litery, z dużej litery - wielką literą, dużą literą, od wielkiej litery, od dużej litery
Reguła już jest, ale brak niektórych wariantów. Można też uzupełnić sugestie poprawy.

11. „osoba, w stosunku do której wydano decyzję”- „osoba, której wydano decyzję”

12.„posiada ważny paszport” - „ma ważny paszport”
Reguła już jest, ale wymaga uzupełnienia

13. skrót: "pół." - "płn."

14. „periodyzacja okresu” - pleonazm

15. „nowa nowina”, „nowe nowiny” (pleonazm)

16. „dobre plusy” - pleonazm

17. „legendowa postać” – „legendarna postać”

18.„mieć na celu, aby” - „mieć na celu” (pleonazm)
Zob. także inny możliwy błąd: http://poradnia.pwn.pl/lista.php?id=9883

19. „Wracać zza granicy” - „wracać z zagranicy”
Powyższe wyrażenie może też być poprawne, ale ten wariant występuje dość rzadko (por. http://poradnia.pwn.pl/lista.php?id=1384).

20. Błędne użycie pojęć: „Ilość” i „liczba”.
„Ilość” powinniśmy używać dla rzeczowników niepoliczalnych, podzielnych w sposób ciągły (np. ilość energii), „liczba” - dla policzalnych.
Por. także: http://poradnia.pwn.pl/lista.php?id=1856

21. Budynek znajduje się „na ulicy” Obrońców Wizny. - „przy ulicy”


PS. Muszę przyznać, że nieco niepokoi mnie zastój w wydaniu nowej wersji słownika synonimów.
Zasób słownika dość znacznie się rozrósł, jednak można mieć wątpliwości czy ten kierunek jest właściwy. Mam wrażenie, że w ostatnim czasie wiele synsetów zostało bezmyślnie powielonych, ale mogę się mylić.

Kiedy można się spodziewać słownika w formie rozszerzenia do OpenOffice?

Pozdrawiam mile!
Witam,

a więc po kolei:

1) "wszystkie najważniejsze" - nie widzę w tym żadnej sprzeczności; trzeba byłoby założyć, że relacja bycia ważniejszym ma jedno maksimum i że nie może istnieć kilka najważniejszych rzeczy. To założenie jest jednak nieintuicyjne: np. dla człowieka na pustyni najważniejsze może być znalezienie wody i ochrona przed słońcem (i to najważniejsze jednocześnie). Obydwie rzeczy są równie ważne i są w danym momencie dla człowieka najważniejsze (nikt nie powie "na pustyni ważniejsze jest woda i ochrona przed słońcem" ani "na pustyni bardzo ważne są woda i ochrona przed słońcem"). Szukanie tu sprzeczności logicznej to wyraz hiperpoprawności.

2) "prawie ponad" - cóż, to raczej pleonazm, ale rzeczywiście, wyrażenie niezręczne

4) "niezwykle bardzo istotne" - cytowana porada jest na inny temat; a samo wyrażenie bardzo rzadkie (5 trafień w Google); chyba że będziemy szukać "niezwykle bardzo", wtedy jest czego szukać :)

5-10 - tak :)

11) można wydać decyzję dotyczącą nieboszczyka, a ta decyzja nie będzie wydana nieboszczykowi, tylko w jego sprawie; sugestia jest niepoprawna

12-18 - tak :) [z zastrzeżeniem, że nie traktowałbym mieć na celu + bezokolicznik jako błędu, skoro nie ma wyraźnego zakazu]

19) sens ten sam, nie ma chyba sensu poprawiać

20. Ba, ale do tego trzeba by mieć pełną klasyfikację rzeczowników policzalnych i niepoliczalnych. Być może kiedyś coś takiego powstanie, ale do tego potrzeba naprawdę dużo danych językowych... Dałoby się trochę wydobyć z hierarchii słownika synonimów (np. wszystkie osoby są policzalne), ale to byłoby dosyć trudne. Pomyślę nad tym.

21) tak

Co do słownika synonimów, to niestety, ma Pan rację. Trzeba by przesiać to, co powstaje, ja staram się w miarę możliwości to robić, ale teraz mam po prostu bardzo mało czasu. Niestety :(

A słownik jest od dawna dostępny w formie rozszerzenia do OpenOffice (w całym pakiecie).
Anonimowy pisze…
witam:) mam prośbe! mój temat maturalny to błędy językowe w telewizji i w prasie.. czy znacie może jakieś strony gdzie mogę znaleźć przykłady?? z góry dziękuje!
Polak Mały pisze…
"na ten moment" - w znaczeniu: "obecnie" (ukrainizm)

Pleonazmy:
"razem wspólnie"; "wspólnie razem"
"wzajemna współpraca"
"Wzajemnie współpracować"
Dwa ostatnie są poprawne, jeśli współpraca ogranicza się do dwóch stron.
Polak Mały pisze…
ochrona/chronić przeciw -> ochrona/chronić przed

Ostatnio często można usłyszeć ten błąd w pewnej nieudolnie przetłumaczonej z angielskiego reklamie.
Polak Mały pisze…
"co z tym idzie"-> co za tym idzie
Celny strzał! Właśnie dodałem do reguł.
Anonimowy pisze…
Witam ;-) Postanowiłam podzielić się z Wami moimi spostrzeżeniami, bo również interesuję się poprawnością językową. Szczególnie drażnią mnie błędy popełniane przez wielu prezenterów i wykładowców. Formę grzecznościową ,,państwo'' łączą z drugą osobą liczby mnogiej zamiast z trzecią, np. ,,widzicie państwo''. Według mnie powinni wybrać albo formę ,,widzicie'', albo ,,widzą państwo''. Nie podoba mi się także używanie zwrotu ,,być w posiadaniu'', jest to kalka językowa z niemieckiego. Kolejny błąd, o którym Wam chciałam napisać, to ,,osobiście uważam''. Pozdrawiam ;-)
Polak Mały pisze…
"obudzić się/zbudzić się ze snu" - obudzić się/zbudzić się

Ten pleonazm występuje nawet w jednym ze współczesnych przekładów Biblii. Pocieszające jest to, że z każdym kolejnym wydaniem tego typu lapsusy są poprawiane.
Polak Mały pisze…
wyrażać gratulacje -> składać gratulacje;
gratulować za coś-> gratulować czegoś
Np. gratulować za zdobycie mistrzostwa świata -> gratulować zdobycia mistrzostwa świata.
Polak Mały pisze…
"odgrywa duże znaczenie" -> odgrywa dużą rolę; ma duże znaczenie

Wyszukiwarka Google wskazuje ponad 130 tys. przykładów błędnego użycia tego wyrażenia.

PS. Jak postępują prace nad włączeniem LT do OpenOffice?
Czy integracja tego narzędzia z KOffice jest również planowana?
Wróble ćwierkają, że dzięki wsparciu Nokii i znacznemu przyspieszeniu prac rozwojowych od wersji 2.2 domyślny pakiet biurowy dla KDE będzie w pełni użyteczny dla większości użytkowników.

Pozdrawiam :-)
Polak Mały pisze…
...skoro przedstawiciele firmy z takim optymizmem przepowiadają rozwój technologii dzięki, której telewizory...
Polak Mały pisze…
"nowa funkcjonalność" -> nowa funkcja

Tego typu nowomowa w ostatnim czasie staje się coraz bardziej popularna.

Pozdrawiam
Polak Mały pisze…
"A pro po" -> à propos ---> co do, w związku z, w odniesieniu do.

Wyszukiwarka Google podaje 317,000 przykładów błędnego zapisu tego galicyzmu.

Inne galicyzmy, których zapis może sprawiać problemy:

http://www.obcyjezykpolski.interia.pl/?md=archive&id=302
Polak Mały pisze…
"pozostała reszta" - pleonazm
Polak Mały pisze…
autoprezentacja własna; własna autoprezentacja -> autoprezentacja; prezentacja własna
Polak Mały pisze…
"umożliwia także możliwość"; "umożliwia również możliwość" -> umożliwia, ma także/ również możliwość

Google podaje po kilkanaście tysięcy przykładów błędnego użycia obu wariantów tego wyrażenia.
Krzysiek pisze…
Witam po raz pierwszy tutaj, trafiłem dzięki kolegom z SG ;) Pozdrowienia, Panie Marcinie, i gratulacje za ten projekt. Choć nie wiem, czy nadal dodaje Pan na bieżąco reguły, dopiszę kilka moich propozycji, które sam wstawiam jako regexpy w Xbenchu (w moich tekstach technicznych nie generują dużo szumu, nie wiem, czy nadadzą się do ogólnych:

1. "musza" zamiast "muszą"
2. "kolein*" zamiast "kolejn*"
3. "być|był|jest|była|... stanie" zamiast "...w stanie"
4. "miedzy" zamiast "między"
5. "prowadzać" zamiast "prowadzić" (plus odmiana)
6. "prawdopodobni" zamiast "prawdopodobnie"
7. "opat|opata" zamiast "opłat|opłata"
8. "kat|kata|katem..." zamiast "kąt..."
9. "zagasić" zamiast "zgasić, ugasić" (plus odmiana)
10. No i dlaczego wykrywanie zdublowanych wyrazów nie działa już, kiedy pojawi się między nimi znak interpunkcyjny (np. "że, że"; "zupa; zupa"?

Pozdrawiam
Część z tego już jest wykrywana (np. problem miedzy->między), o ile się nie mylę, ale bardzo dziękuje za wszelkie te sugestie!
Anonimowy pisze…
Dzisiej, wczorej, tutej, wogle, wogóle, wogule.
Anonimowy pisze…
"Rozmawialiśmy o kakale."
http://poradnia.pwn.pl/lista.php?id=2710

"Zachwycałem się widokiem statuły/statuł."
http://obcyjezykpolski.interia.pl/?md=archive&id=33
Polak Mały pisze…
Nowa kolekcja błędów:
http://www.wykop.pl/ramka/1398125/15-najbardziej-irytujacych-bledow-jezykowych-cz-2/
Polak Mały pisze…
http://www.tvp.pl/vod/audycje/wiedza/slownik-polskopolski/wideo

Talk show z Prof. Miodkiem w roli głównej.
Może warto dodać ten link do poradni językowych?

Pozdrawiam
ŚLĘŻAK - BIS pisze…
O matko, dopiero teraz zobaczyłem ile błędów popełniam w codziennej mowie :O Szkoda że nie mówi się o takich rzeczach głośniej, język powinno się pielęgnować ;)
Patryk pisze…
Sporo tych błędów jest pewnie z czasem bedzie coraz więcej. Dużo błędów znalazłem których sam używam dlatego na pewno polecam każdemu przeczytać ;)
Kasia pisze…
Pomysł jak i sam projekt bardzo ciekawy, ciekawi mnie dlaczego nagle poprzestano nad tym pracę. To mogło być coś wielkiego
Adam pisze…
Super ten pomysł bardzo oryginalny, ciekawe ja kto się by sprawdziło na większa skale
Merkez Tanitim pisze…
bilecik sohbet bilecik halkına en iyi sohbet ortami sunulmaktadir..

alanya sohbet kaliteli sohbet sitemiz sizler içndir

sakarya sohbet Sakaryanin En iyi Elit Sohbet sitesi sizinledir

Samsun sohbet Samsun Sohbet farkini ücretsiz sitemizde yaşayin

webmaster forum Türkiyenin en iyi webmaster forum sitesine sizlerde davetlisinizdir!

sohbet bursa Türkiyenin en iyi sohbet bursa sitesine sizlerde davetlisinizdir!
AdultBilisim3434 pisze…
porno -
mature porno gerçekten güzel site.
Ciekawa kwestia. Jednak moim zdaniem jest do rozstrzygnięcia.

Popularne posty z tego bloga

Imiesłów przysłówkowy bez orzeczenia

W zdaniach z imiesłowami przysłówkowymi (-ąc i -wszy), zakończonych znakiem interpunkcyjnym, powinno występować orzeczenie. Dopuszczalne jest opuszczenie orzeczenia w tytule. W tytule nie stosuje się jednak kropek na końcu. Na przykład: Czekając na Godota Czekając na Godota, zabawiali się rozmową. Błąd ten jest tym bardziej rażący w zdaniach, w których występuje zdanie podrzędne: !Czekając na Godota, który nie przychodził. Usterka zostanie wykryta także w błędnie formułowanych pytaniach: !Rozmawiając o sporcie, który sport uprawiasz? W powyższym przykładzie podmiot imiesłowu jest inny od podmiotu pytania (my rozmawiamy, a sport uprawiasz tylko ty). Powinno być: Skoro już mowa o sporcie, którą dyscyplinę uprawiasz?

Wikipedia history diff as a revision corpus

(As this is of interest not only to the Polish-speaking community, this post is in English.) Recently, after some discussions on the lingucomponent list at OpenOffice.org on the method of finding frequent typos, I did some experiments on the revision history logs. Background. The developers of grammar checkers, and autocorrect lists, have hard times with finding relevant corpora. Revision history is an excellent source about native speakers perception of linguistic norms. Frequently revised typos are perceived as errors that need to be corrected, so using these typos on autocorrect lists is justified. The same goes for style, grammar and usage errors. Method . Experiments involved three steps: Clean the history dump (??wiki-latest-pages-meta-history.xml), to get only relevant parts of the dump. Using XML tools isn't recommended (I tried XSLT, forget it). Using a simple awk script, I was able to clean the > 30GB dump in an hour or so, and got a >17 GB file. The script is simp