Przejdź do głównej zawartości

Posty

Wyświetlanie postów z lipiec, 2006

Blogi i błędy

Zacząłem gromadzić korpus polszczyzny z blogów. Okazało się, że blogi nastolatków na onecie w istocie zawierają bardzo mało czystego tekstu (i ogromną liczbę błędów). Muszę więc zgromadzić tego więcej... Klikając sobie w ustawieniach Bloggera odkryłem jednak perełkę: wyszukiwarkę w tekstach blogów (Google’a). Już nie trzeba wpisywać żadnych specjalnych i wymyślnych składniowo poleceń, wystarczy przejść pod odpowiedni adres .

Gromadzimy błędy językowe

Tu zbieram błędy, które mają być wykrywane regułami. Część z tych błędów można dodać także do list autokorekty w Ooo (a nawet w programie MS Word). Warto pamiętać, że na liście muszą być tylko te błędy, których nie wykryje już korektor pisowni (a zatem błędne formy fleksyjne i proste błędy ortograficzne nie muszą być tutaj umieszczane). Zapraszam do komentowania i uzupełniania tej listy, na pewno nie jest wyczerpująca. Mówiąc krótko, to taki negatywny słownik języka polskiego ;) Nowomowa, ale nie błąd: wychodzić|wyjść * naprzeciw -> popierać *, iść na rękę * wprowadzić kogo w co -> zapoznać kogo z czym [fałszywe alarmy] w przypomnieniu -> przypominając [za dużo fałszywych alarmów] do wojny -> przed wojną [fałszywe alarmy, wiele poprawnych zwrotów] więcej chory -> coraz bardziej chory [rzadkie] widzieć się zmuszonym -> być zmuszonym w uzupełnieniu -> uzupełniając do roku -> przed upływem roku [za dużo fałszywych alarmów] trzymać wagę, firmę, mowę ś