Najčešće pogreške u 2022. godini

Uslugu je 2022. godine prema podacima s Google Analyticsa koristilo 423 tisuće korisnika s preko 2,5 milijuna obrađenih tekstova, čime se ukupni broj korisnika od 2008. godine povećao na 2,7 milijuna korisnika sa 17 milijuna obrada. Prosječno je pogrešno napisana jedna od 60 riječi zaprimljenih na obradu. Nešto više od 80 % korisnika dolazi iz Hrvatske, njih 7 % dolazi iz Bosne i Hercegovine, dok uslugu koristi i oko 1 % korisnika iz Njemačke, Srbije, Austrije i Slovenije. Najviše je korisnika u dobnoj skupini od 25 do 35 godine (njih četvrtina), slijede mlađi od 24, a zatim dob korisnika progresivno pada od 35 godina prema starijima.

Većina riječi i pogrešaka ponavlja se iz godine u godinu, a (i) ove godine najčešće se griješilo u pisanju sljedećih riječi:

šta -> što
če -> će
tiće -> tiče
riješenje -> rješenje
slijedeće -> sljedeće
ko -> tko
mogučnosti -> mogućnosti
promjeniti -> promijeniti
slijedeći -> sljedeći
čemo -> ćemo
mogučnost -> mogućnost
primjetiti -> primijetiti
več -> već
djete -> dijete
primjetio -> primijetio
riješenja -> rješenja
reči -> reći
primjetili -> primijetili
vjerovatno -> vjerojatno
razumijeti -> razumjeti
primjeniti -> primijeniti

Često se umjesto „kvakastih“ slova koriste njihove „beskvake“ varijante, a značajan broj korisnika ne zna da se „sa mnom“, „ne bi“ ili „ne mogu“ pišu razdvojeno, a da je „bismo“ jedna riječ. Vrlo često se griješi i s izrazima:

s obzirom da -> s obzirom na to da
biti će -> bit će
obzirom da -> s obzirom na to da
ukoliko -> ako
iz razloga što -> zato što
zato jer -> zato što

Za 2023. godinu planirana su dodatna poboljšanja usluge, uvođenjem novih funkcionalnosti (npr. prepoznavanje pogrešaka u pisanju datuma, prepoznavanje pogrešaka u punktuaciji, sklanjanje kratica i stranih imena i slično), ali i promjene u korisničkom sučelju. Dakako, nastavlja se i rad na održavanju n-gramskog sustava (n = 1, …, 7) u kojemu su pohranjeni sljedovi od n sukcesivnih riječi iz obrađivanih tekstova s potvrdom svake riječi u Hašekovu rječniku, upotpunjeno učestalošću pojedinog n-grama u ukupno obrađenome korpusu. Mjereno pojavnicama, taj sustav višestruko nadmašuje opseg svih knjiga tiskanih na hrvatskom jeziku od Gutenberga do danas, dajući izvrsnu podlogu za big data obrade.

Briga o usluzi i dalje počiva na umirovljenom profesoru FER-a Šandoru Dembitzu i donedavnom dekanu Gordanu Gledecu, koji uz pomoć studenata razvijaju i unapređuju uslugu.

Blog

Zašto koristiti ispravi.me, a ne ChatGPT?

Ispravljanje tekstova s posebnim formatiranjem za društvene mreže

Trideset nam je godina tek…

Preminuo Šandor Dembitz, autor Hašeka

Godišnja inventura ususret 30. rođendanu

Najčešće pogreške u 2022. godini

25 godina Hašeka

Novo ime i korisničko sučelje usluge

Najčešće pogreške korisnika

Najčešće pogreške u 2022. godini