Ispravi.me

Najčešće pogreške u 2022. godini

Uslugu je 2022. godine prema podacima s Google Analyticsa koristilo 423 tisuće korisnika s preko 2,5 milijuna obrađenih tekstova, čime se ukupni broj korisnika od 2008. godine povećao na 2,7 milijuna korisnika sa  17 milijuna obrada. Prosječno je pogrešno napisana jedna od 60 riječi zaprimljenih na obradu. Nešto više od 80 % korisnika dolazi iz Hrvatske, njih 7 % dolazi iz Bosne i Hercegovine, dok uslugu koristi i oko 1 % korisnika iz Njemačke, Srbije, Austrije i Slovenije. Najviše je korisnika u dobnoj skupini od 25 do 35 godine (njih četvrtina), slijede mlađi od 24, a zatim dob korisnika progresivno pada od 35 godina prema starijima.

Većina riječi i pogrešaka ponavlja se iz godine u godinu, a (i) ove godine najčešće se griješilo u pisanju sljedećih riječi:

  • šta -> što
  • če -> će
  • tiće -> tiče
  • riješenje -> rješenje
  • slijedeće -> sljedeće
  • ko -> tko
  • mogučnosti -> mogućnosti
  • promjeniti -> promijeniti
  • slijedeći -> sljedeći
  • čemo -> ćemo
  • mogučnost -> mogućnost
  • primjetiti -> primijetiti
  • več -> već
  • djete -> dijete
  • primjetio -> primijetio
  • riješenja -> rješenja
  • reči -> reći
  • primjetili -> primijetili
  • vjerovatno -> vjerojatno
  • razumijeti -> razumjeti
  • primjeniti -> primijeniti

Često se umjesto „kvakastih“ slova koriste njihove „beskvake“ varijante, a značajan broj korisnika ne zna da se „sa mnom“, „ne bi“ ili „ne mogu“ pišu razdvojeno, a da je „bismo“ jedna riječ. Vrlo često se griješi i s izrazima:

  • s obzirom da -> s obzirom na to da
  • biti će -> bit će
  • obzirom da -> s obzirom na to da
  • ukoliko -> ako
  • iz razloga što -> zato što
  • zato jer -> zato što

Za 2023. godinu planirana su dodatna poboljšanja usluge, uvođenjem novih funkcionalnosti (npr. prepoznavanje pogrešaka u pisanju datuma, prepoznavanje pogrešaka u punktuaciji, sklanjanje kratica i stranih imena i slično), ali i promjene u korisničkom sučelju. Dakako, nastavlja se i rad na održavanju n-gramskog sustava (n = 1, …, 7) u kojemu su pohranjeni sljedovi od n sukcesivnih riječi iz obrađivanih tekstova s potvrdom svake riječi u Hašekovu rječniku, upotpunjeno učestalošću pojedinog n-grama u ukupno obrađenome korpusu. Mjereno pojavnicama, taj sustav višestruko nadmašuje opseg svih knjiga tiskanih na hrvatskom jeziku od Gutenberga do danas, dajući izvrsnu podlogu za big data obrade.

Briga o usluzi i dalje počiva na umirovljenom profesoru FER-a Šandoru Dembitzu i donedavnom dekanu Gordanu Gledecu, koji uz pomoć studenata razvijaju i unapređuju uslugu.