{"id":1038,"date":"2024-01-05T09:10:42","date_gmt":"2024-01-05T08:10:42","guid":{"rendered":"https:\/\/ispravi.me\/info\/?p=1038"},"modified":"2024-01-07T22:01:13","modified_gmt":"2024-01-07T21:01:13","slug":"godisnja-inventura-ususret-30-rodendanu","status":"publish","type":"post","link":"https:\/\/ispravi.me\/info\/godisnja-inventura-ususret-30-rodendanu\/","title":{"rendered":"Godi\u0161nja inventura ususret 30. ro\u0111endanu"},"content":{"rendered":"<p>Jo\u0161 je jedna godina za nama i vrijeme je za inventuru 2023. godine na FER-ovom strojnom provjerniku pravopisa <a href=\"https:\/\/ispravi.me\/\">Ispravi.me<\/a>.<\/p>\n<p>Prethodne je godine Ispravi.me, poslu\u017euju\u0107i preko 600 tisu\u0107a korisnika, obradio 7,45 milijuna tekstova s ukupno 1,74 milijarde rije\u010di, tj. u prosjeku 234 rije\u010di po tekstu. Ako se to pretvori u radne sate, ispada da je automatskom provjerom pravopisa tih 7,3 milijuna kartica korisnicima u\u0161te\u0111eno 363 tisu\u0107e dana, tj. ukupno gotovo 1700 radnih godina, ako kao parametre uzmemo 20 kartica teksta na dan i osmosatno radno vrijeme.<\/p>\n<p>Kao i godinu ranije, prema podacima koje daje Google Analytics, ne\u0161to vi\u0161e od 85 % korisnika dolazi iz Hrvatske, njih 7 % dolazi iz Bosne i Hercegovine, dok uslugu koristi i po 1 % korisnika iz Njema\u010dke, Srbije, Austrije i Slovenije. Najvi\u0161e je korisnika u dobnoj skupini od 25 do 35 godine (njih \u010detvrtina), no ove godine najmanje je korisnika mla\u0111ih od 24 godine (tek 10 %).<\/p>\n<p>Ukupno je sustav prona\u0161ao 4,86 milijuna razli\u010ditih pogre\u0161aka koje su se u tekstovima pojavile 30,32 milijuna puta, \u0161to zna\u010di da i dalje na svakih 60-ak ispravnih rije\u010di dolazi jedna pogre\u0161na.<\/p>\n<h3>Naj\u010de\u0161\u0107e pogre\u0161ke<\/h3>\n<p>Top-lista gre\u0161aka nije se zna\u010dajno mijenjala u odnosu na posljednje godine: naj\u010de\u0161\u0107e se grije\u0161i pi\u0161u\u0107i &#8220;slijede\u0107i&#8221; umjesto &#8220;sljede\u0107i&#8221;, &#8220;rije\u0161enje&#8221; umjesto &#8220;rje\u0161enje&#8221;, &#8220;promjeniti&#8221; umjesto &#8220;promijeniti&#8221;, &#8220;mogu\u010dnost&#8221; umjesto &#8220;mogu\u0107nost&#8221;, &#8220;\u010de&#8221; i &#8220;\u010demo&#8221; umjesto &#8220;\u0107e&#8221; i &#8220;\u0107emo&#8221;, &#8220;ve\u010d&#8221; umjesto &#8220;ve\u0107&#8221;. Vrlo \u010desto korisnici uop\u0107e ne koriste dijakritike, \u0161to ne bismo trebali smatrati pravopisnom pogre\u0161kom, nego pripisati \u017eelji za brzim pisanjem, posebno na pametnim telefonima. Zamjetno je i \u010desto pisanje rije\u010di &#8220;svo&#8221; umjesto &#8220;sve&#8221;, &#8220;niko&#8221; umjesto &#8220;nitko&#8221;, &#8220;\u0161ta&#8221; umjesto &#8220;\u0161to&#8221;, &#8220;vjerovatno&#8221; umjesto &#8220;vjerojatno&#8221; ili &#8220;projekat&#8221; umjesto &#8220;projekt&#8221;. Pri vrhu je i pogre\u0161no pisanje negacije pa tako &#8220;ne bi&#8221; postaje &#8220;nebi&#8221;, a &#8220;ne znam&#8221; postaje &#8220;neznam&#8221;. &#8220;Sa mnom&#8221; \u010desto postaje &#8220;samnom&#8221;. O\u010dekivano, 10 % naj\u010de\u0161\u0107ih pogre\u0161nih rije\u010di pojavljuje se u gotovo polovici svih prona\u0111enih pogre\u0161aka.<\/p>\n<p>Usluga Ispravi.me osim klasi\u010dnih zatipaka ispravlja i \u010deste gramati\u010dke te stilske pogre\u0161ke &#8211; takvih je prona\u0111eno 300 tisu\u0107a, a pojavile su se 3,2 milijuna puta. U takve pogre\u0161ke ubrajamo sintagme &#8220;s obzirom da&#8221; (treba &#8220;s obzirom na to da&#8221;), &#8220;na taj na\u010din&#8221; (bolje je &#8220;tako&#8221;) ili &#8220;na na\u010din da&#8221; (bolje je &#8220;tako da&#8221;), &#8220;zajedno s&#8221; (naj\u010de\u0161\u0107e je dovoljno &#8220;s&#8221;), grozomorno &#8220;iz razloga \u0161to&#8221; (ispravno je &#8220;zato \u0161to&#8221;), iritantno administrativno &#8220;nismo u mogu\u0107nosti&#8221; (a lak\u0161e je napisati &#8220;ne mo\u017eemo&#8221;). Tu je i pogre\u0161na upotreba rije\u010di &#8220;ukoliko&#8221;, umjesto koje, ako ne dolazi u paru s &#8220;utoliko&#8221;, treba pisati &#8220;ako&#8221;. Korisnici grije\u0161e i kod pisanja futura (npr. &#8220;biti \u0107e&#8221; umjesto &#8220;bit \u0107e&#8221;). Pri vrhu ljestvice nalazi se i pogre\u0161no kori\u0161tenje prijedloga &#8220;s&#8221;, tj. &#8220;sa&#8221; te sintagma &#8220;da li&#8221;.<\/p>\n<p>Analiza vi\u0161egodi\u0161njih zapisa o ispravcima koje korisnici izabiru od ponu\u0111enih opcija (preko 33 milijuna pogre\u0161aka i ispravaka) pokazala je sljede\u0107e:<\/p>\n<ul>\n<li>18,3 % svih pogre\u0161aka posljedica je nekori\u0161tenja dijakritika,<\/li>\n<li>7 % svih pogre\u0161aka posljedica je pogre\u0161nog pisanja &#8220;je&#8221; umjesto &#8220;ije&#8221;,<\/li>\n<li>6,3 % svih pogre\u0161aka posljedica je pogre\u0161nog pisanja &#8220;\u010d&#8221; umjesto &#8220;\u0107&#8221;,<\/li>\n<li>5,4 % svih pogre\u0161aka predstavlja pogre\u0161no pisanje prijedloga &#8220;sa&#8221; umjesto &#8220;s&#8221; (za razliku od 0,4 % pogre\u0161aka pisanja &#8220;s&#8221; umjesto &#8220;sa&#8221;),<\/li>\n<li>5 % svih pogre\u0161aka predstavlja pogre\u0161no pisanje &#8220;ije&#8221; umjesto &#8220;je&#8221;,<\/li>\n<li>3,4 % svih pogre\u0161aka predstavlja pogre\u0161no pisanje &#8220;\u0107&#8221; umjesto &#8220;\u010d&#8221;.<\/li>\n<\/ul>\n<h3>Nove funkcionalnosti<\/h3>\n<p>Krajem pro\u0161le godine usluga je oboga\u0107ena novim funkcionalnostima, promijenjeno je su\u010delje za nu\u0111enje ispravaka, a dio programskog koda na poslu\u017eiteljskoj strani napisan je iznova, \u010dime je brzina odgovora utrostru\u010dena. Nove funkcionalnosti uklju\u010duju prepoznavanje ispravnog oblika pisanja datuma (s razmakom iza to\u010dke i nazivom mjeseca u genitivu), dodavanje razmaka izme\u0111u broja i mjerne jedinice ili naziva valute, provjeru pisanja rednih brojeva (npr. ispravljanje &#8220;1-og&#8221; ili &#8220;3-eg&#8221;, &#8220;1940-tih&#8221; ili &#8220;1000-ih&#8221;), ispravljanje parova &#8220;tokom\/tijekom&#8221;, &#8220;budu\u0107i\/budu\u0107i da&#8221;, &#8220;zahtjeva\/zahtijeva&#8221; na temelju frekvencije pojavljivanja izraza u kojima se koriste i sli\u010dnog. Predla\u017eu se i ispravci suvi\u0161nih razmaka ispred znakova interpunkcije te iza otvorenih ili ispred zatvorenih zagrada. U planu su i nova pobolj\u0161anja, uglavnom temeljena na n-gramskom modelu hrvatskoga jezika koji se gradi u sklopu usluge provjere pravopisa. Mjereno pojavnicama, taj sustav vi\u0161estruko nadma\u0161uje opseg svih knjiga tiskanih na hrvatskom jeziku od Gutenberga do danas, daju\u0107i izvrsnu podlogu za <em>big data<\/em> obrade.<\/p>\n<p>Ove godine obilje\u017eit \u0107emo i tridesetu obljetnicu postojanja usluge, koja je prve 22 godine \u017eivjela pod akronimom Hrvatskog akademskog spelling checkera &#8211; Haschecka (\u010dita se &#8220;Ha\u0161ek&#8221;). Od javne objave usluge 21. o\u017eujka 1994. godine kad se ona koristila putem elektroni\u010dke po\u0161te, preko uvo\u0111enja web-su\u010delja 2003. godine, Ha\u0161ek je do danas obradio gotovo 63 milijuna tekstova s ne\u0161to vi\u0161e od 16 milijarda rije\u010di, \u010dime je, prema navedenim parametrima, korisnicima u\u0161tedio vi\u0161e od 15,5 tisu\u0107a radnih godina sri\u010du\u0107eg \u010ditanja teksta.<\/p>\n<hr \/>\n<p>Ilustracija: Image by Racool_studio on Freepik<\/p>\n","protected":false},"excerpt":{"rendered":"<p>U 2023. godini smo za 600 tisu\u0107a korisnika pregledali 7,45 milijuna tekstova i otkrili 4,86 milijuna razli\u010ditih pravopisnih gre\u0161aka. Svojim smo korisnicima u\u0161tedjeli 3 tisu\u0107e radnih godina sri\u010du\u0107eg \u010ditanja!<\/p>\n","protected":false},"author":1,"featured_media":1044,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_exactmetrics_skip_tracking":false,"_exactmetrics_sitenote_active":false,"_exactmetrics_sitenote_note":"","_exactmetrics_sitenote_category":0,"footnotes":""},"categories":[7],"tags":[],"class_list":["post-1038","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-blog"],"_links":{"self":[{"href":"https:\/\/ispravi.me\/info\/wp-json\/wp\/v2\/posts\/1038","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/ispravi.me\/info\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/ispravi.me\/info\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/ispravi.me\/info\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/ispravi.me\/info\/wp-json\/wp\/v2\/comments?post=1038"}],"version-history":[{"count":25,"href":"https:\/\/ispravi.me\/info\/wp-json\/wp\/v2\/posts\/1038\/revisions"}],"predecessor-version":[{"id":1067,"href":"https:\/\/ispravi.me\/info\/wp-json\/wp\/v2\/posts\/1038\/revisions\/1067"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/ispravi.me\/info\/wp-json\/wp\/v2\/media\/1044"}],"wp:attachment":[{"href":"https:\/\/ispravi.me\/info\/wp-json\/wp\/v2\/media?parent=1038"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/ispravi.me\/info\/wp-json\/wp\/v2\/categories?post=1038"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/ispravi.me\/info\/wp-json\/wp\/v2\/tags?post=1038"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}