O usluzi

Ispravi.me je korisničko sučelje aplikacije za računalnu provjeru pravopisa koja je do 2016. godine pod imenom Hascheck [Hašek] posluživala korisnike na adresi hascheck.tel.fer.hr. Od srpnja 2016. korisnički dio usluge mijenja naziv (i adresu) u Ispravi.me, a Hašek ostaje pogonski mehanizam koji u pozadini obrađuje tekst.

Hascheck je kratica za Hrvatski akademski spelling checker.

Radi se o jednoj od najstarijih internetskih usluga u Hrvatskoj koja u različitim oblicima djeluje kao javna i besplatna usluga pravopisne provjere teksta pisanog hrvatskim jezikom od proljeća 1994. godine do danas.

Baza riječi

Hascheckova baza riječi organizirana je u tri cjeline:

  • hrvatski općejezični fond,
  • hrvatski posebnojezični fond (imena, nazivi itd.),
  • engleski općejezični fond.

Baza nije statična, nego raste ovisno o obradama, na temelju učenja do tad nepoznatih riječi (najčešće iz imenskog fonda).

Vrste provjera

Klasični sustav strojne provjere pravopisa sustavno se proširuje mogućnostima kontekstualne obrade.

Učenje

U pozadini usluge djeluje ekspertni sustav koji uči nove riječi iz tekstova pristiglih na obradu. Radi očuvanja visoke čistoće rječničke baze učenje je nadgledano, što predstavlja ljudski energetski input u održavanje i poboljšavanje usluge. Rečeni input držimo razlogom zašto usluga ima dugogodišnji eksponencijalni trend porasta opsega prometa s gradijentom od nekoliko postotaka mjesečno.

Dosad obrađeni korpus

Hašek je već obradio korpus koji premašuje 10 milijardi riječi-pojavnica (najveći ikada obrađeni korpus u Hrvatskoj) te raspolaže s rječničkom bazom s preko 2 milijuna riječi-različnica, koje sve imaju potvrdu u tekstovima pisanim hrvatskim jezikom.

Svoje znanje Hašek temelji i na brojnim obrađenim leksikografskim djelima, počevši s dvotomnim Hrvatskim leksikonom.

Usluga je po svome karakteru nacionalna i infrastrukturna, što potvrđuje i činjenica da je pružena korisnicima iz više od 160 vršnih IP-domena (zemalja), ali kako je izostala potpora uobičajena za takav tip usluga, korisnici mogu očekivati određena ograničenja njezina korištenja u budućnosti.