Onlayn matnni aniqlash xizmatlari

Blogning barcha o'quvchilariga salom!

Ko'pincha kompyuterda ishlaydiganlar (o'ynamaydi, lekin ishlaydi) matnni tanib olish bilan shug'ullanishi kerak deb o'ylayman. Misol uchun, siz kitobdan olingan parchani skanerladingiz va endi ushbu qismni hujjatingizga joylashtirishingiz kerak. Biroq, skaner qilingan hujjat - bu rasm va biz matnga muhtojmiz - buning uchun rasmlardan matnni tanib olish uchun maxsus dasturlar va onlayn xizmatlar kerak.

Tan olish dasturlari haqida avvalgi xabarlarda yozganman:

- FineReader'da matnni va tanib olishni tekshirish (pulli dastur);

- Analog FineReader - CuneiForm (bepul dastur) da ishlash.

Men shu maqolada matnni aniqlash uchun onlayn xizmatlar haqida o'ylashni istardim. Axir 1-2 rasm bilan matnni tezda olishingiz kerak bo'lsa - turli dasturlarni o'rnatish bilan shug'ullanishning ma'nosi yo'q ...

Bu juda muhim! Ovozni aniqlash sifati (xatolar soni, okunabilirlik va boshqalar) asl tasvir sifatiga juda bog'liq. Shuning uchun, skanerlashda (fotosuratlar, va hokazo), sifatni iloji boricha yuqori darajada tanlang. Ko'pgina hollarda 300-400 dpi sifati etarli bo'ladi (dpi surat sifatini tavsiflovchi parametr bo'lib, deyarli barcha brauzerlarning sozlamalarida bu parametr odatda ko'rsatilgan).

Onlayn xizmatlar

Xizmat ko'rsatish ishlarini ko'rsatish uchun men maqolalarimning biridan ekran tasvirini berdim. Ushbu ekran tasvirchasi tavsifi quyida ko'rsatilgan barcha xizmatlarga yuklanadi.

1) //www.ocrconvert.com/

Men uning soddaligi tufayli ushbu xizmatni yaxshi ko'raman. Sayt ingliz bo'lsa-da, u rus tilida yaxshi ishlaydi. Ro'yxatdan o'tish shart emas. Tanib olishni boshlash uchun siz 3 bosqichni bajarishingiz kerak:

- rasmingizni yuklang;

- rasmdagi matnning tilini tanlang;

- boshlashni tasdiqlash tugmasini bosing.

Formatni qo'llab-quvvatlash: PDF, GIF, BMP, JPEG.

Natijada rasmda quyida ko'rsatilgan. Aytishim kerakki, matn yaxshi tanilgan. Bundan tashqari, juda tez - men 5-10 sekund kutgan edim.

2) //www.i2ocr.com/

Ushbu xizmat yuqoridagi kabi ishlaydi. Bu erda siz shuningdek faylni yuklab olishingiz kerak, tanib olish tilini tanlaymiz va matn matni tugmachasini bosing. Xizmat juda tez harakat qiladi: 5-6 soniya. bir sahifa.

Qo'llab-quvvatlaydigan formatlar: TIF, JPEG, PNG, BMP, GIF, PBM, PGM, PPM.

Ushbu onlayn-servisning natijasi juda qulay: siz darhol ikkita derazani ko'rasiz - birinchi bo'lib tanitish natijasi, ikkinchisi - asl tasvir. Shuning uchun tahrir qilish paytida tahrir qilish oson. Xizmatga ro'yxatdan o'tish ham kerak emas.

3) //www.newocr.com/

Ushbu xizmat bir necha yo'llar bilan noyobdir. Birinchidan, u "yangi moda" formatidagi DJVU formatini qo'llab-quvvatlaydi (shu bilan birga formatlarning to'liq ro'yxati: JPEG, PNG, GIF, BMP, TIFF, PDF, DjVu). Ikkinchidan, rasmdagi matn maydonlarini tanlashni qo'llab-quvvatlaydi. Bu siz rasmda nafaqat matn sohasi, balki tanib olishni istamaydigan grafik tasvirlar ham mavjud.

Ovozni aniqlash sifati o'rtacha bo'lib, ro'yxatdan o'tish kerak emas.

4) //www.free-ocr.com/

Tasdiqlash uchun juda oddiy xizmat: rasmni yuklash, tilni belgilash, captcha yozuvini kiritish (shu bilan siz ushbu maqoladagi yagona xizmatni amalga oshirishingiz kerak) va tasvirni matnga aylantirish uchun tugmani bosing. Aslida hamma narsa!

Qo'llab-quvvatlaydigan formatlar: PDF, JPG, GIF, TIFF, BMP.

Ovozni aniqlash natijalari o'rtacha. Xatolar bor, lekin ko'p emas. Biroq, original skrinshot sifati yanada yuqori bo'lsa, unda kamroq xatolar borligi aniqlanadi.

PS

Bugun hammasi shu. Agar siz matnni tanib olish uchun ko'proq qiziqarli xizmatlarni bilsangiz - sharhlarda baham ko'rish, minnatdor bo'laman. Bir shart: ro'yxatdan o'tishning hojati yo'q va xizmat bepul bo'lganligi ma'qul.

Hurmat bilan!

Videoni tomosha qiling: CHIMILDIQ!BIRINCHI JINSIY ALOQA!BUYDOQLARGA MASLAHAT! (Mart 2024).