Matnning tan olinishi. Bepul dastur - analog FineReader

Ertami-kechmi, odatda ofis dasturlari bilan ishlaydiganlarning odatdagi vazifasi - kitob, jurnal, gazeta, oddiygina varaqalar matnini skanerlash va keyin ushbu rasmlarni matn formatiga, masalan, Word hujjatiga tarjima qiling.

Buni amalga oshirish uchun skaner va matnni aniqlash uchun maxsus dastur kerak. Ushbu maqolada, FineReader'ın bepul analogini -Chikoplam (FineReader'da tan olinishi haqida - ushbu maqolani ko'ring).

Keling ...

Kontent

  • 1. CuneiForm dasturining xususiyatlari, xususiyatlari
  • 2. Matnni aniqlashning misoli
  • 3. Ommaviy matnni aniqlash
  • 4. Xulosa

1. CuneiForm dasturining xususiyatlari, xususiyatlari

Chikoplam

Ishlab chiquvchining saytidan yuklab olishingiz mumkin: //cognitiveforms.com/

On manba matnni aniqlash dasturi. Bundan tashqari, u barcha Windows versiyalarida ishlaydi: XP, Vista, 7, 8. Bundan tashqari, dasturning to'liq ruscha tarjimasini qo'shing!

Taroziga soling:

- dunyoning eng mashhur 20 ta tilida matnni tanib olish (ingliz va rus tillarida bu raqamga kiritilgan);

- turli xil bosma nashrlar uchun katta yordam;

- lug'at tanilgan matnni tekshirish;

- ish natijalarini bir necha usulda saqlash qobiliyati;

- hujjatning tuzilishini saqlash;

- Zo'r qo'llab-quvvatlash va tanib olish jadvallari.

Kamchiliklari:

- juda katta hujjatlar va fayllarni qo'llab-quvvatlamaydi (400 dpi dan ortiq);

- brauzerlarning ayrim turlarini bevosita qo'llab-quvvatlamaydi (yaxshi, bu qo'rqinchli emas, brauzer drayverlarga maxsus brauzer kiritilgan);

- dizayn porlashi mumkin emas (lekin agar dastur to'liq muammolarni hal qilsa, kimga kerak bo'lsa).

2. Matnni aniqlashning misoli

Tasavvur qilish uchun kerakli fotosuratlar olgan bo'lsangiz (u yerda skaner qilingan yoki kitobni Internetda pdf / djvu formatida yuklab olgan va kerakli fotosuratlar olgan), buni qanday qilish kerak - ushbu maqolani ko'ring).

1) Kerakli tasvirni CuineForm dasturida oching (fayl / ochiq yoki "Cntrl + O").

2) aniqlashni boshlash uchun siz birinchi navbatda turli sohalarni tanlashingiz kerak: matn, rasm, jadval, va hokazo. Cuneiform dasturida bu faqat qo'l bilan emas, balki avtomatik ravishda! Buni amalga oshirish uchun deraza ustki qismidagi "formatlash" tugmachasini bosing.

3) 10-15 sekunddan keyin. dastur avtomatik ravishda turli rangdagi barcha maydonlarni ta'kidlaydi. Masalan, matn maydoni ko'k rangda ta'kidlangan. Aytgancha, u barcha sohalarni to'g'ri va tezkor ravishda ta'kidlagan. Rostini aytganda, uning bunday tezkor va to'g'ri javobini kutganim yo'q ...

4) avtomatik belgilanishga ishonmaydiganlar uchun qo'lda foydalanishingiz mumkin. Buning uchun asboblar paneli (quyida rasmga qarang) mavjud, buning yordamida siz matn, jadval, rasmni tanlashingiz mumkin. Ko'chirish, boshlang'ich tasvirni oshirish / kamaytirish, qirralarni kesish. Umuman, yaxshi to'plam.

5) Barcha joylar belgilanganidan so'ng, siz o'tishingiz mumkin tan olinishi. Buning uchun quyidagi rasmda ko'rsatilganidek, xuddi shu nomdagi tugmachani bosish kifoya.

6) To'liq 10-20 soniyada. Microsoft Word-dagi hujjatni taniqli matn bilan ko'rishingiz mumkin. Qizig'i shundaki, bu misol uchun matnda, albatta, xatolar bor edi, lekin ulardan juda kamchiligi bor! Ayniqsa, asl materialning tekisligi - rasm.

Tezlik va sifat FineReader bilan juda o'xshash!

3. Ommaviy matnni aniqlash

Dasturning bu funktsiyasi bir nechta tasvirni emas, balki bir vaqtning o'zida bir nechtasini tanib olish kerak bo'lganda foydalidir. Ommaviy tan olinishni boshlash uchun yorliq odatda boshlang'ich menyuda saqlanadi.

1) Dasturni ochganingizdan so'ng, siz yangi to'plam yaratishingiz yoki oldindan saqlanganini ochishingiz kerak. Bizning misolimizda yangi-yangi yaratamiz.

2) Keyingi qadamda, biz uni olti oydan keyin nima saqlanganini eslaymiz, shuning uchun uni nom bilan ataymiz.

3) So'ngra, hujjat tilini tanlang (ruscha-inglizcha), skanerlangan materialingizda rasm va jadvallar mavjudligini ko'rsatib bering.

4) Endi tanib olish fayllari joylashgan papkani ko'rsatishingiz kerak. Aytgancha, qiziqarli narsa shundaki, dastur o'zi taniydigan barcha rasmlarni va boshqa grafik fayllarni topadi va ularni loyihaga qo'shadi. Bundan tashqari siz qo'shimcha ma'lumotlarni olib tashlashingiz kerak.

5) Keyingi qadam muhim emas - tan olinganidan keyin manba fayllari bilan nima qilish kerakligini tanlang. Men "hech narsa qilmang" katakchasini tanlashni tavsiya etaman.

6) Tan olingan hujjat saqlanadigan formatni tanlash uchun qoladi. Bir necha variant mavjud:

- RTF - Word hujjatidan fayl barcha mashhur idoralar tomonidan ochiladi (shu jumladan, bepul bo'lganlar, dasturlarga havola);

- txt - Matn formatida siz faqat matn, rasm va jadvallarni saqlashingiz mumkin;

- htm - Gipermatn sahifasi, saytni tekshirib, tanib olish uchun qulay. Uning o'rnagiga ergashamiz.

7) "Finish" tugmasini bosgandan so'ng, loyihangizni qayta ishlash boshlanadi.

8) Dastur juda tez ishlaydi. Tanib olgandan so'ng, siz htm fayllar bilan yorliqni ko'rasiz. Bunday faylni bosgan bo'lsangiz, natijalarni ko'rishingiz mumkin bo'lgan joydan brauzer boshlanadi. Aytgancha, to'plam undan keyingi ish uchun saqlanishi mumkin.

9) Ko'rib turganingizdek natijalar ish juda ta'sirli. Dastur osongina rasmni tanib oldi va ostidagi matnni osonlik bilan tanidi. Dastur bepul bo'lsa-da, odatda super!

4. Xulosa

Tez-tez hujjatlarni skanerlash va tanimasangiz, u holda FineReaderni sotib olish mantiqiy emas. CuneiForm osongina ko'p vazifalarni bajaradi.

Boshqa tomondan, u ham kamchiliklarga ega.

Birinchidan, natija bergan natijani tahrirlash va tekshirish uchun juda oz vosita mavjud. Ikkinchidan, juda ko'p rasmni tan olishingiz kerak bo'lsa, FineReader'da loyihaga qo'shilgan hamma narsani o'ng tomon ustuniga darhol ko'rishni qulayroq qilish kerak: tezda keraksiz narsalarni olib tashlash, tahrirlash va boshqalar. Va uchinchidan, CuneiForm tanazzulni yo'qotadi: hujjatni yodda tutishingiz kerak - xatolarni tuzatish, tinish belgilarini, tirnoqlarni va boshqalarni joylashtirishingiz kerak.

Hammasi shu. Boshqa yaxshiroq matnni aniqlash dasturini bilasizmi?

Videoni tomosha qiling: World War II. Invasion of the USSR, 1941. 1 music & text (Mart 2024).