პროგრამა სურათებიდან ტექსტის ამოცნობისთვის. YAGF - გრაფიკული გარსი CuneiForm-ისთვის (სკანირებული ტექსტის ოპტიკური ამოცნობა) როგორ გამოვიყენოთ ლურსმული პროგრამა

CuneiForm არის უფასო პროგრამა, რომელიც შექმნილია სურათების ტექსტურ ფორმატში სწრაფად გადასაყვანად. პროგრამა პოულობს თავის გამოყენებას ბევრ სფეროში: სკოლებში, უნივერსიტეტებში, საოფისე მუშაობაში, ძველი არქივების, წიგნების და სხვა დოკუმენტების დიგიტალიზაციაში.

CuneiForm OpenOCR - Abbyy Finereader-ის საუკეთესო ალტერნატივა

რატომ არის ეს ინსტრუმენტი უკეთესი, ვიდრე Finereader საშუალო პროფესიონალისთვის? პერშ ყველაფრისთვის, არავითარი კატასტროფა. ამ პროგრამული უზრუნველყოფის ღირებულებაა 5776 რუბლი, ხოლო CuneiForm OpenOCR-ში არაფერს იხდით. მარტივი ინსტალაცია და გამოყენება. სანამ ისაუბრებთ, შეგიძლიათ ჩამოტვირთოთ CuneiForm პირდაპირ ამ გვერდზე (ქვემოთ ჩვენ გამოვაქვეყნეთ შეტყობინება ოფიციალური ვერსიაპროგრამა). ინსტალაციის შემდეგ დაუყოვნებლივ გახსენით ჩვენი ამომცნობი და წაიკითხეთ მოკლე ინსტრუქციები:

მაშ, როგორ გადააკეთოთ სურათები ტექსტად? ეს პროგრამა მარტივი გამოსაყენებელი იქნება როგორც დამწყებთათვის, ასევე პროფესიონალებისთვის და სწავლისთვის რამდენიმე საფეხურსაც კი მოითხოვს. უპირველეს ყოვლისა, საჭიროა სურათი (იქნება ეს ფორმატში - PNG, BMP, JPEG და ა.შ.), ასე რომ, ნაჩვენებია საჭირო ობიექტი.

წინააღმდეგ შემთხვევაში, თქვენ უნდა დააჭიროთ ღილაკს "აღმოაჩინე". შემდეგი, ტექსტის ამოცნობის პროცესი იწყება CuneiForm-ში. ეს, როგორც წესი, სწრაფადაც კი ხდება, მაგრამ იშვიათ შემთხვევებში საჭიროა 5-10 წამზე მეტი ლოდინი.

მას შემდეგ, რაც ინსტრუმენტი ამოიცნობს ტექსტს, იხსნება თქვენი სტანდარტული ტექსტური რედაქტორი - Word, WordPad და ა.შ. სანამ ისაუბრებთ, შეგიძლიათ დაუყოვნებლივ შეცვალოთ ტექსტი, რადგან ყოველთვის არ ხედავს პროგრამა ზუსტ შედეგს, განსაკუთრებით ზიფირებული, ძველი გვერდების დამუშავებისას.

ასევე, CuneiForm OpenOCR მალე შეძლებს ნახოს ტექსტის ის სფეროები, როგორიცაა ცხრილები, აბზაცები, სათაურები და სხვა სექციები. ასეთ სიტუაციაში, თქვენ უნდა ხელით მონიშნოთ მხარე, რისთვისაც შეიქმნა მოსახერხებელი ხელსაწყო.

უფრო მოსახერხებელი გამოყენებისთვის, საცალო მოვაჭრეებმა დაამატეს სკანირების ფუნქცია. თქვენ უბრალოდ განათავსებთ ნებისმიერ დოკუმენტს ან წიგნს MFP-ში ან სკანერში, სკანირებთ საჭირო ფურცელს და შემდეგ Kuniform ავტომატურად გარდაქმნის ტექსტს სურათებად - ძალიან სასარგებლო ინსტრუმენტი.

აქ არც ისე ბევრი მოწინავე პარამეტრია, შეგიძლიათ მხოლოდ 3-ის მორგება - განლაგება, სკანირება და ფორმატირება, მაგრამ ეს კომპენსირდება იმით, რომ თქვენ შეგიძლიათ მორგოთ კანის მოდული okremo, რათა მომხმარებელმა შეძლოს ყველაფრის თავისთვის მორგება. საუბრის წინ, თავად პროგრამა მარტივი და მარტივია ნებისმიერი OS-ით:

  • Windows XP;
  • Windows Vista, 7;
  • Windows 8, 8.1 და 10;
  • Mac OS;
  • Linux და სხვები.

იმისათვის, რომ CuneiForm გამოიყურებოდეს მთლიანად რუსული, გადადით დისტრიბუტორების ოფიციალურ ვებსაიტზე, სადაც ნახავთ დამატებით ინფორმაციას პროგრამის შესახებ. თუ უკვე გესმით, როგორ უნდა იმუშაოთ მასთან, უბრალოდ დააწკაპუნეთ მწვანე ღილაკზე და შემდეგ მიიღებთ მოქმედ ტექსტის ამომცნობს, რომელიც გადმოწერეთ ოფიციალური ვებსაიტიდან ვირუსებისა და SMS გამოწერების გარეშე.

პროგრამის სახელი:OCR CuneiForm

ვერსია: 12

როზმირ: 33.4 MB

Ენა: Kilka mov ჩათვლით. რუსული

პროგრამის ტიპი: ტექსტის ამოცნობა

ლიცენზია: ვილნა საიდუმლო კოდით

აღწერეთ პროგრამა

OCR CuneiForm-ს შეუძლია ამოიცნოს პრინტერებში შემავალი ყველა შრიფტისა და შრიფტის ბეჭდვა და შრიფტი, მათ შორის დეკორატიული და ხელნაწერი. სისტემა მოიცავს სპეციალურ ალგორითმებს წერტილოვანი მატრიცის პრინტერიდან ტექსტის ამოცნობისთვის, ფაქსების ბინძური ასლები და საბეჭდი ტექსტი.

OCR CuneiForm არის:

  • ამოცნობის მაღალი ინტენსივობა;
  • მუშაობის მაღალი სიჩქარე;
  • ტექსტების ამოცნობა რუსულ, ინგლისურ, შერეულ რუსულ-ინგლისურ, უკრაინულ, გერმანულ, ფრანგულ, ესპანურ, იტალიურ, შვედურ და სხვა ენებზე (სულ 20-ზე მეტი);
  • რობოტი ავტომატური ფრაგმენტაციის რეჟიმში ტექსტის ბლოკების, ცხრილებისა და სურათების მოსაძებნად, აგრეთვე ხელით და ავტომატური ფრაგმენტაციისთვის;
  • ნებისმიერი სტრუქტურის ცხრილის ამოცნობა და დასაკეცი, მათ შორის ხაზოვანი ცხრილის ბადის ჩვენების გარეშე;
  • გამომავალ დოკუმენტში ილუსტრაციების (შავ-თეთრი და ფერადი) და ცხრილის ავტომატური შენახვა;
  • სიუჟეტის ტოპოლოგიის გარე შენახვა;
  • ჯგუფური სკანირებისა და ამოცნობის რეჟიმის მხარდაჭერა;
  • გამოყენების სიმარტივე და ინტუიციური ინტერფეისი, რობოტის ასისტენტები პროგრამით;
  • რობოტებისთვის ტექსტური რედაქტორის დანერგვა ცნობადი ტექსტით;
  • ინფორმაციის ჩვენება სურათები და ამოცნობის შედეგები.

Vikorist სისტემა იყენებს უამრავ უნიკალურ ტექნოლოგიას, მათ შორის ადაპტირებულ ამოცნობას, ნეირონული ქსელები, აღიარების ალტერნატივების კოგნიტური ანალიზი და სხვა.

კვება და კვება პროგრამის მიხედვით

რა არის CuneiForm? CuneiForm არის ოპტიკური ამოცნობის სისტემა უმსხვილესი რუსული საცალო ვაჭრობისგან პროგრამული უზრუნველყოფის უსაფრთხოება Cognitive Technologies, რომელიც უზრუნველყოფს ქაღალდის დოკუმენტების და ელექტრონული გრაფიკული ფაილების, როგორიცაა სკანერები ან ფაქსების, მაღალი ხარისხის დამუშავებას ტექსტის რედაქტირებაში მათთან შემდგომი მუშაობისთვის. ტექსტის რედაქტორები.

ვისთვის არის განკუთვნილი OCR CuneiForm? CuneiForm ტექსტის ამოცნობის სისტემა განკუთვნილია ყველასთვის, ვისაც კომპიუტერში უნდა შეიყვანოს ფაქსები, წიგნები, გაზეთები, საბეჭდი გვერდები, კონტრაქტის ტექსტები და ა.შ. სისტემასთან მუშაობისთვის, უბრალოდ მოათავსეთ გვერდი ტექსტით სკანერში, დააჭირეთ ღილაკს და რამდენიმე წამის შემდეგ დაინახავთ დასრულებულ შედეგს მდიდრულად ფუნქციონალურ ტექსტურ რედაქტორში.

რა შრიფტებს ცნობს OCR CuneiForm, უნდა დაიწყოთ? CuneiForm არის შრიფტისაგან დამოუკიდებელი (OmniFont) სისტემა. CuneiForm-ში ჩასმული ალგორითმები იცავენ ასოების წერის წესებს, მათ ტოპოლოგიას და არ საჭიროებს იდეალებს და სიახლეებს.

სისტემა იყენებს ინტელექტუალურ თვითმართვის ტექნოლოგიას, რომელიც დაფუძნებულია პერსონაჟების ადაპტირებულ ამოცნობაზე.

აღიარებულია ყველა სახის ხელნაწერი შრიფტი - წიგნები, გაზეთები, ჟურნალები, ლაზერული და მატრიცული პრინტერებიდან გამომავალი, ტექსტები ხელნაწერი საბეჭდი მანქანებიდან და ა.შ.

ხელნაწერი ტექსტი და დეკორატიული შრიფტები (გოთური, ხელნაწერი სტილიზაციები) არ არის აღიარებული.

CuneiForm-ს აქვს სპეციალური პარამეტრები წერტილოვანი მატრიცის პრინტერიდან და ფაქსების ამოცნობისთვის 200x100 dpi.

რით განსხვავდება OCR CuneiForm სხვა მსგავსი პროგრამებისგან?

  • აღიარების ხარისხი;
  • მუშაობის მაღალი სიჩქარე;
  • უნიკალური ტექნოლოგიების გამოყენება, როგორიცაა ადაპტური ამოცნობა, ნერვული გაზომვები, ამოცნობის ალტერნატივების კოგნიტური ანალიზი და სხვა;
  • მარტივი მომხმარებლის ინტერფეისი და ინტუიციური ინტერფეისი;
  • ფუნქციური ზედაპირები, დამატებითი შესაძლებლობების სიმდიდრის გამოვლინება.

როგორ უჭერს მხარს OCR CuneiForm მაგიდის რობოტებს?Ისე. პროგრამა ავტომატურად ცნობს ტექსტში სხვადასხვა სტრუქტურის ცხრილებს, მათ შორის ხაზების გარეშე. რედაქტორი მხარს უჭერს ცხრილის რედაქტირებას (შეგიძლიათ შეცვალოთ / გაზარდოთ, წაშალოთ / ჩამოშალოთ სვეტები და ა.შ.)

როგორ შეიძლება OCR CuneiForm განთავსდეს ტექსტში სურათების წინ?Ვიმედოვნებ. თქვენ შეგიძლიათ უბრალოდ უგულებელყოთ მათი ყოფნა, ან შეგიძლიათ შეინახოთ ისინი გამომავალ დოკუმენტში შავ-თეთრ, ნაცრისფერ ან ფერად, თქვენი მსგავსი ბრტყელი ნიმუშით.

Posilannya მოზიდვისთვის

  • გთხოვთ დააინსტალიროთ ვერსია დეპოზიტების ფაილებით.

ინფორმაცია აღებულია პროგრამის ოფიციალური ვებგვერდიდან

დილით ადრეა, ყველა, ვინც ხშირად მუშაობს საოფისე პროგრამებთან, იცავს ჩვეულებრივ დავალებას - სკანირებს ტექსტს წიგნიდან, ჟურნალიდან, გაზეთიდან, უბრალოდ ქაღალდის ნაჭრებიდან და შემდეგ გადააქვს ეს სურათები ტექსტის ფორმატში, მაგალითად, Word-ად. დოკუმენტი.

საჭირო სკანერის მისაღებად, სპეციალური პროგრამატექსტის ამოცნობისთვის. ამ სტატიას აქვს ამბავი FineReader-ის კატის გარეშე ანალოგის შესახებ - CuneiForm(FineReader-ში ამოცნობის შესახებ -).

1. CuneiForm პროგრამების მახასიათებლები, შესაძლებლობები

მისი ჩამოტვირთვა შეგიძლიათ საცალო ვაჭრობის ვებსაიტიდან: http://cognitiveforms.com/

დახურული გამომავალი კოდით ტექსტის ამოცნობის პროგრამა. მანამდე ის ყველასთვის მუშაობს ვინდოუსის ვერსიები: XP, Vista, 7, 8, რაც მახარებს. გარდა ამისა, დაამატეთ პროგრამის ახალი რუსული თარგმანი!

დადებითი:

ტექსტის ამოცნობა მსოფლიოს 20 ყველაზე პოპულარულ ენაზე (ინგლისური და რუსული ბუნებრივად შედის ამ რიცხვში);

დიდი მხარდაჭერა სხვადასხვა ხელის შრიფტებისთვის;

ამოცნობილი ტექსტის გადამოწმება ლექსიკონის გამოყენებით;

მუშაობის შედეგების რამდენიმე ვარიანტში შენახვის შესაძლებლობა;

დოკუმენტის სტრუქტურის შენარჩუნება;

გაფართოებული მხარდაჭერისა და ამოცნობის ცხრილი.

უარყოფითი მხარეები:

არ უჭერს მხარს ზედმეტად დიდ დოკუმენტებსა და ფაილებს (400 dpi-ზე მეტი);

ის პირდაპირ არ უჭერს მხარს რაიმე ტიპის სკანერს (არაუშავს, სკანერის დრაივერებს ასევე მოჰყვება სპეციალური პროგრამა სკანირებისთვის);

დიზაინი არ უნდა იყოს ძალიან მოციმციმე (თუ ეს ვინმეს არ სჭირდება, რადგან პროგრამა გააგრძელებს მსოფლიოში დომინირებას).

2. ტექსტის კონდახის ამოცნობა

1) გახსენით სასურველი სურათი CuineForm პროგრამაში (ფაილი / გახსნა ან „Cntrl + O“).

2) ამოცნობის დასაწყებად, ჯერ უნდა ნახოთ სხვადასხვა სფეროები: ტექსტი, სურათები, ცხრილები და ა.შ. Cuneiform პროგრამა საშუალებას გაძლევთ იმუშაოთ არა მხოლოდ ხელით, არამედ ავტომატურად! ამისათვის დააჭირეთ ღილაკს "განლაგება". ზედა პანელივიკნა.

3) 10-15 წამის შემდეგ. პროგრამა ავტომატურად მონიშნავს ყველა ზონას სხვადასხვა ფერის. მაგალითად, ტექსტის არე ჩნდება ლურჯი ფერით. საუბრის წინ მან ყველა უბანი სწორად და მსუბუქად გაანათა. მართალი გითხრათ, მისგან ასეთი სწრაფი და სწორი რეაქცია არ მინახავს...

4) მათთვის, ვინც არ ენდობა ავტომატურ მარკირებას, შეგიძლიათ სწრაფად და ხელით. ამისთვის არის ინსტრუმენტთა პანელი (დივ. ქვემოთ), რომელიც შეგიძლიათ იხილოთ: ტექსტი, ცხრილი, სურათი. ხელახლა ჩასვით, გადიდეთ/შეცვალეთ კუბის გამოსახულება, მორთეთ კიდეები. ზაგალომი, ჭუჭყიანი ნაკრები.

5) მას შემდეგ რაც ყველა უბანი მონიშნულია, შეგიძლიათ გააგრძელოთ აღიარება. ამისათვის უბრალოდ დააწკაპუნეთ იმავე ღილაკზე, როგორც ქვემოთ მოცემულ სურათზე.

6) ფაქტიურად 10-20 წამში. თქვენს წინ დაინახავთ დოკუმენტს Microsoft wordცნობადი ტექსტით. რა კარგია, ამ მიზნით ტექსტში ბევრი წყალობა იყო, მაგრამ ბევრი არ იყო! ტიმ მეტი, მოდით შევხედოთ რამდენად არასაჩვენებელი იყო, როგორც გამოქვეყნებული მასალა - სურათი.

სიჩქარისა და ბრწყინვალებისთვის შეგიძლიათ დაამარცხოთ FineReader!

3. სურათების ტექსტის ამოცნობა

პროგრამის ეს ფუნქცია შეიძლება გამოგადგეთ, თუ თქვენ გჭირდებათ არა მხოლოდ ერთი სურათის, არამედ ერთი სურათის ამოცნობა. მალსახმობი სერიული ამოცნობის გასაშვებად, დაწყება, "დაწყების" მენიუში.

1) პროგრამის გახსნის შემდეგ დაგჭირდებათ ახალი პაკეტის შექმნა ან შენახვამდე გახსნა. ჩვენი უკანალი სრულიად ახალია.

2) უახლოეს დროში ვაძლევთ სახელს, რათა სწრაფად გამოვიცნოთ რა არის მასში შენახული.

4) ახლა თქვენ უნდა მიუთითოთ საქაღალდე, რომელშიც განთავსებულია ფაილები ამოცნობისთვის. როგორც ითქვა, პროგრამა თავად იპოვის ყველა სურათს და სხვა გრაფიკულ ფაილს, რომელთა ამოცნობა და პროექტში დამატება შეუძლია. თქვენ დაკარგავთ წვდომას თქვენს აპლიკაციებზე.

5) დაწყების თარიღი არ არის მნიშვნელოვანი - თქვენ ირჩევთ რა უნდა იმუშაოთ გამომავალ ფაილებთან ამოცნობის შემდეგ. გირჩევთ, შეამოწმოთ „არაფერს დააზიანო“ ჩამრთველი.

6) აღარ არის შესაძლებელი იმ ფორმატის არჩევა, რომელშიც დოკუმენტი შეინახება. არსებობს რამდენიმე ვარიანტი:

- rtf- ფაილი z word დოკუმენტი, იხსნება ყველა პოპულარულ ოფისში (მათ შორის უნაღდო ოფისში);

- ტექსტი- ტექსტის ფორმატი, მხოლოდ ტექსტის, სურათების და ცხრილების შენახვა შესაძლებელია ამ ფორმატში;

- htm- ჰიპერტექსტის გვერდი, ხელით, სადაც გსურთ საიტის ფაილების სკანირება და ამოცნობა. ეს არის ის, რასაც ჩვენ ვირჩევთ ჩვენს აპლიკაციაში.

მეორეს მხრივ, მას ასევე აქვს გარკვეული უარყოფითი მხარეები.

უპირველეს ყოვლისა, ძალიან ცოტა ინსტრუმენტია შედეგების რედაქტირებისა და შემოწმებისთვის. წინააღმდეგ შემთხვევაში, თუ თქვენ უნდა ამოიცნოთ ბევრი სურათი, მაშინ FineReader-ში უმჯობესია დაუყოვნებლივ წაიკითხოთ მარჯვენა სვეტში ყველაფერი, რაც დაემატა პროექტს: სწრაფად წაშალეთ აპლიკაცია, შეასრულეთ რედაქტირება და ა.შ. და მესამე, სრულიად ბინძურ დოკუმენტებზე, CuneiForm ახორციელებს ამოცნობის საფუძვლიან პროცესს: გონს მოჰყავს დოკუმენტი - შეცდომების გამოსწორება, პუნქტუაციის ნიშნების, შეცდომების და ა.შ.

Სულ ეს არის. და შენ იცი, რომ მე მაინც ვკვდები უფასო პროგრამატექსტის ამოცნობისთვის?

დღეს მე ამოვიცნობ და გასწავლით როგორ ამოიცნოთ ტექსტი სურათებიდან. ასევე მათთვის, ვინც საჭირო იყო პროგრამა ტექსტის ამოსაცნობადქვემოთ შემოგთავაზებთ CuneiForm 12 პროგრამის რუსული ვერსიის გამოყენებას. ახლა კი უფრო დეტალურად აგიხსნით, როგორ მოვიქცეთ მას.

ჯერ კიდევ გჭირდებათ ტექსტების ამოცნობა?

მაგალითად, გთხოვეს დაგეწერათ მტკიცებულება ან ესე, იარეთ ინტერნეტში, მაგრამ სასარგებლო ვერაფერი იპოვეთ. შემდეგ წავედით ბიბლიოთეკაში და ავიღეთ წიგნი მტკიცებულებების თემაზე, მაგრამ წიგნში ბევრი ტექსტი იყო საჭირო და ასეთი დავალება შეიძლება მუდმივად დაგაკავოთ. ღერძი ასეთ სიტუაციებში მოდის სამაშველოში CuneiForm 12 პროგრამასაკმარისია წიგნის საჭირო გვერდების სკანირება, შემდეგ კი სურათებიდან ტექსტის გამოსატანად დამატებითი პროგრამის გამოყენებით. მინდა პატივი ვცე, რომ ყველაფერი მშვიდად მიდის.

ტექსტის ამოცნობის პროგრამა

როგორც ზემოთ დავწერე ჩვენ ვიმუშავებთ CuneiForm 12 პროგრამით.რა ჯობია სხვებს?

  • CuneiForm ფასიანიამაგალითად, ABBYY FineReader პროგრამა ღირს 3990 რუბლი.
  • მუშაობის მაღალი სითხე და აღიარების სიცხადე.
  • ტექსტების ამოცნობა 20 ენაზე, მათ შორის შერეული რუსულ-ინგლისური.
  • მუშაობა პატარებთან და მაგიდებთან.
  • გამოყენების სიმარტივე და ინტუიციური ინტერფეისი.
  • და ასევე გაუმჯობესდა ტექნიკური ასპექტები.

მაგრამ ეს ასევე ცოტათი იგივეა, რადგან ეს არის რუსი საცალო ვაჭრობის პროგრამა, არ ჩანს შესანიშნავი დიზაინი, მაგრამ ჩემთვის ეს ცოტა თავის ტკივილია, შემდეგ ის სწორად ცნობს ტექსტს.

როგორ გამოვიყენოთ CuneiForm 12 პროგრამა

პროგრამის ინსტალაციის შემდეგ გაუშვით CuneiForm 12. თქვენ უნდა შეავსოთ შემდეგი:

  1. აირჩიეთ სურათი, საიდანაც ტექსტი ამოიცნობს.
  2. აირჩიეთ პრინტერი.
  3. ღილაკი "აღმოჩენა".
  4. ღილაკი "შენახვა".

დააჭირეთ პირველ ღილაკს და აირჩიეთ სასურველი სურათი ან გვერდი დასასკანირებლად. შემდეგ ფანჯარაში აირჩიეთ ტექსტი, რომელიც გამოჩნდება თქვენს სურათზე. მიმდინარე პარამეტრები არც ისე მნიშვნელოვანია, შეგიძლიათ დაწვათ ისინი.

აღიარების შემდეგ, თქვენ ალბათ დაგიმთავრდებათ მსგავსი რამ:

ზედა ნაწილში იქნება ცნობადი ტექსტი თვალსაჩინო ნიშნებით, ხოლო ქვემოთ იქნება ხილული სურათი. როგორც ხედავთ, ჩემი სურათი უხეში და არათანაბარი იყო, მაგრამ პროგრამამ ყველაფერი სწორად ამოიცნო. საუბრის წინ, როგორც ხედავთ, პროგრამა გთავაზობთ მიდგომის განვითარების სამ ვარიანტს.

  • გაგზავნეთ რედაქტირებისთვის.
  • დისკზე შენახვა.
  • ექსპორტი Word-ში ან Excel-ში.

დასრულდა, ახლა თქვენ იცით, რა უნდა გააკეთოთ და გაქვთ ტექსტის ამოცნობის პროგრამა თქვენი სკანერისთვის.

CuneiForm არის დოკუმენტების ოპტიკური ტექსტის ამოცნობის პროგრამა ხედების რედაქტირებისას. რობოტული პროგრამების შედეგები შეიძლება რედაქტირდეს საოფისე და ტექსტურ პროგრამებში და შეინახოს პოპულარულ ფორმატებში და მათზე განხორციელდეს სრული ტექსტის ძებნა. თუმცა, Linux-ისთვის არის მხოლოდ კონსოლის ვერსიაპროგრამებში, ბევრად უფრო ადვილია YAGF-ის ფრონტ-ენდთან ერთად მუშაობა.

YAGF ჭურვი - და ა.შ სხვა რაფიკული ront-end for CuneiForm უზრუნველყოფს გრაფიკულ ინტერფეისს კონსოლის ტექსტის ამოცნობის პროგრამისთვის CuneiForm Linux პლატფორმაზე. გარდა ამისა, YAGF საშუალებას გაძლევთ აკონტროლოთ გამოსახულების სკანირება, მათი გადამუშავება და მონაცემთა ამოცნობა ერთი ცენტრიდან. YAGF პროგრამა ასევე ხელს შეუწყობს დიდი რაოდენობით დასკანერებული გვერდების თანმიმდევრულ ამოცნობას.

CuneiForm პროგრამა მუშაობს Ubuntu-ს სტანდარტულ საცავზე და YAGF ღერძი მოითხოვს ერთ-ერთი დამატებითი საცავების დაკავშირებას:

Ppa: alex-p/notealexp deb http://archive.getdeb.net/ubuntu natty-getdeb apps

და დააინსტალირეთ Ubuntu Accessories Center.

YAGF-ის გამოსაყენებლად გჭირდებათ ასპელის მართლწერის შემოწმების პაკეტი და საერთო ენების ლექსიკონები (aspell-en, aspell-ru და ა.შ.). თუ გსურთ სკანირებული სურათების ჩვენება პირდაპირ YAGF-დან, დააინსტალირეთ XSane პროგრამა. ტექსტის ამოცნობისთვის, რა თქმა უნდა, გჭირდებათ CuneiForm პროგრამა.

YAGF-ში მუშაობა რამდენიმე ეტაპისგან შედგება: გვერდებიდან გამოსახულებების (სურათების სერიის) დახატვა; მომზადება აღიარებამდე (საჭიროების შემთხვევაში); აღიარება; შედეგების შენახვა.

დახატე ნახატი

შეგიძლიათ დაათვალიეროთ გამოსახულების ფაილები, შეინახოთ ისინი თქვენს მყარ დისკზე ან ახალი სურათების სკანირება. სურათების გასახსნელად გამოიყენეთ File / Open ბრძანება (შეგიძლიათ გახსნათ რამდენიმე ფაილი ერთდროულად). თქვენ ასევე შეგიძლიათ გადაიტანოთ გრაფიკული ფაილები ბნელ ფონზე პროგრამის მთავარი ფანჯრის მარცხენა მხარეს, რის შედეგადაც ისინი ჩაითვლება პროგრამაში. YAGF მხარს უჭერს ყველა ძირითად რასტრულ გრაფიკულ ფორმატს (JPEG, PNG, BMP, TIFF, GIF, PNM, PPM, PBM და სხვა). ვინ ვარ მე ფარული ფაილიროგორც ჩანს, nameXXX.ext, სადაც XXX არის რიცხვების თანმიმდევრობა, შეგიძლიათ გადახვიდეთ წინა / შემდეგ ფაილზე პანელზე განთავსებული გადახტომის ღილაკების გამოყენებით. შვედური წვდომა. მაგალითად, თუ გახსენით ფაილი MyPage001.jpg, მაშინ როდესაც დააჭერთ ღილაკს შემდეგ სურათზე გადასასვლელად, პროგრამა შეეცდება გახსნას ფაილი MyPage002.jpg.

თქვენ შეგიძლიათ ამოიღოთ სურათები პირდაპირ სკანერიდან დამატებითი XSane პროგრამის გამოყენებით. YAGF-ში ყოფნისას ბრძანება File / Scanuvati. ამოქმედდება XSane პროგრამა. დაარეგულირეთ სკანირების პარამეტრები XSane-ში და დააჭირეთ ღილაკს „სკანირება“. სკანირების დასრულების შემდეგ, დასკანირებული სურათი გამოჩნდება YAGF გამოსახულების ფანჯარაში. თუ სურათის დეკალის სკანირება გჭირდებათ, აირჩიეთ ეს ოპერაციები რამდენჯერმე (ნახვის ფანჯარაში სურათი ღიად კვლავ დასკანირებული იქნება, შეგიძლიათ გადახვიდეთ წინა სურათებზე, ვიკორის ბრძანებები გადატანილია Nya). შეგიძლიათ შეასრულოთ YAGF-ში XSane ფანჯრის დახურვის გარეშე. თუ თქვენი სურათების სკანირება გჭირდებათ, უბრალოდ დააწკაპუნეთ XSane „სკანირების“ ღილაკზე. YAGF-დან გასვლისას გახსენით პროგრამა XSane ფანჯარა ავტომატურად დაიხურება. სხვა სკანირებულ სურათებზე გადასასვლელად გამოიყენეთ ღილაკები სწრაფი წვდომის პანელზე, როგორც ზემოთ აღწერილია. ყველა სურათი ნაჩვენებია შეცვლილი ფორმით გამოსახულების პანელში პროგრამის მთავარი ფანჯრის მარცხენა მხარეს. თქვენ შეგიძლიათ შეინახოთ ეს სურათები ცალკე დირექტორიაში "შენახვის" ღილაკის გამოყენებით.

მოსამზადებელი სურათი

YAGF-ით შეგიძლიათ აირჩიოთ მარტივი ოპერაციები დასკანერებული სურათის მოსამზადებლად: ტექსტის ბლოკის ჩვენება ამოცნობისა და დასაბრუნებლად. თუ გამოსახულება არასწორად არის ორიენტირებული, ის შეიძლება შემოტრიალდეს 90 გრადუსით ან წლის ისრის საწინააღმდეგოდ ან 180 გრადუსით. თქვენ უნდა მოითხოვოთ დამატებითი ღილაკები პანელზე სწრაფი წვდომისთვის ფანჯარაში და დაათვალიეროთ სურათი. თუ გსურთ ამოცნობისთვის გადაიტანოთ არა ყველა დასკანირებული სურათი, არამედ ზოგიერთი მათგანი, შეგიძლიათ იხილოთ ერთი ან რამდენიმე მართკუთხა ბლოკი გამოსახულების ფანჯარაში. თუ დააწკაპუნებთ მაუსის მარცხენა ღილაკზე თავდაპირველ ბლოკზე, მისი ფერი შეიცვლება ვარდისფრად. ახლა აწყობილი ბლოკის ზომა შეიძლება შეიცვალოს ბლოკის კიდეზე სამიზნის „ჩაღვრით“. დააწკაპუნეთ სურათის ფანჯარაზე მარჯვენა ღილაკიმიშა, გამოჩნდი კონტექსტი და არა მენიუ, ამ პარამეტრის გამოყენებით შეგიძლიათ ნახოთ ყველა ნანახი ბლოკი, ნახოთ არჩეული ბლოკი და გაიგოთ არჩეული ბლოკის ტექსტი. ბლოკების დანახვის გასაადვილებლად, შეგიძლიათ შეცვალოთ ან გაზარდოთ სურათის ზომა ხედვის ფანჯარაში (ეს ოპერაცია არ ახდენს გავლენას CuneiForm პროგრამაში გადატანილი სურათის ზომაზე). თქვენ შეგიძლიათ შეცვალოთ გამოსახულების ხილული ზომები კლავიშების Ctrl ++ და Ctrl + - იგივე კომბინაციით ან Ctrl ღილაკით დაჭერილი ქინძისთავები (ასევე შეგიძლიათ შეცვალოთ შრიფტის ზომა ფანჯარაში, რომელსაც მე ვუყურებ ტექსტი).

ვინაიდან პროგრამას აქვს რამდენიმე გვერდი გახსნილი და კანს აქვს საკუთარი ორიენტაცია, მასშტაბი და ბლოკების ხილვადობა, YAGF ამახსოვრებს ამ პარამეტრებს კანის მხარისთვის.

თუ გვერდი სკანირებულია არათანაბრად, ხარვეზით, შეგიძლიათ სცადოთ ხარვეზის გასწორება დახმარებით ახალი ფუნქციები"შეასწორე არასწორი ამბავი." ვისთვისაც დააჭირეთ დამატებით ღილაკს.

აღიარება

ამოცნობის დასაწყებად, თქვენ უნდა აირჩიოთ საჭირო ენის ამოცნობა (ან რამდენიმე ენა, რომელსაც შეუძლია ამოიცნოს რამდენიმე ენაზე დაწერილი დოკუმენტი). CuneiForm-ის ძირითადი ვერსია საშუალებას გაძლევთ ამოიცნოთ ტექსტები ყველა ევროპულ ენაზე, ისევე როგორც ტექსტები რამდენიმე რუსულ-ინგლისურ ენაზე.

როდესაც ახალი აღიარებული ტექსტის ფრაგმენტი (ხედის ბლოკი ან ახალი მხარე) ემატება აღიარებულ ტექსტურ რედაქტორს ახალი აბზაცის სახით.

შედეგად, YAGF ახორციელებს აღიარებული ტექსტის მართლწერის შემოწმებას libaspell-ის გამოყენებით. დარწმუნდით, რომ თქვენს სისტემას აქვს დაინსტალირებული მართლწერის ლექსიკონები თქვენი ადგილობრივი სისტემის ლოკალისთვის და ინგლისურისთვის. თუ გსურთ შეამოწმოთ ტექსტების მართლწერა სხვა ენებზე, დააინსტალირეთ დამატებითი ლექსიკონები. თუ YAGF-მა არ იცის მოცემული ენის ამოცნობისთვის მართლწერის შესამოწმებლად საჭირო ლექსიკონი, პროგრამა მოგცემთ მას. ჩართეთ მართლწერის შემოწმება, თუ არ გსურთ წაშალოთ ასეთი მიღწევები.

თუ თქვენ გჭირდებათ ტექსტის ამოცნობა რამდენიმე სურათიდან, შეგიძლიათ გამოიყენოთ სურათების ამოცნობა სიჩქარისთვის. ამ მიზნით, ყველა სურათი, რომლის ამოცნობაც საჭიროა, უნდა გაიხსნას გამოსახულების პანელში (პროგრამის ფანჯრის მარცხენა მხარეს). დააჭირეთ ღილაკს "აღმოაჩინე ყველა გვერდი". ყველა გახსნილი სურათი ავტომატურად იქნება გადაღებული და ამოცნობილი. როდესაც ეს მოხდება, დიალოგური ფანჯარა გამოჩნდება, რომელიც აჩვენებს ამოცნობის პროგრესს. თქვენ შეგიძლიათ შეაჩეროთ სურათების ამოცნობის პროცესი ღილაკზე „შეწყვეტის“ დაჭერით. თუ ბლოკები ამოიცნობა გვერდებზე, ამოიცნობს მხოლოდ ბლოკების შუაში მდებარე ტექსტს.

შედეგების შენახვა

აღიარებული ტექსტი შეიძლება შეინახოს დისკზე ტექსტის ფორმატში (UTF-8 კოდირება), HTML ფორმატში ან კოპირება ბუფერში. ღილაკი „ტექსტის კოპირება ბუფერში“ აკოპირებს ამოცნობილი ტექსტის ფრაგმენტს ან მთელ ტექსტს, რადგან ყოველდღიური ხედია რედაქტორში, ხედვის ბუფერში.