გამოსახულების ამოცნობის მეთოდები. ნიმუშის ამოცნობის მეთოდები. გამოსახულების ამოცნობის პროგრამები

სურათების ავტომატური ამოცნობის მეთოდები და მათი დანერგვა ოპტიკური სიმბოლოების ამოცნობის სისტემებში (OCR სისტემები) არის ცალი ინტელექტის ერთ-ერთი ყველაზე პროგრესული ტექნოლოგია. ამ ტექნოლოგიის შემუშავებისას რუსები გააგრძელებენ მსოფლიოში წამყვანი პოზიციების დაკავებას.

OCR სისტემა გაგებულია, როგორც სურათების ავტომატურად ამოცნობის სისტემა სპეციალური პროგრამების გამოყენებით ხელნაწერ ან ხელნაწერ ტექსტში სიმბოლოების გამოსახატავად (მაგალითად, კომპიუტერში შეყვანილი სკანერის გამოყენებით) და მისი ტრანსფორმაციის ფორმატში ტექსტის დამმუშავებლების, ტექსტის რედაქტორების დასამუშავებლად. და ა.შ.

აბრევიატურა OCR ასევე ნიშნავს Optical Character Reader - მოწყობილობა ოპტიკური სიმბოლოების ამოცნობის ან ტექსტის ავტომატური წაკითხვისთვის. ნინა კომერციულ ვიკორისტანში ასეთი მოწყობილობები 100 ათასამდე იზრდება. დოკუმენტები მისაღებად.

სამრეწველო საწარმო გადასცემს კარგი და საშუალო ხარისხის დოკუმენტების შეტანას - აღწერის ბლანკების დამუშავებას, საგადასახადო დეკლარაციებს და ა.შ.

ჩვენ განვიხილავთ საგნის არეალის თავისებურებებს, როგორც ჩანს OCR სისტემების პერსპექტივიდან:

  • სიმბოლოების შრიფტი და ზომა;
  • სიმბოლოების გამოსახულების შექმნა (სიმბოლოების გამოსახულებების განვითარება);
  • დამახინჯებები სკანირების საათის ქვეშ;
  • მესამე მხარის ჩანართები სურათებში;
  • ტექსტის ფრაგმენტების შევსება სხვადასხვა ენებით;
  • არსებობს სიმბოლოების კლასის მრავალფეროვნება, რომელთა ამოცნობა შესაძლებელია მხოლოდ დამატებითი კონტექსტური ინფორმაციის არსებობით.

ხელით და ხელნაწერი ტექსტების ავტომატური კითხვა და დაკეცილი სურათების ავტომატური ვიზუალური ამოცნობით. რიცხობრივმა კვლევებმა აჩვენა, რომ ამოცანის უფრო დიდი წარმატებისთვის საჭიროა ინტელექტუალური აღიარება, ანუ „აღიარება შიგნიდან“.

არსებობს სამი პრინციპი, რომელზეც ყველა OCR სისტემაა დაფუძნებული.

  • 1. გამოსახულების მთლიანობის პრინციპი. ობიექტს, რომელსაც იკვლევენ, ყოველთვის აქვს მნიშვნელოვანი ნაწილები, რომელთა შორის არის ხაზები. ნაწილობრივ სურათებზე ლოკალური ოპერაციების შედეგები ინტერპრეტაცია ხდება მხოლოდ ერთხელ მთელი ფრაგმენტების და მთელი სურათის ინტერპრეტაციის პროცესში.
  • 2. პირდაპირობის პრინციპი. ამოცნობა არის ჰიპოთეზების შემუშავებისა და ტესტირების პირდაპირი პროცესი (ძიება იმისა, რაც გამოდის ობიექტიდან).
  • 3. ადაპტაციის პრინციპი. სისტემა, რომელიც აღიარებს, დამნაშავეა საკუთარი თავის მიყენებაში.

სადენიანი რუსული OCR სისტემები: FineReader; FineReader ხელნაწერი; FormReader; CunieForm (შემეცნებითი ტექნოლოგიები), შემეცნებითი ფორმები (კოგნიტური ტექნოლოგიები).

FineReader სისტემა დამზადებულია ABBYY-ის მიერ, რომელიც დაარსდა 1989 წელს. ABBYY-ის კვლევები ტარდება ორ სფეროში: კომპიუტერული მეცნიერება და გამოყენებითი ლინგვისტიკა. სტრატეგიული პირდაპირი სამეცნიერო კვლევა და განვითარება არის ტექნოლოგიის ბუნებრივი მოძრავი ასპექტი მანქანათმცოდნეობის, ხელოვნური ინტელექტისა და გამოყენებითი ლინგვისტიკის სფეროში.

CuneiForm GOLD Windows-ისთვის არის მსოფლიოში პირველი ინტელექტუალური OCR სისტემა, რომელიც მუშაობს თვითმმართველობით, რომელიც იყენებს ადაპტური ტექსტის ამოცნობის ახალ ტექნოლოგიას, რომელსაც მხარს უჭერს მრავალი ადამიანი. კანის ენისთვის მოწოდებულია კონტექსტური გადამოწმებისა და ამოცნობის შედეგების გაუმჯობესების ლექსიკონი. ამოიცნობს პრინტერებიდან ამოღებულ ნებისმიერ ბეჭდვას, საბეჭდ შრიფტს და შრიფტს, ასევე დეკორატიულ და ხელნაწერს, ასევე დაბალმჟავიან ტექსტებსაც კი.

გამოსახულების ამომცნობი სისტემების მახასიათებლები. OCSA ტექნოლოგიებს შორის განსაკუთრებული მნიშვნელობა აქვს გამოსახულების ავტომატური ამოცნობის შემდეგი კლასების დავალებებს:

  • ადამიანები, რომლებიც ეძებენ ფოტოებს;
  • ყავისფერი კოპალინების წინაპრების ძიება და ამინდის პროგნოზირება აეროფოტოგრაფიის მონაცემებისა და სატელიტური სურათების საფუძველზე სინათლის ინტენსივობის სხვადასხვა დიაპაზონში;
  • გამომავალი ინფორმაციისათვის გეოგრაფიული რუქების შედგენა, რომელიც გამოიყენება შემდეგ დავალებაზე;
  • თითების და თვალის მცირე ირისის ანალიზი სასამართლო მეცნიერებაში, უსაფრთხოებისა და სამედიცინო სისტემებში.

ინფორმაციის მომზადებისა და დამუშავების ეტაპზე, განსაკუთრებით საწარმოების კომპიუტერიზაციისა და ბუღალტრული აღრიცხვის ავტომატიზაციის დროს, ჩნდება კომპიუტერზე დიდი რაოდენობით ტექსტური და გრაფიკული ინფორმაციის შეტანა. გრაფიკული ინფორმაციის შეყვანის ძირითადი მოწყობილობებია: სკანერი, ფაქსის მოდემი და ციფრული კამერაც კი. გარდა ამისა, Vikory-ს ტექსტის ამოცნობის ოპტიკურ პროგრამებს ასევე შეუძლიათ კომპიუტერში ტექსტური ინფორმაციის შეტანა (გაციფრულება). ამჟამინდელი პროგრამული და აპარატური სისტემები საშუალებას გაძლევთ ავტომატიზირდეთ დიდი რაოდენობით ინფორმაციის კომპიუტერში შეყვანა, როგორიცაა, მაგალითად, კიდეების სკანერი და ტექსტების პარალელური ამოცნობა რამდენიმე კომპიუტერზე ერთდროულად.

ოპტიკური ტექსტის ამოცნობის პროგრამების უმეტესობა მუშაობს ფაქსის მოდემის, სკანერის, ციფრული კამერის ან სხვა მოწყობილობის საშუალებით გადაღებული რასტრული სურათებიდან. პირველ ეტაპზე, OSYA სისტემამ უნდა დაყოს გვერდი ტექსტის ბლოკებად, მარჯვენა და მარცხენა გასწორების თავისებურებებისა და რამდენიმე სვეტის არსებობის საფუძველზე. ამოცნობის შემდეგ, ბლოკი იყოფა რიგებად. სიმარტივის მიუხედავად, ამოცანა არც ისე აშკარაა, რადგან პრაქტიკაში წაშლისას გარდაუვალია გვერდის გამოსახულების ან მისი ფრაგმენტების დამახინჯება. როგორც წესი, მცირე ძალისხმევაა საჭირო იმისათვის, რომ ერთი რიგის მარცხენა კიდე დაეცეს წინა რიგის მარჯვენა კიდეს ქვემოთ, განსაკუთრებით მწკრივებს შორის მცირე ინტერვალით. შედეგად, ჩნდება მითითებული რიგის პრობლემა, რომელსაც ეკუთვნის გამოსახულების ერთ-ერთი სხვა ფრაგმენტი. მაგალითად, ასოებისთვის

შემდეგ რიგები იყოფა გამოსახულების უწყვეტ უბნებად, რომლებიც წარმოადგენენ შესაბამის ასოებს; ამოცნობის ალგორითმი ეფუძნება ამ უბნების მსგავსებას სიმბოლოებთან და შემდეგ ირჩევს თითოეულ სიმბოლოს, რის შედეგადაც სიმბოლოების მხარე განახლდება ტექსტში, მითითებული ფორმატის მიხედვით. AXIS სისტემებს შეუძლიათ მიაღწიონ ამოცნობის უმაღლეს სიზუსტეს - 99,9%-ზე მეტი ორიგინალური შრიფტებით შედგენილი სუფთა სურათებისთვის. ერთი შეხედვით, ამოცნობის ასეთი სიზუსტე იდეალური ჩანს, მაგრამ პასუხების რაოდენობა მაინც დიდია, რადგან გვერდზე დაახლოებით 1500 სიმბოლოა, მაშინ წარმატებული ამოცნობის მაჩვენებელი 99 .9% იქნება, თითო მხარეს იქნება ერთი ან ორი ჭრა. მას შემდეგ, რაც თქვენ სწრაფად გამოიყენებთ ლექსიკონის შემოწმების მეთოდს, ანუ თუ გარკვეული სიტყვა არ არის სისტემის ლექსიკონში, ის შეეცდება იპოვოთ მსგავსი სიტყვა სპეციალური წესების გამოყენებით. თუმცა ის მაინც არ გაძლევს გადაწყვეტილებების 100%-ით გამოსწორების საშუალებას და შედეგების ადამიანურ კონტროლს მოითხოვს.

ტექსტები, რომლებიც რეალურ ცხოვრებაში ჩნდება, შორს არის საფუძვლიანობისგან და „უწმინდური“ ტექსტების ამოცნობის შეწყალების რაოდენობა ხშირად მიუღებლად დიდია. ბრუტალური გამოსახულებები ყველაზე აშკარა პრობლემაა, რადგან მცირე ლაქებმა შეიძლება დაჩრდილონ სიმბოლოს ორიგინალური ნაწილები ან გადააქციონ ერთი მეორეში. პრობლემა არის არაზუსტი სკანირება, „ადამიანური ფაქტორის“ გამო, რადგან სკანერთან მჯდომ ოპერატორს უბრალოდ არ შეუძლია კანის გასწორება და მისი ზუსტად გასწორება სკანერის კიდეების გასწვრივ. თუ დოკუმენტი გადაღებულია, ხშირად არის პრობლემები სიმბოლოებთან. ამ ეფექტებიდან ნებისმიერმა შეიძლება ხელი შეუშალოს სისტემას, ასე რომ OSY-სისტემების მოქმედებები დაშვებულია ისე, რომ უწყვეტი გამოსახულების არე პასუხისმგებელია იყოს ერთი სიმბოლო. დაზიანებული კორდონებით ან დახრილობით გადამუშავებული მხარე მცირე გაუგებრობას ქმნის სიმბოლურ გამოსახულებებთან, რაც შეიძლება აირიოს AXIS სისტემამ.

OS სისტემის პროგრამული უზრუნველყოფა მუშაობს სკანერიდან აღებული გვერდის დიდი რასტრული სურათებით. გამოყოფის სტანდარტული დონის მქონე სურათები სკანირებს 9600 ppi სიზუსტით. A4 ზომის თაღის გამოსახულება ცალკეული მონაცემებით იკავებს დაახლოებით 1 მბ მეხსიერებას.

OCR სისტემების ძირითადი დანიშნულება მდგომარეობს რასტრული ინფორმაციის (სკანირებული სიმბოლო) ანალიზისა და სიმბოლოს შესაბამისი გამოსახულების ფრაგმენტის მინიჭებაში. OCR სისტემის ამოცნობის პროცესის დასრულების შემდეგ, თქვენ უნდა შეინახოთ გამომავალი დოკუმენტების ფორმატირება, მივანიჭოთ აბზაცის ატრიბუტი საჭირო ადგილს, შეინახოთ ცხრილები, გრაფიკა და ა.შ. PDF.

OCR სისტემებთან მუშაობა, როგორც წესი, არ წარმოადგენს განსაკუთრებულ სირთულეებს. ამ სისტემების უმეტესობას აქვს უმარტივესი ავტომატური რეჟიმი „სკანირება და წაკითხვა“ და ასევე მხარს უჭერს ამოცნობის რეჟიმს ფაილებიდან სურათების ჩვენებისთვის. თუმცა, იმისათვის, რომ მიაღწიოთ საუკეთესო შედეგებს მოცემულ სისტემაში, მნიშვნელოვანია (და ხშირად სავალდებულო) მათი ხელით წინასწარ მორგება კონკრეტული ტიპის ტექსტისთვის, ფორმის განლაგებისა და ქაღალდის ფერისთვის. დაზიანებული კორდონებით ან დახრილობით რეტუშირებული მხარე მცირე გაუგებრობას ქმნის სიმბოლურ გამოსახულებებთან, რაც შეიძლება დაბნეული იყოს OCR სისტემით.

OCR სისტემასთან მუშაობისას ძალზე მნიშვნელოვანია ამოცნობის ტიპისა და მასალის ტიპის შერჩევა (საბეჭდი მანქანა, ფაქსი, წერტილოვანი პრინტერი, გაზეთი და ა.შ.), ასევე მომხმარებლის ინტერფეისის ინტუიციური სიცხადე. ტექსტების ამოცნობისას, რომლებსაც აქვთ მრავალი ენა, ამოცნობის ეფექტურობა დამოკიდებულია ჭკვიან OCR სისტემაზე სიტყვების ჯგუფების ფორმირებისთვის. ამავდროულად, ზოგიერთ სისტემას უკვე აქვს კომბინაციები ყველაზე ხშირად გამოყენებული ენებისთვის, მაგალითად რუსული და ინგლისური.

ამ დროისთვის არსებობს უსახური პროგრამა, რომელიც ხელს უწყობს ტექსტის ამოცნობას, როგორც ერთ-ერთ შესაძლებლობას. ამ ტენდენციის ლიდერია FineReader სისტემა. პროგრამის დარჩენილი ვერსია (6.0) შეიცავს FineReader 6.0 ტექნოლოგიაზე დაფუძნებული ახალი სისტემების განვითარების ფუნქციებს. FineReader 6.0 ოჯახი მოიცავს: FineReader 6.0 Professional სისტემა, FineReader 6.0 Corporate Edition, FineReader Scripting Edition 6.0 და FineReader Engine 6.0. FineReader 6.0 სისტემას, გარდა იმისა, რომ იცის შენახვის მრავალი ფორმატი, მათ შორის PDF, შეუძლია პირდაპირ ამოიცნოს PDF ფაილები. ახალი ტექნოლოგია Intelligent Background Filtering (ინტელექტუალური ფილტრაციის ფონი) გაძლევთ საშუალებას იხილოთ ინფორმაცია დოკუმენტის ტექსტურის და სურათის ფონის ხმაურის შესახებ: ზოგჯერ დოკუმენტში ტექსტის ხილვადობისთვის არჩეულია ნაცრისფერი ან ფერადი ფონი. ხალხს კითხვა არ აინტერესებს, მაგრამ ორიგინალური ტექსტის ამოცნობის ალგორითმები სერიოზულ სირთულეებს განიცდიან ასეთ ფონზე დაწერილ ასოებთან მუშაობისას. FineReader პროგრამას შეუძლია დანიშნოს ზონები მსგავსი ტექსტის განსათავსებლად, დამხმარე ტექსტი დოკუმენტის ფონზე, მნიშვნელოვანი წერტილები, რომელთა ზომა ერთი ზომით ნაკლებია და დამატებითი. ამ შემთხვევაში, ასოების კონტურები შენარჩუნებულია, ხოლო ფონის წერტილები, რომლებიც მჭიდროდ შეესაბამება ამ კონტურებს, არ იწვევს დამახინჯებას, რითაც არღვევს ტექსტის ამოცნობის სიცხადეს.

თანამედროვე განლაგების პროგრამების შესაძლებლობების გათვალისწინებით, დიზაინერები ხშირად ქმნიან დასაკეცი ფორმის ობიექტებს, როგორიცაა არასწორი სურათის შეფუთვა მდიდარი სვეტოვანი ტექსტით. FineReader 6.0 სისტემა მხარს უჭერს ასეთი ობიექტების ამოცნობას და მათ შენახვას ფაილებში MS Word ფორმატში. ახლა დასაკეცი დოკუმენტები ზუსტად შეიქმნება ტექსტურ რედაქტორში. ეს ცხრილები აღიარებულია მაქსიმალური სიზუსტით, ყველა რედაქტირების შესაძლებლობის შენარჩუნებით.

ABBYY FormReader სისტემა არის ABBYY-ის ამოცნობის ერთ-ერთი პროგრამა, რომელიც დაფუძნებულია ABBYY FineReader Engine სისტემაზე. ეს პროგრამა შექმნილია ფორმების ამოცნობისა და დამუშავებისთვის, რომელთა შევსება შესაძლებელია ხელით. ABBYY FormReader პროგრამას შეუძლია შექმნას ფორმები ფიქსირებული სქემით, ისევე როგორც ფორმები, რომელთა სტრუქტურა შეიძლება შეიცვალოს. აღიარებისთვის, ჩვენ გამოვიყენეთ ახალი ABBYY FlexiForm ტექნოლოგია.

პროგრამული უზრუნველყოფის წამყვან მწარმოებლებს აქვთ ლიცენზირებული რუსული საინფორმაციო ტექნოლოგიები თავიანთი პროდუქტებისთვის. პოპულარული პროგრამული პაკეტები Corel Draw (Corel Corporation), FaxLine/OCR & Business Card Wizard (Inzer Corporation) და მრავალი სხვა აღჭურვილია CuneiForm OCR ბიბლიოთეკით. ეს პროგრამა გახდა პირველი OCR სისტემა რუსეთში, რომელმაც ამოიღო MS Windows თავსებადი ლოგო.

Readiris Pro 7 სისტემა არის პროფესიონალური ტექსტის ამოცნობის პროგრამა. გამომცემლების თქმით, ეს OCR სისტემა ანალოგებისგან გამოირჩევა ორიგინალური (წერილობითი) დოკუმენტების დამუშავების უმაღლესი სიზუსტით, როგორიცაა ფურცლები, ფაქსები, ჟურნალის სტატიები, გაზეთების ამონაწერები, რედაქტირებისთვის ხელმისაწვდომი ობიექტები (ძირითადი ფაილები PDF ფორმატში). . პროგრამის მთავარი უპირატესობებია "მაქსიმალურად" შეკუმშული სურათების მეტ-ნაკლებად ზუსტად ამოცნობის შესაძლებლობა (სიკაშკაშის მაქსიმალური დაკარგვით) JPEG ფორმატის გამოყენებით, ციფრული კამერების მხარდაჭერა და გვერდის ავტომატური ორიენტაციის მხარდაჭერა, მხარდაჭერა 92 მ-მდე ch რუსული. ).

OmniPage 11 სისტემა არის ScanSoft-ის პროდუქტი. პროგრამული უზრუნველყოფის ვერსია განახლებულია (OmniPage 11 Limited Edition, OmniPage Lite), ასე რომ, ის ჩართული იქნება ახალ სკანერებთან (ევროპასა და აშშ-ში). მკვლევარები ადასტურებენ, რომ ეს პროგრამა პრაქტიკულად ცნობს სხვა დოკუმენტებს 100% სიზუსტით, განაახლებს მათ ფორმატირებას, მათ შორის სვეტებს, ცხრილებს, ტრანსფერებს (სიტყვების ნაწილების გადატანის ჩათვლით), სათაურებს, სექციების სახელებს, ხელმოწერებს, გვერდების ნომრებს, ღვინოებს, აბზაცებს, დანომრილ სიებს. , წითლების რიგები, გრაფიკები და პატარები. Microsoft Office, PDF და 20 სხვა ფორმატში შენახვის, PDF ფაილების ამოცნობის და ამ ფორმატში რედაქტირების შესაძლებლობა. დაზვერვის სისტემა საშუალებას გაძლევთ ავტომატურად აღმოაჩინოთ და გამოასწოროთ შეცდომები პირველი ხელით შესწორების შემდეგ. ახალი, სპეციალურად შემუშავებული პროგრამული მოდული Dcspeckle საშუალებას გაძლევთ ამოიცნოთ დოკუმენტები დაკარგული მეხსიერებით (ფაქსები, ასლები, ასლების ასლები და ა.შ.). პროგრამის უპირატესობაა ფერადი ტექსტის ამოცნობისა და ხმით მორგების შესაძლებლობა. OmniPage ვერსია ხელმისაწვდომია Macintosh კომპიუტერებისთვის.

  • Div: ბაშმაკოვი A.I., Bashmakov I. ა.ინტელექტუალური საინფორმაციო ტექნოლოგიები.

ადვილია თქვენი ფულის გაგზავნა რობოტზე ბაზაზე. Vikorist ქვემოთ მოცემული ფორმა

სტუდენტები, ასპირანტები, ახალგაზრდები, რომლებსაც აქვთ ძლიერი ცოდნის ბაზა ახალ სამუშაოზე, კიდევ უფრო მადლობელი იქნებიან თქვენი.

გამოქვეყნდა http://www.allbest.ru/

რუსეთის ფედერაციის განათლებისა და მეცნიერების სამინისტრო

ნოვოსიბირსკის ეკონომიკისა და მენეჯმენტის სახელმწიფო უნივერსიტეტი "NINH"

ინფორმაციისა და ტექნოლოგიების ფაკულტეტი

გამოყენებითი საინფორმაციო ტექნოლოგიების დეპარტამენტი

დისციპლინიდან Fuzzy Logic და Neural Measurements

გამოსახულების ამოცნობა

პირდაპირ: ბიზნეს ინფორმატიკა (ელექტრონული ბიზნესი)

P.I.B. სტუდენტი: მაზური კატერინა ვიტალიივნა

ხელახლა გადამოწმებული: პავლოვა განნა ილარიონივნა

ნოვოსიბირსკი 2016 წელი

  • შედი
  • 1. აღიარების ცნება
    • 1.1 განვითარების ისტორია
    • 1.2 გამოსახულების ამოცნობის მეთოდების კლასიფიკაცია
  • 2. გამოსახულების ამოცნობის მეთოდები
  • 3. მთავარი მახასიათებელია მათი ტიპების გამოსახულებების ამოცნობა
  • 4. გამოსახულების ამოცნობის განვითარების პრობლემები და პერსპექტივები
    • 4.1 სურათების ამოცნობა პრაქტიკულია
  • ვისნოვოკი

შედი

ამ შემაშფოთებელ საათამდე, სურათების ამოცნობა მხოლოდ ბიოლოგიური თვალსაზრისით იყო დანახული. ამ შემთხვევაში, მახასიათებლები ძალიან მკაფიო იყო ფუნქციონირების მექანიზმის აღსაწერად.

შემოიღო მ. ვინერმა მე-20 საუკუნის დასაწყისში კიბერნეტიკა(მეცნიერება ფუძემდებლური კანონების შესახებ, რომლებიც მართავს მანქანებში, ცოცხალ ორგანიზმებსა და ურთიერთობებში ინფორმაციის კონტროლისა და გადაცემის პროცესებს) საკვების მეცნიერებაში სხვადასხვა მეთოდების შემუშავების საშუალება მისცა. ასე რომ, გამოავლინეთ ეს პროცესი (არსებითად ბუნებრივი მოვლენა) მათემატიკური მეთოდების გამოყენებით.

ნიმუშების ამოცნობის თეორია კიბერნეტიკის ერთ-ერთი მთავარი ტოტია, როგორც თეორიული, ასევე გამოყენებითი. ამრიგად, გარკვეული პროცესების ავტომატიზაცია გადადის მოწყობილობების შექმნაზე, რომლებიც რეაგირებენ გარემოს მახასიათებლებზე მთელი რიგი დადებითი რეაქციებით.

ასეთი დონის უმაღლესი ამოცანის საფუძველია სტატისტიკური გადაწყვეტილებების კლასიკური თეორიის შედეგები. ამ ჩარჩოში იყო კლასისთვის მინიჭებული ალგორითმები, სანამ შესაძლებელი გახდა ობიექტის შეყვანა, რომლის ამოცნობაც შესაძლებელი იყო.

ამ ნაშრომის მიზანია გავეცნოთ ნიმუშების ამოცნობის თეორიის ცნებებს: გამოვავლინოთ ძირითადი მნიშვნელობები, წაიკითხოთ ამოცნობის ისტორია, ნახოთ თეორიის ძირითადი მეთოდები და პრინციპები.

აქტუალობა მდგომარეობს იმაში, რომ ამ დროისთვის სურათების ამოცნობა კიბერნეტიკის ერთ-ერთი წამყვანი მიმართულებაა. ამრიგად, დარჩენილი ბედი არის უფრო და უფრო მეტი სტაგნაციის დანახვა: ეს გაამარტივებს ადამიანებსა და კომპიუტერებს შორის ურთიერთქმედებას და შექმნის ცვლილებებს ხელოვნური ინტელექტის სხვადასხვა სისტემების სტაგნაციაში.

zastosuvannya-ს ამოცნობის სურათი

1. აღიარების ცნება

დიდი ხნის განმავლობაში, აღიარების პრობლემა მიიპყრო გამოყენებითი მათემატიკის მკვლევართა უმეტესობის ყურადღება. შედეგად შეიქმნა რ.ფიშერის ნამუშევარი 20-იანი წლების როკი, განაპირობა დისკრიმინაციული ანალიზის ჩამოყალიბება - ნიმუშის ამოცნობის თეორიისა და პრაქტიკის ერთ-ერთი განშტოება. 40-იანი წლების როკია.ნ.კოლმოგოროვმა და ა.ია ხინჩინმა დააყენეს მეტა ორი განყოფილების ჯამის შესახებ. Და ში 50-60-იანი წლებიმეოცე საუკუნის ქანები სტატისტიკური გადაწყვეტილებების რობოტული თეორიის დიდი რაოდენობით საფუძველზე. კიბერნეტიკის ფარგლებში დაიწყო ახალი მიმართულებების გაჩენა, რომლებიც დაკავშირებულია თეორიული საფუძვლების შემუშავებასთან და მექანიზმების პრაქტიკულ დანერგვასთან, აგრეთვე ობიექტებისა და პროცესების ამოცნობის სისტემებისთვის. ახალმა დისციპლინამ მიიღო სახელი "გამოსახულების ამოცნობა".

გამოსახულების ამოცნობა(ობიექტები) - ობიექტის იდენტიფიკაციის მითითებით მის გამოსახულებაში (ოპტიკური ამოცნობა), აუდიო ჩანაწერი (აკუსტიკური ამოცნობა) ან სხვა მახასიათებლები. გამოსახულება- ეს არის კლასიფიკაციური დაჯგუფება, რომელიც საშუალებას გაძლევთ გააერთიანოთ ობიექტების ჯგუფი გარკვეული ნიშნების მიღმა. გამოსახულებები დამახასიათებელია ბრინჯისთვის, მაგრამ ერთი სიმრავლისგან გამოვლინებების საბოლოო რაოდენობის გაცნობიერების შემთხვევაში, შესაძლებელია მისი წარმომადგენლების დიდი რაოდენობის ამოცნობა. კლასიკურ წარმოებაში უპიროვნების ამოცნობის ამოცანა ნაწილებად იყოფა.

ერთ-ერთი ძირითადი მნიშვნელობა ასევე არის კონცეფცია გამრავლებაკომპიუტერს არ აქვს პიროვნება - ეს არის მსგავსი ელემენტების ნაკრები, რომლებიც არ მეორდება. „არა-განმეორებადი“ ნიშნავს, რომ სიმრავლის ელემენტი არის ან e ან არა. უნივერსალური მულტიპლიკატორი მოიცავს ყველა შესაძლო ელემენტს ცარიელის გარეშე.

ელემენტის ნებისმიერ სურათზე მიტანის ტექნიკას ე.წ ვირტუალური წესი.კიდევ ერთი მნიშვნელოვანი გაგება - მეტრიკა- ეს ნიშნავს სიმრავლის ელემენტებს შორის დგომას. რაც უფრო ნაკლებს უყურებთ, მით მეტი მსგავსი საგნები (სიმბოლოები, ბგერები და ა.შ.) ამოსაცნობია ჩვენთვის. ნაგულისხმევად, ელემენტები განისაზღვრება როგორც რიცხვების ნაკრები, ხოლო მეტრიკა განისაზღვრება როგორც ფუნქცია. გამოსახულების გამოსახულების არჩევანი და მეტრიკის დანერგვა განსაზღვრავს რობოტული პროგრამების ეფექტურობას: თუმცა, ამოცნობის ახალი ალგორითმი სხვადასხვა მეტრიკებით იზომება სხვადასხვა სიხშირეზე.

ნავჩანნიამდავარქვათ ტრანსფორმაციის პროცესს მოცემულ სისტემაში და სხვა რეაქციებს გარე მსგავსი სიგნალების ფაქტორებზე, რაც იწვევს მათ სისტემაში მრავალჯერ შეღწევას. ეგოიზმისამწუხაროა, რომ დამატებითი ინფორმაცია სისტემის რეაქციის შესახებ აქ არ არის მოწოდებული.

კონდახები გამოსახულების ამოცნობისთვის:

მწერლების აღიარება;

შტრიხკოდის ამოცნობა;

ავტომობილის სანომრე ნიშნების ამოცნობა;

სხვა ბიომეტრიული მონაცემების გარეგნობის ამოცნობა;

ენის ამოცნობა და ში.

1.1 ისტორია განვითარება

50-იანი წლების შუა ხანებამდე რ. პენროუზი ეჭვქვეშ აყენებდა ტვინის ნევროლოგიურ მოდელს, რაც მიუთითებს კვანტური მექანიკური ეფექტების მნიშვნელოვან როლზე მის ფუნქციონირებაში. ამის საფუძველზე ფ.როზენბლატმა შეიმუშავა ვიზუალური გამოსახულების ამოცნობის განვითარების მოდელი, რომელსაც პერცეპტრონი ეწოდება.

მალიუნოკი1 - პერცეპტრონის წრე

შემდეგ გამოიგონეს სხვა სახის პერცეპტრონი და ნეირონების ფუნქცია გართულდა: ნეირონებს შეეძლოთ არა მხოლოდ შეყვანილი რიცხვების გამრავლება და შედეგის ზღვრული მნიშვნელობების გათანაბრება, არამედ მათთან მიმართებაში ფუნქციების შედგენა. Baby 2 აჩვენებს ერთ-ერთ ამ განლაგებას:

Პატარა 2 ნერვული წრედის სქემა.

გარდა ამისა, ნერვული ქსელის ტოპოლოგია შეიძლება კიდევ უფრო რთული იყოს. მაგალითად, ასე:

Malyunok 3 - როზენბლატის ნერვული წრედის დიაგრამა.

ნერვული გაზომვები, როგორც რთული ობიექტი მათემატიკური ანალიზისთვის სათანადო ანალიზით, შესაძლებელი გახადა მონაცემთა ძალიან მარტივი კანონების პოვნა. თუმცა, მისი სარგებლიანობა ამავე დროს არის პოტენციური სარგებლის წყარო. ანალიზის სირთულეები, ზოგადად, აიხსნება რთული სტრუქტურით და, შედეგად, სხვადასხვა ნიმუშების იდენტიფიცირების პრაქტიკულად ამოუწურავი შესაძლებლობებით.

1.2 კლასიფიკაციამეთოდებიაღიარებასურათები

როგორც უკვე აღვნიშნეთ, გამოსახულების ამოცნობა არის რეალურ ან იდეალურ სამყაროში ობიექტების არსებულ გამოსახულება-მოდელებს შორის ეკვივალენტური ხაზების დადგენის პროცესი.

ეს შენიშვნები მიუთითებს იმ ობიექტების შესაბამისობაზე, რომლებიც აღიარებულია ნებისმიერ კლასებთან, რომლებიც განიხილება დამოუკიდებელ დამოუკიდებელ ერთეულებად.

როდესაც ამოცნობის ალგორითმები გააქტიურებულია, ეს კლასები შეიძლება მიენიჭოს მკვლევარს, რომელიც აფასებს მონაცემებს და უზრუნველყოფს დამატებით ინფორმაციას ობიექტების მსგავსებისა და განსხვავების შესახებ მათ ამოცანებს. ამ შემთხვევაში ისაუბრეთ „მასწავლებელთან სწავლაზე“. წინააღმდეგ შემთხვევაში, მაშინ. თუ ავტომატური სისტემა ასრულებს კონკრეტულ კლასიფიკაციას დამატებითი ინფორმაციის მოპოვების გარეშე, ჩვენ ვსაუბრობთ „აღიარებაზე მასწავლებლის გარეშე“.

რობოტებში V.A. დიუკი იძლევა აკადემიურ მიმოხილვას ამოცნობის მეთოდების შესახებ და ხაზს უსვამს ცოდნის წარმოდგენის ორ ძირითად გზას:

ინტენსიური (როგორც ატრიბუტებს შორის კავშირის სქემები);

ვრცლად დამატებითი კონკრეტული ფაქტებისთვის (ობიექტები, აპლიკაციები).

ინტენსიური მანიფესტაციები ასახავს შაბლონებს, რომლებიც ხსნის მონაცემთა სტრუქტურას. უმეტეს სადიაგნოსტიკო ამოცანებში, ასეთი ფიქსაცია მდგომარეობს ობიექტის ნიშნებზე დანიშნულ ოპერაციებში, რაც იწვევს სასურველ შედეგს. ინტენსიური გამოვლინებები რეალიზდება მნიშვნელობებზე ოპერაციების და კონკრეტულ ობიექტებზე გადაცემის ოპერაციების საშუალებით.

თავისებურად, ფართოდ გამოვლენილი ცოდნა ასოცირდება საგნის არეალში კონკრეტული ობიექტების აღწერასა და ფიქსაციასთან და ხორციელდება ოპერაციებში, რომელთა ელემენტებია ობიექტები, როგორც დამოუკიდებელი სისტემა.

ასევე, ამოცნობის მეთოდების კლასიფიკაციის საფუძველი, შემოთავაზებული ვ.ა. ჰერცოგი, არსებობს ფუნდამენტური კანონები, რომლებიც საფუძვლად უდევს ადამიანის სწავლის პრინციპს. მიზანშეწონილია ამ განყოფილების განთავსება სპეციალურ მდგომარეობაში სხვა ნაკლებად ცნობილ კლასიფიკაციებთან შედარებით, რომლებიც ამის საფუძველზე ცალმხრივად და არათანმიმდევრულად გამოიყურება.

2. მეთოდებინიმუშის ამოცნობა

უხეში ძალის მეთოდი.ეს მეთოდი ეფუძნება მონაცემთა ბაზების ფართო სპექტრს, სადაც კანის ობიექტები წარმოდგენილია გამოსახულების მოდიფიკაციის სხვადასხვა ვარიანტებით. მაგალითად, სურათების ოპტიკური ამოცნობისთვის შეგიძლიათ გამოიყენოთ სხვადასხვა ჭრილების, მასშტაბების, სახსრების, დეფორმაციების და ა.შ. დახარისხების მეთოდი. კვირტი. ასოებისთვის შეგიძლიათ აირჩიოთ შრიფტი სიმძლავრის მიხედვით. მას შემდეგ, რაც ხმის სურათების ამოცნობა გარკვეულ ნაცნობ შაბლონებს ჰგავს (სიტყვა, რომელსაც ბევრი ადამიანი აღიარებს). შემდეგი, ჩატარდება სურათის მახასიათებლების უფრო ღრმა ანალიზი. ოპტიკური ამოცნობის შემთხვევაში შეიძლება განისაზღვროს გეომეტრიული მახასიათებლები. ამ ტიპის ხმის ხელმოწერა ექვემდებარება სიხშირის და ამპლიტუდის ანალიზს.

შეურაცხმყოფელი მეთოდი - ვიკორისტანია ცალი ნეირონული ბადეებით(INS). ეს დამოკიდებულია ან ამოცნობის ამოცანის აპლიკაციების დიდ რაოდენობაზე, ან ნერვული ქსელის სპეციალურ სტრუქტურაზე, რომელიც აკმაყოფილებს ამ ამოცანის სპეციფიკას. ეს მეთოდი ხასიათდება მაღალი ეფექტურობითა და პროდუქტიულობით.

მეთოდები, რომლებიც ეფუძნება ნიშნის მნიშვნელობების ქვედანაყოფების სისქის შეფასებებს. სტატისტიკური გადაწყვეტილებების კლასიკურ თეორიაზე დაყრდნობით, რომელიც კვლევის ობიექტად განიხილება, როგორც ცვლადი მნიშვნელობების ფართო სპექტრის განხორციელება, სივრცეში განაწილებული, როგორც რაიმე კანონის ნიშანი. ისინი ეფუძნება ბაიესის სქემას გადაწყვეტილების მისაღებად, რომელიც მიმართავს იმავე ნიშნის ქვეშ მყოფი საგნების სხვა კლასის ინტელექტუალური სუბსტანციების კუთვნილების უხეში დარწმუნებით.

ნიშნის მნიშვნელობის ქვედანაყოფის სიძლიერის შეფასებაზე დაფუძნებული მეთოდების ჯგუფი შეიძლება მჭიდროდ იყოს დაკავშირებული დისკრიმინაციული ანალიზის მეთოდებთან. ბაიესის მიდგომა, სანამ გადაწყვეტს გამოიყენოს ყველაზე დეტალური პარამეტრული მეთოდები თანამედროვე სტატისტიკაში, რისთვისაც დაცულია გაყოფის კანონის ანალიტიკური გამოხატულება (ნორმალური კანონი) და მოითხოვს მცირე შეფასებას. და წვდომის მატრიცები). ამ მეთოდის ძირითადი სირთულეები არის ყველა საწყისი შერჩევის დამახსოვრების აუცილებლობა პოპულაციის შეფასების გამოსათვლელად და მაღალი მგრძნობელობა თავდაპირველი შერჩევის წინ.

მეთოდები, რომლებიც ეფუძნება ვარაუდებს გლობალური ფუნქციების კლასის შესახებ. ამ ჯგუფში მნიშვნელოვანია იცოდეთ ფუნქციის ძირითადი ფუნქციისა და ამოცანების ტიპი და მისი შესაძლებლობები. საწყისი თანმიმდევრობიდან გამომდინარე, იპოვეთ ოპტიმალური სიახლოვე უმაღლეს ფუნქციასთან. ძირითადი წესის ფუნქციონირება აუცილებლად უნდა იყოს მიბმული წყალობასთან. მეთოდის მთავარი უპირატესობა არის ამომცნობი ამოცანის მათემატიკური ფორმულირების სიცხადე. ობიექტის ბუნების შესახებ ახალი ცოდნის მიღების შესაძლებლობა, კერძოდ, ატრიბუტების ურთიერთქმედების მექანიზმების შესახებ ცოდნა, აქ ფუნდამენტურად არის გარშემორტყმული ურთიერთქმედების მოცემული სტრუქტურით, რომელიც ფიქსირდება ძირითადი ფუნქციების შერჩეულ ფორმაში.

პროტოტიპთან გასწორების მეთოდი. ეს არის ამოცნობის ყველაზე მარტივი პრაქტიკული გაფართოებული მეთოდი. ის სტაგნაცია ხდება იმ შემთხვევაში, თუ კლასები, რომლებიც აღიარებულია, კომპაქტურ გეომეტრიულ კლასებად გამოიყურება. წერტილის მსგავსად, პროტოტიპისთვის შეირჩევა გეომეტრიული დაჯგუფების ცენტრი (ან ცენტრთან ყველაზე ახლოს მდებარე ობიექტი).

დაუსახელებელი ობიექტის კლასიფიკაციისთვის, ნაპოვნია უახლოესი პროტოტიპი და ობიექტი მიეკუთვნება იმავე კლასს, როგორიც არის. ცხადია, ეს მეთოდი არ იძლევა ჩვეულებრივ ფორმალიზებულ სურათებს. როდესაც შედიხართ, შეიძლება იყოს სხვადასხვა ტიპის სადგურები.

K უახლოესი მეზობლების მეთოდი. მეთოდი ემყარება იმ ფაქტს, რომ უცნობი ობიექტის კლასიფიკაციისას გვხვდება გეომეტრიულად უახლოესი სივრცის მოცემული რიცხვი (k) და სხვა უახლოესი მეზობლები, რომლებსაც უკვე ცნობილია თითოეული კლასის კუთვნილება. უცნობი ობიექტის შემოტანის შესახებ გადაწყვეტილებები მიიღება ახლომდებარე მეზობლების ინფორმაციის ანალიზით. საწყის ნიმუშში ობიექტების რაოდენობის შემცირების აუცილებლობა (დიაგნოსტიკური პრეცედენტები) საკმარისი არ არის ამ მეთოდისთვის, მაგრამ ის ცვლის საწყისი ნიმუშის წარმოდგენას.

გამომდინარე იქიდან, რომ სხვადასხვა ამოცნობის ალგორითმები განსხვავებულად ვლინდება ერთსა და იმავე შერჩევაზე, არსებობს წესი სინთეზური წესის შესახებ, რომელიც ხელს შეუწყობს ყველა ალგორითმის სიძლიერეს. და სწორედ ამიტომ არსებობს სინთეზური მეთოდი და ზოგადი წესების ჯგუფი, რათა მიიღოთ კანის ყველაზე დადებითი მხარე მეთოდებიდან.

ამოცნობის მეთოდების მიმოხილვის დასრულების შემდეგ, წარმოვიდგინოთ არსი, რაც შედის ცხრილში და დავამატოთ სხვა პრაქტიკული მეთოდები.

ცხრილი 1. აღიარების მეთოდების კლასიფიკაციის ცხრილი, მათი სტაგნაციის არეების ნიველირება და დემარკაცია

ამოცნობის მეთოდების კლასიფიკაცია

Galuz zastosuvannya

Obmezhennya (ნაკლოვანებები)

ამოცნობის ინტენსიური მეთოდები

სისქის შეფასების საფუძველზე დაფუძნებული მეთოდები

შენახვა ცნობილი განყოფილებით (ნორმალური), დიდი სტატისტიკის ნაკრების საჭიროება

ამოცნობის დროს ყველა საწყისი შერჩევის დალაგების აუცილებლობა, მაღალი მგრძნობელობა საწყისი შერჩევისა და არტეფაქტების არაწარმომადგენლობით

ტროტუარებზე ჩამოსხმის მეთოდები

მოითხოვეთ თქვენი დანაშაული, მაგრამ კეთილად განშორდით

ვირუსული ფუნქციის ადრე ცნობილი ტიპია დამნაშავე. ნიშნების კორელაციის შესახებ ახალი ცოდნის გაგების შეუძლებლობა

ლოგიკური მეთოდები

ქონება მცირე ზომისაა

ლოგიკური წესების შერჩევისას აუცილებელია ჩამოთვლა. შრომის მაღალი ინტენსივობა

ლინგვისტური მეთოდები

გრამატიკის წინასწარ არსებული მნიშვნელობა ემყარება მრავალ განმარტებას (ობიექტების აღწერილობას), რაც მნიშვნელოვანია ფორმალიზებისთვის. თეორიული პრობლემების არარსებობა

ამოცნობის ფართო მეთოდები

პროტოტიპის შესატყვისი მეთოდი

მცირე ზომის ფართობი ფართო ნიშნით

კლასიფიკაციის შედეგების უმეტესობა ეფუძნება მეტრიკას. ოპტიმალური მეტრიკის უცნობი

K უახლოესი მეზობლების მეთოდი

კლასიფიკაციის შედეგების უმეტესობა ეფუძნება მეტრიკას. ამოცნობის საათამდე საწყისი შერჩევის სრული ძიების საჭიროება. სირთულის გამოთვლა

შეფასებების გამოთვლის ალგორითმები (AVO)

მცირე ზომის პროდუქტები კლასებისა და სიმბოლოების რაოდენობის გამო

p align="justify"> კლასიფიკაციის შედეგების დამოკიდებულება მეტრიკაზე. ამოცნობის საათამდე საწყისი შერჩევის სრული ძიების საჭიროება. მეთოდის მაღალი ტექნიკური სირთულე

ვირტუალური წესების კოლექტივები (KRP) – სინთეზური მეთოდი.

მცირე ზომის პროდუქტები კლასებისა და სიმბოლოების რაოდენობის გამო

არსებობს მეთოდის ძალიან მაღალი ტექნიკური სირთულე, დაბალი თეორიული პრობლემების ნაკლებობა, როგორც კერძო მეთოდების კომპეტენციის სფეროებში, ასევე თავად კერძო მეთოდებში.

3. მთავარი მახასიათებელია მათი ტიპების გამოსახულებების ამოცნობა

ამოცნობის სისტემის ძირითადი სტრუქტურა ბავშვის ჩვენების ამ ეტაპზე 4:

მალიუნოკი 4 - აღიარების სისტემის სტრუქტურა

მოსამზადებელ აღიარებას შეიძლება ჰქონდეს შემდეგი დამახასიათებელი ეტაპები:

გამომავალი მონაცემების ტრანსფორმაცია ამოსაცნობად ხელით ფორმად;

ამოცნობა (სიმღერის კლასისთვის ობიექტის იდენტურობის მითითება).

ამ ველებში შეგიძლიათ შეიყვანოთ მსგავსი ობიექტების ცნებები და ჩამოაყალიბოთ წესების ნაკრები, რომლის მიხედვითაც ობიექტები დაზღვეულია ერთი კლასისთვის.

ამრიგად, თქვენ შეგიძლიათ იმუშაოთ აპლიკაციების ნაკრებით, რომელთა კლასიფიკაცია, რომელთა ტიპებისა და ტიპის ამოცანების აღწერილობა შეიძლება ეცნობოს ამოცნობის ალგორითმს, ამოცანის რეგულირებისთვის პროცესის დროს.

ამოცნობის ამოცანების გადაჭრის სირთულე განპირობებულია კლასიკური მათემატიკური მეთოდების შესწორების გარეშე განხორციელების შეუძლებლობით (ხშირად არ არსებობს ინფორმაცია ზუსტი მათემატიკური მოდელისთვის)

აღიარებულია შემდეგი სახის აღიარების ორდერები:

ამოცნობის დავალება – წარმოდგენილი ობიექტის მისი აღწერისთვის მინიჭება კლასის ერთ-ერთ დავალებაზე (დაწყებული მასწავლებლით);

ავტომატური კლასიფიკაციის ამოცანაა კლასობრივი სისტემების სიმრავლის შემუშავება, რომელიც არ იცვლება (ტაქსონომია, კლასტერული ანალიზი, თვითინფლაცია);

ამოცნობის დროს ატრიბუტების ინფორმაციული ნაკრების შერჩევის დაზუსტება;

გამომავალი მონაცემების მომზადება მარტივი სანახავად;

დინამიური ამოცნობა და კლასიფიკაცია;

ეს არის წინასწარ განსაზღვრული პროგნოზი - რათა გადაწყვეტილება მომავალში სრულყოფილ მომენტამდე გადაიტანოს.

აღიარების ტრადიციულ სისტემებს ორი რთული პრობლემა აქვს:

„1001 კლასის“ პრობლემა - 1000-მდე 1 კლასის დამატება ნიშნავს სისტემის გადატვირთვას და აქამდე ამოღებული მონაცემების გადამოწმების სირთულეებს;

„ლექსიკისა და ენის შეჯერების“ პრობლემა ყველაზე მეტად ვლინდება აღიარებულ ენაში. ამჟამინდელ სისტემებს შეუძლიათ ამოიცნონ ან ბევრი სიტყვა ინდივიდთა მცირე ჯგუფისგან, ან რამდენიმე სიტყვა ადამიანთა დიდი ჯგუფისგან. ასე რომ, ძალიან მნიშვნელოვანია მაკიაჟისა და გრიმასების მეშვეობით ადამიანების დიდი რაოდენობის ამოცნობა.

ნერვული სქემები არ არსებობს, როდესაც ისინი სრულად არ კონტროლდებიან, მაგრამ მათი ბუნებიდან გამომდინარე, ისინი ბევრად უფრო ადვილად ადაპტირდებიან შეყვანის მიმდევრობის ცვლილებებთან.

4. პრობლემები და პერსპექტივებიგანვითარებანიმუშის ამოცნობა

4.1 სურათების ამოცნობა პრაქტიკულია

გამოსახულების ამოცნობის პრობლემას აქვს ორი ნაწილი: დასაწყისი და ამოცნობა. პროცესი იწყება დაუკავშირებელი ობიექტების დემონსტრირებით მათი წარდგენიდან სხვა კლასში. ჩანთების მიღმა, სისტემა, რომელიც აღიარებს, ვალდებულია უპასუხოს ახალი რეაქციით ყველა ერთი და იგივე გამოსახულების ობიექტს და განსხვავებული ყველა დანარჩენზე. მნიშვნელოვანია, რომ პროცესი დაიწყოს როგორც თავად ობიექტის, ასევე გამოსახულებასთან მისი ურთიერთობის მითითება. საწყისებს მოსდევს აღიარების პროცესი, რომელიც ახასიათებს უკვე განვითარებული სისტემის მოქმედებებს. ამ პროცედურების ავტომატიზაცია პრობლემას ქმნის.

სანამ რაიმე ობიექტის ანალიზს დაიწყებდეთ, თქვენ უნდა მიიღოთ ინფორმაცია მის შესახებ მოწესრიგებული, ზუსტი გზით. ასეთი ინფორმაცია არის ობიექტების ავტორიტეტების მთლიანობა, მათი ასახვა უპიროვნო ორგანოებზე, რომლებიც აღიქვამენ აღიარების სისტემას.

თუმცა, კანის სიფრთხილის ობიექტი შეიძლება გამოყენებულ იქნას სხვადასხვა გზით, ფრთხილად და გონებით. გარდა ამისა, ერთი და იგივე გამოსახულების ობიექტები შეიძლება მნიშვნელოვნად განსხვავდებოდეს ერთმანეთისგან.

ნებისმიერი ობიექტის კანის გამოსახულებას სისტემის სენსორულ ორგანოებზე, რომელიც ცნობს, ამ ორგანოების პოზიციის მიუხედავად, ჩვეულებრივ უწოდებენ ობიექტის გამოსახულებებს და ასეთი გამოსახულებების გარეშე, ისინი განსაზღვრულია მიწისქვეშა ავტორიტეტების მიერ, არის გამოსახულებები. გამომავალი აღწერის შემდგომი არჩევანით (საერთო ხასიათი), ამოცნობის ამოცანა შეიძლება იყოს მარტივი და, თუმცა, შეიძლება გამოიწვიოს ინფორმაციის შემდგომი რთული დამუშავება, ან გადაწყვეტილების საჭიროება დაიკარგა.

ობიექტების, სიგნალების, სიტუაციების და ფენომენების ამოცნობა ყველაზე ვრცელი ამოცანაა, სადაც ადამიანებს სტრესთან გამკლავება სჭირდებათ. ამ მიზნით გამოიყენება ტვინის დიდი რესურსები, რომელიც ფასდება ისეთი მაჩვენებლით, როგორიცაა ნეირონების რაოდენობა, რომელიც 10 10-ზე მეტია.

ანალოგიურად, აღიარება თანდათან იზრდება ტექნოლოგიაში. ფორმალური ნეირონების საზღვრებში მყოფი რიცხვები დიდ კავშირშია ტვინის მიერ ინფორმაციის დამუშავებასთან. ბოლო ათწლეულის განმავლობაში, ნეიროკომპიუტერი გაიზარდა პოპულარობით და გახდა საინჟინრო დისციპლინა, რომელიც დაკავშირებულია კომერციული პროდუქტების განვითარებასთან. დიდი საზოგადოება მუშაობს ნეირო-გამოთვლის ელემენტარული საფუძვლის შექმნაზე.

მისი მთავარი დამახასიათებელი მახასიათებელია არაფორმალური პრობლემების გავრცელება, რისთვისაც სხვა მიზეზების გამო არ ხდება გადაწყვეტის ალგორითმების გადაცემა. ნეიროკომპიუტერები აჩვენებენ საოცრად მარტივ ტექნოლოგიას თანამედროვე გზებით ალგორითმების შესაძენად. რომლის მთავარი უპირატესობაც ეს არის. ამრიგად, ნეიროკომპიუტერი, როგორც ჩანს, ამავე დროს აქტუალურია - მულტიმედიის განვითარების დროს, როდესაც გლობალური განვითარება გულისხმობს ახალი ტექნოლოგიების განვითარებას, რომელიც მჭიდროდ არის დაკავშირებული გამოსახულების ამოცნობასთან.

ხელოვნური ინტელექტის განვითარებისა და სტაგნაციის ერთ-ერთი მთავარი პრობლემა ხმის და ვიზუალური გამოსახულების ამოცნობის პრობლემაა. ყველა სხვა ტექნოლოგია უკვე მზად არის მედიცინაში, ბიოლოგიაში და უსაფრთხოების სისტემებში გამოსაყენებლად. მედიცინაში გამოსახულების ამოცნობა ეხმარება ექიმებს უფრო ზუსტი დიაგნოზის დასმაში ქარხნებში, იგი გამოიყენება საქონლის პარტიებში პრობლემების პროგნოზირებისთვის. ბიომეტრიული იდენტიფიკაციის სისტემები, როგორც მათი ალგორითმული ბირთვი, ასევე ეფუძნება ამოცნობის შედეგებს. კომპიუტერების შემდგომი განვითარება და დიზაინი, რომლებიც უფრო მეტად არის აგებული, შერწყმულია ადამიანის ენებთან, რომლებიც ბუნებრივია ადამიანებისთვის და ენის მიღმა, არ შეიძლება განვითარდეს აღიარების გარეშე. უკვე არსებობს ინფორმაცია რობოტიკის განვითარების, საბაჟო კონტროლის სისტემების შესახებ, რომლებიც აღიარების სისტემის სასიცოცხლოდ მნიშვნელოვანი ქვესისტემებია.

ვისნოვოკი

შედეგად, გაკეთდა მოკლე მიმოხილვა კიბერნეტიკის ისეთი დარგის გაგების ძირითადი მიზეზების შესახებ, როგორიცაა შაბლონის ამოცნობა, ნაჩვენები იქნა ამოცნობის მეთოდები და ნაჩვენები იყო დავალების ფორმულირება.

გიჟურად, ეს პირდაპირ კავშირშია ამ მეცნიერების განვითარებასთან. უფრო მეტიც, როგორც ერთ-ერთ ნაწილში ჩამოყალიბდა, აღიარება განვითარების ერთ-ერთი მთავარი სფეროა ამ მომენტში. ამრიგად, უსაფრთხოების პროგრამული უზრუნველყოფა მომდევნო ათწლეულში შეიძლება კიდევ უფრო სასარგებლო გახდეს საცალო ინდუსტრიისთვის და კონკურენტუნარიანი მიმდინარე ბაზარზე, რადგან ის გახდება კომერციულად ფორმატირებული და უფრო ფართოდ გავრცელდება კონკურენტების დიდი რაოდენობის ფარგლებში.

შემდგომი კვლევა შეიძლება ფოკუსირებული იყოს მიმდინარე ასპექტებზე: ძირითადი დამუშავების მეთოდების საფუძვლიანი ანალიზი და ამოცნობის ახალი კომბინირებული და მოდიფიცირებული მეთოდების შემუშავება. მეთვალყურეობის ეტაპზე შესაძლებელი იქნება ფუნქციური ამოცნობის სისტემის შემუშავება, რომელიც ხელს შეუწყობს ამოცნობის მეთოდების ეფექტურობის შერჩევის შემოწმებას.

ცნობების სია

1. დევიდ ფორმაისი, ჟან პონსი კომპიუტერული ცირ. დღევანდელი მიდგომა, 2004 წ

2. Aizerman M.A., Braverman E.M., Rozonoer L.I. პოტენციური ფუნქციების მეთოდი მანქანათმცოდნეობის თეორიაში. - M: ნაუკა, 2004 წ.

3. ჟურავლოვი იუ.ი. აღიარებისა და კლასიფიკაციის უმაღლესი დონის ალგებრული მიდგომის შესახებ // კიბერნეტიკის პრობლემები. მ.: ნაუკა, 2005. – VIP. 33.

4. მაზუროვი ვ.დ. ნერვული სისტემებისა და კვლევის კომიტეტი // კიბერნეტიკა, 2004 No2.

5. პოტაპოვი ა.ს. სურათების ამოცნობა და მანქანების ამოცნობა. – პეტერბურგი: პოლიტექნიკა, 2007 წ.

6. Minsky M., Papert S. Perceptroni. - M: სვიტი, 2007 წ.

7. Rastrigin L. A., Erenshtein R. Kh. კოლექტიური აღიარების მეთოდი. M. Vidavnitstvo, 2006 წ.

8. რუდაკოვი კ.ვ. კლასიფიკაციის უნივერსალური და ლოკალური საზღვრების ალგებრული თეორიის შესახებ // ამოცნობა, კლასიფიკაცია, პროგნოზი. მათემატიკური მეთოდები და მათი სტაგნაცია. VIP. 1. – მ.: ნაუკა, 2007 წ.

9. Fu K. გამოსახულების ამოცნობის სტრუქტურული მეთოდები. - M: სვიტი, 2005 წ.

გამოქვეყნებულია Allbest.ru-ზე

...

მსგავსი დოკუმენტები

    ნიმუშის ამოცნობის თეორიის ძირითად ცნებებს იგივე მნიშვნელობა აქვს. ნიმუშის ამოცნობის მათემატიკური თეორიის არსი. ძირითადი პრობლემები, რომლებიც წარმოიქმნება გამოსახულების ამომცნობი სისტემების შემუშავებით. რეალურ დროში გამოსახულების ამომცნობი სისტემების კლასიფიკაცია

    კურსის მუშაობა, დაამატეთ 01/15/2014

    გამოსახულების ამოცნობის ალგორითმების სპეციფიკური მახასიათებლების გააზრება. ამოცნობის მეთოდების ტიპოლოგიისადმი განსხვავებული მიდგომები. ცოდნის მიღების ძირითადი მეთოდების შემუშავება. ინტენსიური და ექსტენსიური მეთოდების მახასიათებლები, მათი სიძლიერის შეფასება.

    პრეზენტაცია, დამატებულია 01/06/2014

    ნიმუშის ამოცნობის თეორიული მიდგომები. ამოცნობის სისტემის ფუნქციური დიაგრამა. ბაიესის მეთოდების განვითარება გაუმჯობესებული ნიმუშის ამოცნობის მიზნით. ბაიესის გამოსახულების სეგმენტაცია. TAN მოდელი ექვემდებარება სურათების უმაღლეს კლასიფიკაციას.

    სადიპლომო ნამუშევარი, დაამატეთ 13.10.2017წ

    გადახედეთ უკან გამოსახულების ამოცნობის სისტემებში არსებულ ხარვეზებს. სურათების კლასიფიკატორები, რომლებიც დაიწყება. პერცეპტრონის ალგორითმი და მისი მოდიფიკაცია. შექმნილია პროგრამით, რომელიც შექმნილია სურათების კლასიფიკაციისთვის უმცირესი საშუალო კვადრატის მეთოდის გამოყენებით.

    კურსის მუშაობა, დაამატეთ 04/05/2015

    შაბლონის ამოცნობის მეთოდები (კლასიფიკატორები): ბაიესური, წრფივი, პოტენციური ფუნქციების მეთოდი. პროგრამების შემუშავება მათი ფოტოების მიღმა მყოფი ადამიანების ამოცნობისთვის. რობოტული კლასიფიკატორების გამოყენება, რობოტული მეთოდების სიზუსტის ექსპერიმენტული შედეგები.

    კურსის მუშაობა, დაამატეთ 08/15/2011

    სპეციალური პროგრამული უზრუნველყოფის შექმნა საშუალებას იძლევა ვიზუალური სურათების ამოცნობა ცალკეული ნერვული ქსელების კოორდინაციიდან. გამოსახულების ამოცნობის გამოსაყენებელი მეთოდები. სელფრიჯის პანდემონიუმი. პერცეპტრონი როზენბლატი. ლანციუგის კოდის ფორმირების წესი.

    სადიპლომო ნამუშევარი, დაამატეთ 04/06/2014

    გამოსახულების ამოცნობა - ობიექტის იდენტიფიკაცია და სიმძლავრის მინიჭება გამოსახულების ან აუდიო ჩანაწერისთვის. ამ გალუსში თეორიული და ტექნიკური ცვლილებების ისტორია. მეთოდები და პრინციპები, რომლებიც გამოიყენება გამოთვლითი ტექნოლოგიების ამოცნობისთვის.

    რეზიუმე, დამატება 04/10/2010

    გამოსახულების ამომცნობი სისტემების კონცეფცია. აღიარების სისტემების კლასიფიკაცია. მიკროობიექტების ფორმის ამოცნობის სისტემის შემუშავება. კრისტალგრამაზე მიკროობიექტების ამოცნობის სისტემის შექმნის ალგორითმი, მისი განხორციელების სპეციფიკა პროგრამულ შუალედში.

    კურსის მუშაობა, დაამატეთ 06/21/2014

    აირჩიეთ ნერვული ქსელის ტიპი და სტრუქტურა. ამოცნობის მეთოდის შერჩევა, ჰოპფილდის ღონისძიების სტრუქტურული დიაგრამა. გამოსახულების ამომცნობი სისტემის შემუშავება. პროგრამით რობოტის მახასიათებლები, მისი უპირატესობები და ნაკლოვანებები. კომპიუტერის ინტერფეისის და ეკრანის ფორმების აღწერა.

    კურსის მუშაობა, დაამატეთ 14/11/2013

    ტექნიკური ავტომატური ამოცნობის სისტემების გაჩენა. ლუდინა, როგორც ჩი-ლანკას დასაკეცი ავტომატური სისტემების ელემენტი. ავტომატური ამომცნობი მოწყობილობების შესაძლებლობები. გამოსახულების ამომცნობი სისტემის შექმნის ეტაპები. vimiryuvannya და კოდირების პროცესები.

ზოგადად, გამოსახულების ამოცნობის სამი გზა არსებობს: აღრიცხვის მეთოდი. ამ შემთხვევაში ტარდება შედარება მონაცემთა ბაზასთან, სადაც წარმოდგენილია გამოსახულების სხვადასხვა მოდიფიკაცია ობიექტების კანის ტიპისთვის. მაგალითად, სურათების ოპტიკური ამოცნობისთვის, შეგიძლიათ გამოიყენოთ ობიექტის ტიპის მიხედვით დახარისხების მეთოდი სხვადასხვა ჭრილების, მასშტაბების, სახსრების, დეფორმაციების და ა.შ. ასოებისთვის საჭიროა შრიფტის მიხედვით დახარისხება, შრიფტის მიხედვით. სხვადასხვა ნაცნობი ნიმუშით (მაგალითად, რამდენიმე ადამიანის მიერ ნათქვამი სიტყვა).

კიდევ ერთი მიდგომაა გამოსახულების მახასიათებლების უფრო სიღრმისეული ანალიზის ჩატარება. თითოეულ ოპტიკურ ამოცნობას შეიძლება ჰქონდეს განსხვავებული გეომეტრიული მახასიათებლები. ამ ტიპის ხმის ხელმოწერა ექვემდებარება სიხშირის და ამპლიტუდის ანალიზს.

შეურაცხმყოფელი მეთოდია ხელოვნური ნერვული ქსელების (INS) გამოყენება. ეს მეთოდი ეყრდნობა ან ამოცანის ამოცნობის აპლიკაციების დიდ რაოდენობას დაწყების დროს, ან ნერვული ქსელის სპეციალურ სტრუქტურას, რომელიც აკმაყოფილებს ამ ამოცანის სპეციფიკას. ტიმი არანაკლებ დაინტერესებულია მაღალი ეფექტურობითა და პროდუქტიულობით.

4. სურათის ამოცნობის ისტორია

მოკლედ გადავხედოთ გამოსახულების ამოცნობის მათემატიკურ ფორმალიზმს. აღიარებული სურათების ობიექტი აღწერილია ძირითადი მახასიათებლების სიმრავლით (ნიშნები, უფლებამოსილებები). ძირითადი მახასიათებლები შეიძლება იყოს განსხვავებული ხასიათისა: ისინი შეიძლება იყოს პირდაპირი მეტყველების ტიპის მოწესრიგებული სიმრავლის ნაწილი, ან დისკრეტული სიმრავლისგან (როგორც, თუმცა, ისინი თავად შეიძლება იყვნენ დაჯილდოვებული სტრუქტურით). ასეთ გონივრულ ობიექტს ემსახურება გამოსახულების ამოცნობის პრაქტიკული დამატებების საჭიროება და, ჩვენი გაგებით, ობიექტის ადამიანად ამოცნობის მექანიზმი. მართალია, მნიშვნელოვანია, რომ ფრთხილი (დანახული) ადამიანის ობიექტით მნიშვნელოვანია ტვინში სენსორების (ანალიზის არხების) საბოლოო რაოდენობის თვალყურის დევნება, ხოლო კანის სენსორს შეიძლება მიენიჭოს მსგავსი მახასიათებელი Ekta. ეს ნიშანი, ობიექტის შესახებ ჩვენი შეხედულებების მსგავსად, ასევე ეფუძნება ნიშნის ხედვას და ნიშნების ჯგუფს, რომელსაც კლასიფიკაციის ნიშნები ეწოდება, აქვს თავისი ასოცირებული მნიშვნელობა მოცემულ X ვექტორზე და მდგომარეობს მოცემულ ხატოვან ბუნებრივ და ხელოვნურ ამოცნობაში. სისტემები.

ნათელია, რომ ამ ნიშნების მნიშვნელობის დასადგენად აუცილებელია ინფორმაციის მიწოდება მათ შესახებ, რომლებიც დაკავშირებულია კლასიფიკაციურ ნიშნებთან. ინფორმაცია ამ კავშირის შესახებ მითითებულია პრეცედენტების სახით, ისე, რომ არ არსებობს ობიექტების აღწერილობები საიდუმლო სიმბოლოების ცნობილი მნიშვნელობით. და პრეცედენტული ინფორმაციის გარდა, აუცილებელია ზოგადი წესის დადგენა, რომელიც ობიექტის საკმარის აღწერას აძლევს მისი კლასიფიკაციის ნიშნების მნიშვნელობას.

ასეთი დახვეწილი ნიმუშის ამოცნობის მიდგომა მეცნიერებაში დამკვიდრდა გასული საუკუნის 50-იანი წლებიდან. ასევე აღინიშნა, რომ ასეთი წარმოება სულაც არ არის ახალი. შესწავლილია მსგავსი ფორმულირებები და უკვე შემუშავებულია სტატისტიკური მონაცემების ანალიზის მეთოდები, რომლებიც ძალიან ცუდი აღმოჩნდა, რადგან ისინი აქტიურად შემუშავდა მრავალი პრაქტიკული ამოცანისთვის, როგორიცაა, მაგალითად, ტექნიკური დიაგნოსტიკა. ამიტომ, გამოსახულების ამოცნობის პირველი დღეები გამოირჩეოდა სტატისტიკური მიდგომით, რომელიც კარნახობდა მთავარ პრობლემებს.

სტატისტიკური მიდგომა ემყარება იმ აზრს, რომ ობიექტების გამომავალი სივრცე არის გლობალური სივრცე, ხოლო ობიექტების ნიშნები (მახასიათებლები) არის მისთვის მინიჭებული ცვლადი მნიშვნელობები. მაშასადამე, მონაცემთა კვლევა მიზნად ისახავდა სტატისტიკური ჰიპოთეზის წამოყენებას ნიშნის განაწილების, უფრო ზუსტად, სხვათაგან კლასიფიკაციის ნიშნების ადგილმდებარეობის შესახებ. სტატისტიკური ჰიპოთეზა, როგორც წესი, პარამეტრულად იყო განსაზღვრული უპიროვნო ფუნქციით, ნიშნის ქვედანაყოფით. ტიპიური კლასიკური სტატისტიკური ჰიპოთეზა არის ჰიპოთეზა ამ დაყოფის ნორმალურობის შესახებ (ასეთი ჰიპოთეზების სხვადასხვა ტიპები ნახეს სტატისტიკამ). ჰიპოთეზის ჩამოყალიბების შემდეგ შეუძლებელი გახდა ამ ჰიპოთეზის გადამოწმება პრეცედენტის მონაცემებზე. ეს გადამოწმება მოიცავდა კონკრეტული გაყოფის შერჩევას გაყოფის მოცემული სიმრავლიდან (ჰიპოთეზის პარამეტრი გაყოფის შესახებ) და ამ არჩევანის სანდოობის (ნდობის ინტერვალის) შეფასებას. რა თქმა უნდა, ეს ფუნქცია დაყოფილი იყო განყოფილებებად და შეესაბამებოდა დავალებას, მხოლოდ ობიექტი აღარ იყო კლასიფიცირებული ცალსახად, მაგრამ კლასების კუთვნილების გარკვეული განსხვავებებით. სტატისტიკოსებმა ასევე დაშალეს ასეთი მეთოდების ასიმპტომური ანალიზი. ასეთი სქემები მუშაობდა შემდეგი სქემის მიხედვით: დამონტაჟდა გარკვეული ფუნქციონალი გაყოფის არჩევისთვის (ნდობის ინტერვალი) და ნაჩვენები იყო, რომ პრეცედენტების რაოდენობის გაზრდის გამო, ჩვენი არჩევანი რა არის 1-ის მნიშვნელობა, გახდა ერთგული. სენსორული ფუნქციონირება (0 მნიშვნელობის ნდობის ინტერვალი). მოდი, თავი გავასწრო, ვთქვათ, რომ ამოცნობის პრობლემის სტატისტიკური ხედვა გაჩნდა არა მხოლოდ ფრაგმენტული ალგორითმების გაგებით (მათ შორის, კლასტერული მეთოდების, დისკრიმინაციული ანალიზის, არაპარამეტრული რეგრესიის და ა.შ.), არამედ ვაპნიკის წყალობით. აღიარების ღრმა სტატისტიკური თეორიის შექმნას. .

ტიმ, არანაკლებ, არსებობს სერიოზული არგუმენტი იმ სარგებლობისთვის, რომ არ შემცირდეს ნიმუშის ამოცნობა სტატისტიკამდე. წარმოიქმნება თუ არა ასეთი პრობლემა, პრინციპში, შეიძლება სტატისტიკური კუთხით ნახოთ და შედეგების სტატისტიკურად ინტერპრეტაცია. ვისთვისაც აუცილებელია ვივარაუდოთ, რომ მოცემული ობიექტების ფარგლები წარმოუდგენელია. გარდა ინსტრუმენტალიზმის შეხედულებისა, ამოცნობის ამ მეთოდის სტატისტიკური ინტერპრეტაციის წარმატების კრიტერიუმი შეიძლება არ იყოს აშკარა, რაც დაფუძნებულია ჩემი სტატისტიკის ამ მეთოდზე, როგორც მათემატიკის ფილიალზე. ამ პირობებში ჩვენ გვესმის ძირითადი ნაბიჯების შემუშავება ამ მეთოდის წარმატების უზრუნველსაყოფად. თუმცა, ამ დროისთვის, ამოცნობის მეთოდების უმეტესობისთვის, მათ შორის ისეთებიც, რომლებიც მკაცრად იყო გამოყენებული სტატისტიკური მიდგომის ფარგლებში, ასეთი დამაკმაყოფილებელი პირობები არ არის ნაპოვნი. გარდა ამისა, ამჟამად ყველაზე ხშირად გამოყენებული სტატისტიკური ალგორითმებია ფიშერის ხაზოვანი დისკრიმინაციული ტიპი, ფარზენის ფანჯარა, EM ალგორითმი, უახლოესი მეზობელი მეთოდი, არც კი ახსენებს ბაიესის ზომებს შედეგად მიღებული ინტერპრეტაციები, რომლებიც განსხვავდება სტატისტიკური ინტერპრეტაციებისგან. და ჩვენ შევთანხმდებით, სანამ ყველაფერი ითქვა, რომ გარდა ამოცნობის მეთოდების ასიმპტომური ქცევისა, როგორიცაა ძირითადი კვების სტატისტიკა, აღიარების პრაქტიკა კვების ღირებულებას ანიჭებს მეთოდების რაოდენობრივ და სტრუქტურულ სირთულეს, რომელიც სცილდება ერთს. არ არსებობს დამაჯერებლობის თეორია.

სტატისტიკის მცდელობებისგან განსხვავებით, რომ ნიმუშის ამოცნობა სტატისტიკის ფილიალად განეხილათ, აღიარების პრაქტიკა და იდეოლოგია მოიცავდა სრულიად განსხვავებულ იდეებს. ერთ-ერთი მათგანი ეფუძნება გალუსაში ჩატარებულ კვლევას ზოდიაქოს გამოსახულების ამოცნობაზე და დაფუძნებულია მოწინავე ანალოგიაზე.

როგორც ირკვევა, ყოველდღიურ ადამიანებს მუდმივად აქვთ (ხშირად გაუცნობიერებლად) პრობლემები სხვადასხვა სიტუაციების, სმენითი და ვიზუალური სურათების ამოცნობაში. მსგავსი სიტუაცია EOM-ისთვის არის უმოკლეს დროში მომავლის მარჯვენა მხარეს. სურათის ამოცნობის ამ ადრეულმა პიონერებმა შექმნეს საფუძველი, რომ EOM-ზე ამ პრობლემების გადაწყვეტამ შეიძლება გამოიწვიოს ადამიანის აზროვნების პროცესების მოდელირება. პრობლემასთან მიახლოება ყველაზე დიდ სირთულეს წარმოადგენდა ფ. როზენბლატის ცნობილი კვლევა პერცეპტრონების შესახებ.

50-იანი წლების შუა ხანებამდე ითვლებოდა, რომ ნეიროფიზიოლოგებს ესმოდათ ტვინის ფიზიკური პრინციპები (წიგნში „მეფის ახალი გონება“ ცნობილი ბრიტანელი თეორიული ფიზიკოსი რ. პენროუზი ეჭვი ეპარებოდა ტვინის ნევროლოგიურ მოდელში, რენტალურ როლში. მის ფუნქციონირებაში კვანტურ-მექანიკური) . თუმცა, ეს მოდელი თავიდანვე ექვემდებარებოდა ეჭვს ამ აღმოჩენებზე დაყრდნობით, ფ. როზენბლატმა შეიმუშავა ვიზუალური გამოსახულების საწყისი ამოცნობის მოდელი, რომელსაც მან უწოდა პერცეპტრონი.

ნახ 1. პერცეპტრონის წრე

შეყვანისას პერცეპტრონი ირჩევს ობიექტის ვექტორს, რომელიც Rosenblatt-ის რობოტებში არის ორობითი ვექტორი, რომელიც აჩვენებს ეკრანის რომელი პიქსელი არის გაშავებული გამოსახულებამდე და რომელი არა. შემდეგ კანი მიეწოდება ნეირონის შეყვანას, რომელიც უბრალოდ მრავლდება ნეირონის გამომავალზე. შედეგები იგზავნება დარჩენილ ნეირონში, რომელიც აერთიანებს მათ და უდრის შესაბამის ზღურბლს. მნიშვნელოვანია, რომ გასწორების შედეგად, შეყვანის ობიექტი X აღმოჩნდეს საჭირო თანმიმდევრობით. ამრიგად, გამოსახულების ამოცნობის დასაწყისი ეფუძნებოდა ნეირონების და ზღვრული მნიშვნელობების ასეთ შერჩევას, რათა პერცეპტრონი პრეცედენტულ სურათებზე სწორი ტიპის სიგნალებს მისცემდა. Rosenblatt-მა, გაითვალისწინა, რომ ფუნქცია, რომელიც გამოვიდა, ვერ ამოიცნობს შეყვანის ობიექტის საჭირო ჯანსაღ სურათს და არ არსებობდა პრეცედენტები. ბიონიკური ვაჭრობიდან გვაქვს იგივე გამოგონებები და ზონებისა და ზღურბლების შერჩევის მეთოდი, რაზეც არ მოგერიდებათ. ასევე ვთქვათ, რომ ეს მიდგომა წარმატებული აღმოჩნდა აღიარების დაბალ დონეზე და დასაბამი მისცა ალგორითმების უშუალო გამოკვლევას ნერვულ ზომებზე პრინციპების შემუშავებისთვის, რომელსაც ჩვენ ვუწოდებთ პერცეპტრონს.

დალი ბული გამოიგონა ლეგალიზებული პერსეპრონის მიერ, ნეირონის ფუნქცია, Bula Bula ეხება: ნეირონი ვერ გამრავლდა საწყობის აბსტაციების რაოდენობაზე ї ї ї ї ї ї ї ї ї ї ї ї ї ї ї. ibalhuvati bilshii ფუნქცია. მცირე სურათი 2 გვიჩვენებს ნეირონთა ერთ-ერთ სტრუქტურას:

Პატარა 2 ნერვული წრედის სქემა.

გარდა ამისა, ნერვული ქსელის ტოპოლოგია შეიძლება მნიშვნელოვნად განსხვავდებოდეს იმისგან, რასაც Rosenblatt უყურებდა, მაგალითად:

Პატარა 3. როზენბლატის ნერვული წრედის დიაგრამა.

გაუმჯობესებებმა განაპირობა იმ პარამეტრების რაოდენობის გაზრდა, რომელთა კონფიგურაცია შესაძლებელია დაწყებისას, და ამით გაზარდა რთულ ნიმუშებთან ადაპტაციის შესაძლებლობაც კი. ამ სფეროში გამოკვლევები ერთდროულად მიჰყვება ორ მჭიდროდ დაკავშირებულ გზას - გამოიყენება სხვადასხვა ტოპოლოგია და კორექტირების სხვადასხვა მეთოდი.

ნერვული გაზომვები ამ მომენტში არა მხოლოდ ინსტრუმენტია ნიმუშის ამოცნობის ამოცანების გადასაჭრელად, არამედ გამორიცხავს ასოციაციურ მეხსიერებაზე კვლევის საჭიროებას, გამოსახულების შეკუმშვას. მსურს უშუალოდ გავამახვილო ყურადღება შაბლონების ამოცნობის პრობლემაზე და კიბერნეტიკის უფრო ფართო ფილიალზე. ამოცნობისთვის ამ მომენტისთვის, ნერვული გაზომვები აღარ არის კონკრეტულად განსაზღვრული, არაპერსონალური გამოსახულება პარამეტრულად არის მითითებული, ასე რომ გრძნობას არ აქვს რაიმე მნიშვნელოვანი უპირატესობა წარსულში ბევრ სხვა მსგავს მოდელთან შედარებით, რაც მოკლედ გადაჭარბებული იქნება.

ნეირონული ქსელების როლის შეფასებასთან დაკავშირებით ბიოლოგიურ ამოცნობაში (მაგრამ არა ბიონიკისთვის, რისთვისაც მათ უკვე დიდი მნიშვნელობა აქვთ), მინდა ვგულისხმობ შემდეგს: ნერვული ქსელები, რომლებიც ძალიან რთული ობიექტია მათემატიკური ანალიზისთვის, სათანადო ანალიზით შესაძლებელია მათ შორის არატრივიალური კანონების პოვნაც კი. მათი ანალიზის სირთულეები, თავის მხრივ, აიხსნება მათი დასაკეცი სტრუქტურით, შედეგად, პრაქტიკულად ამოუწურავი შესაძლებლობებით სხვადასხვა ნიმუშების იდენტიფიცირებისთვის. ყველა ეს უპირატესობა, როგორც ხშირად ხდება, მოყვება პოტენციურ სარგებელს, გადამზადების შესაძლებლობას. როგორც შემდგომში იქნება განმარტებული, ნებისმიერი მოდელის პერსპექტივების ასეთი დაქვემდებარებული შეხედულება სათავეს იღებს მანქანათმცოდნეობის ერთ-ერთი პრინციპიდან.

ამოცნობის კიდევ ერთი პოპულარული მეთოდია გადაწყვეტილების ხის ლოგიკური წესები. აღიარების ყველაზე მოწინავე მეთოდებთან ერთად, ეს მეთოდები ყველაზე აქტიურად ხელს უწყობს საგნის სფეროს შესახებ ჩვენი ცოდნის გამოხატვის იდეას, როგორც ჩანს ყველაზე ბუნებრივ (ყველა თვალსაზრისით) სტრუქტურებში - ლოგიკურ წესებში. ელემენტარული ლოგიკური წესის მიხედვით, არსებობს პირობა ტიპის „თუ არაკლასიფიცირებული ნიშნებია დაკავშირებულ X-ში, მაშინ კლასიფიცირებული ნიშნებია დაკავშირებულ Y-ში“. ამ წესის გამოყენება სამედიცინო დიაგნოზში ახლა არის: თუ პაციენტი 60 წელზე მეტია და ადრე განიცადა ინფარქტი, არ გაიკეთო ოპერაცია - უარყოფითი შედეგის რისკი დიდია.

ლოგიკური წესების საპოვნელად ეს ორი სიტყვაა საჭირო: „ინფორმაციული შინაარსის“ სამყაროს განსაზღვრა წესები და წესების ფარგლები. და წესების ძიების ამოცანა შემდეგ გარდაიქმნება წესების უზარმაზარობის უწყვეტ და ნაწილობრივ ძიების ამოცანად ყველაზე ინფორმატიულის პოვნის ერთი მეთოდით. ეს მნიშვნელოვანი ინფორმაცია შეიძლება შემოგთავაზოთ სხვადასხვა გზით და ჩვენ არ ვისაუბრებთ იმაზე, თუ რა არის ეს მოდელის აქტიური პარამეტრი. საძიებო სივრცე ნაჩვენებია სტანდარტულად.

საკმარისად ინფორმაციული წესების პოვნის შემდეგ იწყება საბოლოო კლასიფიკატორის წესების „დაკეცვის“ ეტაპი. აქ წარმოქმნილი პრობლემების სიღრმისეულად განხილვის გარეშე (და დამნაშავე ბევრია), განვიხილავთ „დაკეცვის“ ორ ძირითად მეთოდს. პირველი ტიპი არის ხაზოვანი სია. სხვა ტიპი უფრო მნიშვნელოვანია, ვიდრე ხმის მიცემა, თუ თითოეულ წესს ენიჭება ერთი ხმა, ხოლო ობიექტი კლასიფიკატორის მიერ ენიჭება იმ კლასს, რომელსაც წესების უდიდესი რაოდენობა მისცა ხმა.

მართლაც, შემთხვევითი წესების და „დაკეცვის“ ეტაპი დასრულებულია და, როდესაც სიაში მნიშვნელოვანი კენჭისყრის მოთხოვნით, წესების ძიება პრეცედენტული მონაცემების ნაწილებზე მეორდება ისევ და ისევ, უკეთესის უზრუნველსაყოფად. მონაცემთა და მოდელის გაგება.

სტრუქტურირების პრინციპით, აღწერს ჩართული ობიექტის, ან ობიექტის, რომელიც წარმოდგენილია ნიშნების ვექტორით, რომლის კანის ელემენტი წარმოადგენს ერთ-ერთი ნიშნის რიცხვით მნიშვნელობას, რომელიც ახასიათებს შესაბამის ობიექტს.

აღიარების სისტემის ზოგადი სტრუქტურა ასე გამოიყურება:

სენსორული ამოცნობა - დააყენეთ ობიექტები, რომლებიც შედის სიაში, სიმბოლოების ფიქსირებული ბოლო ნაკრებით, რაც საშუალებას გაძლევთ მიიტანოთ ისინი სიმღერის კლასში. თავდაპირველი აღიარება შეიძლება შეიცავდეს შემდეგ მახასიათებლებს:

1. ეს საინფორმაციო ერთეულები ყალიბდება ორი ეტაპად:

ა. გამომავალი მონაცემების მარტივად ამოცნობის ფორმაში გადატანა.

ბ. ამოცნობის ძალა სიმღერის კლასისთვის ობიექტის ძალაუფლების მაჩვენებელია.

2. ამ ნაშრომებში შესაძლებელია საგნების ანალოგიისა და მსგავსების ცნების დანერგვა და საგნების სიახლოვის ცნების ჩამოყალიბება, როგორც იმავე კლასის ობიექტების დაცვის საფუძველი.

3. ამ ამოცანების შესრულება შესაძლებელია პრეცედენტების კომპლექტით - აპლიკაციებით, რომელთა კლასიფიკაცია ფორმალიზებული აღწერილობებიდან გამომდინარე შეიძლება წარმოადგინოს ამოცნობის ალგორითმში სწავლის პროცესში ამოცანის კორექტირების მიზნით.

4. ამ ამოცანებისთვის მნიშვნელოვანია ფორმალური თეორიები და კლასიკური მათემატიკური მეთოდები: ხშირად ინფორმაცია ზუსტი მათემატიკური მოდელისთვის ან სხვა მოდელისა და მათემატიკური მეთოდების მოგება არ არის შეზღუდული ღირებულებით.

5. ამ ამოცანებს შეიძლება ჰქონდეს „ცუდი ინფორმაცია“ - ინფორმაცია ხარვეზებით, მრავალფეროვანი, არაპირდაპირი, გაურკვეველი, ორაზროვანი, დამაბნეველი.

მნიშვნელოვანია ამ ტიპის ამოცნობის ამოცანების ნახვა:

1. წინასწარი ამოცნობა, ისე, რომ წარმოდგენილი ობიექტი ერთ-ერთი საკლასო დავალების (დაწყებული მასწავლებლით) აღწერილობაში იყოს შეტანილი.

2. ავტომატური კლასიფიკაციის ამოცანა - მათი აღწერილობის უკან უპიროვნო ობიექტების (სიტუაციების) დაყოფა კლასების სისტემად, რომელიც არ იცვლება (ტაქსონომია, კლასტერული ანალიზი, მკითხველის გარეშე).

3. ამოცნობის საათზე აირჩიეთ სიმბოლოების ინფორმაციული ნაკრები.

4. გამომავალი მონაცემების დაქვეითება ფორმამდე, რომელიც ადვილად ამოსაცნობია.

5. დინამიური ამოცნობა და დინამიური კლასიფიკაცია – ამოცანები 1 და 2 დინამიური ობიექტებისთვის.

6. პროგნოზირება - პროგნოზი 5, რომლის შესახებაც შეიძლება გადაწყვეტილებების მიღება მომავალში შესაფერის მომენტამდე.

გამოსახულების კონცეფცია.

გამოსახულება, კლასი – კლასიფიკაციის დაჯგუფება სისტემაში, რომელიც აერთიანებს (ხედავს) საგნების ცალკეულ ჯგუფს გარკვეული ნიშნის მიღმა. არსებობს მთელი რიგი დამახასიათებელი ძალა, რომლებიც ვლინდება იმაში, რომ ფენომენების საბოლოო რაოდენობის გაცნობიერება ერთი და იგივე სიმრავლიდან შესაძლებელს ხდის იმის აღიარებას, თუ რამდენად დიდია მისი წარმომადგენლების რაოდენობა ყოველწლიურად.


როგორც გამოსახულება, შეიძლება დაინახოს საკონტროლო ობიექტის ეტაპების მთლიანობა, ხოლო ეტაპების მთელი ნაკრები ხასიათდება იმით, რომ მოცემული მიზნის მისაღწევად საჭიროა ობიექტის ახალი შეყვანა. გამოსახულებები დამახასიათებელ ობიექტურ გავლენას ახდენს იმაზე, რომ სხვადასხვა ადამიანები, რომლებიც სხვადასხვა მასალით იწყებენ, ფრთხილად არიან, მაგრამ მნიშვნელოვანია, რომ ისინი ერთსა და იმავე ობიექტებს ერთმანეთისგან დამოუკიდებლად კლასიფიცირებენ.

მისი თქმით, გამოსახულების ამოცნობის პრობლემა შედგება ორი ნაწილისაგან: ინიცირება და ამოცნობა.

იგი იწყება სხვადასხვა ობიექტების ჩვენების პროცესით მათი დანიშნულ კუთვნილებიდან ამა თუ იმ სურათზე. შედეგად, სისტემა, რომელიც აღიარებს, ვალდებულია რეაგირება მოახდინოს ახალი რეაქციით ერთი გამოსახულების ყველა ობიექტზე და განსხვავებული რეაქციით სხვადასხვა გამოსახულების ყველა ობიექტზე.

მნიშვნელოვანია, რომ დაწყებული პროცესი შეიძლება დასრულდეს სხვა არაფერი, თუ არა ობიექტების საბოლოო რაოდენობის ჩვენების სერიით, სხვა მინიშნებების გარეშე. კვლევის ობიექტები შეიძლება იყოს ვიზუალური გამოსახულებები ან გარე სამყაროს სხვადასხვა გამოვლინებები და სხვა.

საწყისებს მოსდევს ახალი ობიექტების ამოცნობის პროცესი, რაც ახასიათებს არსებული სისტემის ფუნქციონირებას. ამ პროცედურების ავტომატიზაცია პრობლემას შექმნის სურათის ამოცნობის დასაწყისში. ამ შემთხვევაში, თუ ადამიანი ამას თავად წყვეტს ან გამოიცნობს, შემდეგ კი EOM-ს აწესებს კლასიფიკაციის წესებს, ხშირად ჩნდება ამოცნობის პრობლემა, რადგან პრობლემის ძირითად ნაწილს (დასაწყისს) ადამიანი იღებს საკუთარ თავზე.

წიკავის გამოსახულების ამოცნობის დაწყების პრობლემა არის როგორც გამოყენებითი, ასევე პრინციპული თვალსაზრისით. გამოყენებითი თვალსაზრისით, ყველაზე მნიშვნელოვანი პრობლემა ის არის, რომ ის ხსნის მრავალი პროცესის ავტომატიზაციის შესაძლებლობას, რომლებიც ადრე დაკავშირებული იყო ცოცხალი ტვინის აქტივობასთან. ფუნდამენტურად მნიშვნელოვანი პრობლემები დაკავშირებულია კვებასთან, რისი გაკეთება შეუძლია EOM-ს და არა.

გამოსახულების ამოცნობის მეთოდების მართვის ამოცანების განხილვისას ტერმინი „სურათი“ იცვლება ტერმინით „სტანი“. სტროფი არის ობიექტის ვიბრაციული დენის (მიტივი) მახასიათებლების ასახვის ფორმის სიმღერა, რომელიც უნდა იყოს უზრუნველყოფილი, რომ სტროფების მთლიანობა აღნიშნავს სიტუაციას.

სიტუაციას ჩვეულებრივ უწოდებენ დასაკეცი ობიექტის ეტაპების მთლიანობას, რომელთაგან ყველა ხასიათდება ობიექტის იგივე ან მსგავსი მახასიათებლებით. მაგალითად, ვინაიდან კონტროლის ობიექტი განიხილება, როგორც სიფრთხილის ობიექტი, სიტუაცია აერთიანებს ამ ობიექტის ისეთ ასპექტებს, რომლებშიც იგივე საკონტროლო შეყვანებია ჩარჩენილი. ვინაიდან სიფრთხილის ობიექტი თამაშია, სიტუაცია აერთიანებს მთელ თამაშს.

ობიექტების გამომავალი აღწერილობის არჩევა სურათის ამოცნობის დაწყების პრობლემის ერთ-ერთი მთავარი ამოცანაა. თუ თქვენ წარმატებით აირჩიეთ გამომავალი აღწერა (გავრცელების ნიშანი), იდენტიფიკაცია შეიძლება აშკარა იყოს. და ბოლოს, გამომავალი აღწერა შეიძლება მოჰყვეს ინფორმაციის შემდგომ დამუშავებას ან გადაწყვეტის თვალსაზრისით.

გეომეტრიული და სტრუქტურული მიდგომები.

გამოსახულება წარმოიქმნება თუ არა ობიექტის დაცვის შედეგად სწავლის ან ექსპერიმენტის პროცესში, თქვენ შეგიძლიათ მიანიჭოთ ვექტორის სახე და, შესაბამისად, რაიმე სახის სივრცის ნიშნის წერტილის გამოჩენა.

დადასტურებულია, რომ სურათების ჩვენებისას შესაძლებელია მათი ცალსახად შემცირება ერთ-ერთ (ან რამდენიმე) სურათზე, შემდეგ დასტურდება, რომ ნებისმიერ მოცემულ სივრცეში არის ორი ან რამდენიმე უბანი, რომლებიც არ ფარავს მთავარ წერტილებს და გამოსახულების წერტილებს. ამ რეგიონებიდან. ასეთი უბნის კანის წერტილს შეიძლება მიენიჭოს სახელი, რათა მას მიეცეს სახელი, რომელიც შეესაბამება სურათს.

სურათების ამოცნობის დაწყების პროცესი ინტერპრეტირებულია გეომეტრიული სურათის თვალსაზრისით, რომელიც ამჟამად შეზღუდულია ორზე მეტი სურათის ამოცნობით. ამიერიდან მნიშვნელოვანია ვიცოდეთ, რომ მოცემულ სივრცეში აუცილებელია ორი უბნის გამოყოფა და ამ ტერიტორიების გარეთ წერტილები ნაჩვენები. თავად ეს ტერიტორიები ადრე არ არის დანიშნული, ამიტომ არ არის ინფორმაცია მათი განაწილების შესახებ ამა თუ იმ ზონისთვის ქულების მინიჭების წესებს შორის.

როდესაც დაიწყებთ, წარმოდგენილია პუნქტები, რომლებიც შემდგომში შერჩეულია ამ სფეროებიდან და მოცემულია ინფორმაცია იმ სფეროების შესახებ, რომლებზეც წარმოდგენილია პუნქტები. ჩვენ გვჭირდება დამატებითი ინფორმაცია ამ ტერიტორიების შესახებ, რათა არ გამოცხადდეს მათი კორდონების გაფართოება.

მეტა-დასაწყისი დევს ან ყოველდღიურ ზედაპირზე, რომელიც გამოყოფს არა მხოლოდ მინიშნებებს წერტილის დასაწყისში, არამედ სხვა წერტილებსაც, რომლებიც დევს ამ ადგილებში, ან ყოველდღიურ ზედაპირზე, ისე რომ ამ უბნებს შორის ისე, რომ კანი მათგან ერთი სურათის მხოლოდ რამდენიმე წერტილია. წინააღმდეგ შემთხვევაში, როგორც ჩანს, არსებობს მეტა-ინტუიცია ისეთი ფუნქციების გამოყენებაში, როგორიცაა გამოსახულების ვექტორები, რომლებიც, მაგალითად, დადებითი იქნება ერთი სურათის ყველა წერტილში და უარყოფითი მეორე სურათის ყველა წერტილში.

იმის გამო, რომ ტერიტორიებს არ გააჩნიათ ძლიერი მხარეები, ყოველთვის იქნება მათ გამიჯნული ფუნქციების ნაკლებობა და შედეგად, ერთ-ერთი მათგანი იქნება დამნაშავე. იმის გამო, რომ გამოსახულებები, რომლებიც ჩნდება, დევს არა ორად, არამედ სურათთა უფრო დიდ რაოდენობაში, მაშინ ამოცანა მდგომარეობს იმ მითითებების საფუძველზე, რომლებიც მდებარეობს ზედაპირზე წერტილების დასაწყისში, რომელიც გამოყოფს ყველა იმ ადგილს, რომელიც შეესაბამება ამ სურათებს. ერთი სახის ერთი.

ეს ამოცანა შეიძლება შესრულდეს, მაგალითად, თითოეული ფუნქციის მიმართულებით, რომელიც ერთსა და იმავე მნიშვნელობას იძენს კანის უბნების წერტილებზე, მაგრამ სხვადასხვა უბნის წერტილებზე, ამ ფუნქციის მნიშვნელობა შეიძლება განსხვავდებოდეს.

შესაძლოა, არეალის რამდენიმე პუნქტზე მეტის ცოდნა არ იყოს საკმარისი მთელი არეალის გასაძლიერებლად. თქვენ შეგიძლიათ მარტივად მიუთითოთ რამდენიმე სხვადასხვა უბანი, რომელიც განთავსდება ამ წერტილებზე, და თუ ზედაპირი, რომელზეც ჩანს ტერიტორია, არ არის განთავსებული მათზე, შეგიძლიათ მიუთითოთ სხვა არე, რომელიც გადააადგილებს ზედაპირს და შემდეგ მოათავსეთ ეს წერტილები.

თუმცა, ცხადია, რომ ინფორმაცია მიმდებარე ფუნქციის შესახებ წერტილის სიმრავლის არეალში არსებითად იგივეა, რაც მთელი სიმრავლე, რომლისთვისაც ფუნქციაა მინიჭებული და არის პირველადი მათემატიკური პრობლემა მიახლოების ფუნქციის შესახებ. ცხადია, ასეთი ამოცანების მნიშვნელობა მოიცავს ფუნქციების კლასზე აუცილებელი საზღვრების განხორციელებას და ამ საზღვრების არჩევანი დამოკიდებულია იმ ინფორმაციის ბუნებაზე, რომელიც მკითხველს შეუძლია დაწყების პროცესში მიაწოდოს.

ერთ-ერთი ასეთი მინიშნებაა ჰიპოთეზა გამოსახულების კომპაქტურობის შესახებ.

გამოსახულების ამოცნობის დაწყების პრობლემის გეომეტრიული ინტერპრეტაციის გარდა, ჩნდება სხვა მიდგომა, რომელსაც სტრუქტურული და ლინგვისტური ეწოდება. მოდით შევხედოთ ლინგვისტურ მიდგომას გამოსახულების ამოცნობის აპლიკაციიდან.

თქვენ შეგიძლიათ დაუყოვნებლივ ნახოთ გამოსავლების ნაკრები, რომ გაიგოთ - ტიპიური ფრაგმენტები, რომლებიც ჩნდება სურათზე და ფრაგმენტების ურთიერთ როტაციის მახასიათებლები (მარცხენა, ქვედა, შუა და ა.შ.). ეს ახალი ცნებები ქმნის ლექსიკას, რომელიც იძლევა სხვადასხვა ლოგიკური გამოთქმის საშუალებას, რომელსაც ზოგჯერ წინადადებებსაც უწოდებენ.

მიზანია რაც შეიძლება მეტი რამის დადგენა, რათა წაახალისოს ადგილობრივები გაიგონ, როგორ შეარჩიონ სწორი სიტყვები კონკრეტული სიტუაციისთვის. გარდა ამისა, ბოლოებისა და გვერდების დათვალიერებისას, კანის სურათიდან შეიძლება იყოს მცირე რაოდენობის ობიექტები, საჭირო იქნება ამ სურათების აღწერა.

მოვალეობების აღწერილობა საჭირო იყო, რომ ყოფილიყო იმდენად სრული, რომ განესაზღვრა მოცემული ობიექტის კვებითი მდგომარეობა. ლინგვისტური მიდგომის განხორციელებისას ჩნდება ორი ამოცანა: გამომავალი ლექსიკონის მოთხოვნის დაზუსტება ტიპიური ფრაგმენტების ნაკრებისთვის და მოცემული ლექსიკონის ელემენტების აღწერის სწრაფი წესების დაზუსტება.

ლინგვისტური ინტერპრეტაციის ფარგლებში ანალოგია კეთდება გამოსახულების სტრუქტურასა და ენის სინტაქსს შორის. ეს ანალოგია შთაგონებული იყო მათემატიკური ლინგვისტიკის აპარატის გამოყენების შესაძლებლობით, ვინაიდან მეთოდები სინტაქსური ხასიათისაა. მათემატიკური ლინგვისტური აპარატის გამოყენება გამოსახულების სტრუქტურის აღწერისთვის შეიძლება გამოყენებულ იქნას მხოლოდ მას შემდეგ, რაც სურათის სეგმენტაცია დასრულდა მარაგში, შემდეგ კი წარმოიქმნება სიტყვები ტიპიური ფრაგმენტების და მათი ძიების მეთოდების აღსაწერად.

წინა სამუშაოს შემდეგ, რომელიც უზრუნველყოფს სიტყვების ხილვადობას, წარმოიქმნება ენობრივი ამოცანები, რომლებიც წარმოიქმნება აღწერილობების ავტომატური გრამატიკული ანალიზის ამოცანიდან გამოსახულების ამოცნობისთვის.

კომპაქტურობის ჰიპოთეზა.

თუ ვივარაუდებთ, რომ სივრცის დაწყების პროცესში ნიშანი ყალიბდება დაგეგმილი კლასიფიკაციის მიხედვით, მაშინ შეგვიძლია ვივარაუდოთ, რომ სივრცისთვის მიცემული ნიშანი თავად ადგენს ძალას, ნებისმიერი გამოსახულების შემოდინებით, საიდანაც სივრცის გაზიარება ადვილია. . გალუსაში მუშაობის განვითარების იგივე იმედმა, გამოსახულებების ამოცნობამ, ხელი შეუწყო კომპაქტურობის ჰიპოთეზის გაჩენას, რაც ნიშნავს: გამოსახულებები წარმოდგენილია კომპაქტური მამრავლებით ნიშნების სივრცეში.

კომპაქტური, გამჭვირვალე მიდგომის პირობებში, ჩვენ შეგვიძლია გავიგოთ ლაქების შედედების არსებობა ღია ცის ქვეშ, რაც საშუალებას იძლევა, რომ ამ თრომბებს შორის იყოს გამონადენი, რომელიც აშორებს მათ. თუმცა, ეს ჰიპოთეზა ჯერ არ არის ექსპერიმენტულად დადასტურებული. მიუხედავად იმისა, რომ ეს თეორიები, რომლის ფარგლებშიც კარგად იყო ჩამოყალიბებული კომპაქტურობის ჰიპოთეზა, ყოველთვის მოიძებნებოდა მარტივი გადაწყვეტილებები და ხრიკები, რომელთა ჰიპოთეზა არ დადასტურდა, ან საერთოდ არ სჭარბობდა, ან ჭარბობდა ძალით და დამატებითი ინფორმაციის მიღებით.

თვით კომპაქტურობის ჰიპოთეზა გარდაიქმნება დამაკმაყოფილებელი მოწინავე აღიარების შესაძლებლობის ნიშნად.

კომპაქტურობის ჰიპოთეზის ფორმულირება მოაქვს აბსტრაქტული გამოსახულების გაგებას. თუ სივრცის კოორდინატებს შემთხვევით აირჩევთ, მაშინ მასში არსებული სურათები დაყოფილი იქნება სხვადასხვა განყოფილებებად. სივრცის ზოგიერთ ნაწილში სუნი უფრო ძლიერდება, ვიდრე სხვებში.

ეგრეთ წოდებული თამამი არჩევანი ვრცელდება აბსტრაქტულ სურათებზე. ამ აბსტრაქტულ სივრცეს შეიძლება ჰქონდეს პუნქტების მელოდიური და კომპაქტური სიმრავლე. ამიტომ, კომპაქტურობის ჰიპოთეზის შესაბამისად, უსახო ობიექტებს, რომლებიც აბსტრაქტულ სივრცეში წარმოადგენს კომპაქტურ, უსახო წერტილებს, ჩვეულებრივ უწოდებენ მოცემული სივრცის აბსტრაქტულ გამოსახულებებს.

ნავიგაცია და თვითინფლაცია, ადაპტაცია და ინოვაცია.

გადაწყდა, რომ აღვნიშნოთ, რომ არსებობს ფარული ძალა, რომელიც არ მდგომარეობს გამოსახულების ბუნებაში და არც მათ გამოსახულებაში, არამედ ნიშნავს განცალკევებულობის შექმნას, შემდეგ წყაროების ამოცნობის დასაწყისის ძირითადი ამოცანების წესრიგს. კანის ობიექტის მდებარეობის შესახებ ინფორმაციის საწყისი თანმიმდევრობიდან ამა თუ იმ გამოსახულებამდე, შესაძლებელი იქნებოდა სხვა კლასიფიკაციის დავალების დაყენება - ეს არის დავალების სახელი მკითხველის გარეშე.

აღწერის დონეზე მსგავსი დავალება შეიძლება ჩამოყალიბდეს შემდეგი თანმიმდევრობით: სისტემა დაუყოვნებლივ ან თანმიმდევრულად წარმოაჩენს ობიექტებს ყოველგვარი მითითების გარეშე მათ სურათებთან კავშირის შესახებ. სისტემის შეყვანის მოწყობილობა აჩვენებს არაობიექტურ ობიექტებს არაუწყვეტ სურათებზე და, ცალკეული სურათების სიმძლავრის საფუძველზე, ქმნის ამ ობიექტების დამოუკიდებელ კლასიფიკაციას.

ასეთი პროცესის შემდეგ, თვითდახურვის სისტემამ შეიძლება დაიწყოს არა მხოლოდ უკვე ნაცნობი ობიექტების ამოცნობა (ობიექტები საწყისი თანმიმდევრობიდან), არამედ ისეთებიც, რომლებიც ადრე არ იყო წარმოდგენილი. ოპერაციული სისტემის თვითინიციაციის პროცესი ისეთი პროცესია, რის შედეგადაც სისტემა, მასწავლებლის მოთხოვნის გარეშე, ახდენს მონაცემების ინკუბირებას, სანამ არ შეიმუშავებს ახალ რეაქციებს ერთი და იმავე სურათის ობიექტების სურათებზე და განსხვავებულ რეაქციას სხვადასხვა სურათებზე. სურათები.

მკითხველის როლი მდგომარეობს მხოლოდ აქტიური ობიექტური ძალის სისტემაში, მაგრამ ყველა გამოსახულებაში და გამოსახულების უპიროვნო ობიექტების თავდაპირველ ქმნილებაში.

როგორც ჩანს, ასეთი ობიექტური ძალა გამოსახულების კომპაქტურობის ძალაა. არჩეულ სივრცეში წერტილების ურთიერთ გაფართოება შეიცავს ინფორმაციას წერტილის გამოყოფის შესახებ. ეს ინფორმაცია ასევე ნიშნავს გამოსახულების განცალკევების ძალას, რაც საკმარისია გამოსახულების ამოცნობის სისტემის თვითინიციირებისთვის.

ამჟამინდელი თვითდაწყებული ალგორითმების უმეტესობა ხედავს ნაკლებად აბსტრაქტულ სურათებს, ვიდრე უფრო კომპაქტურ სიმრავლეს მოცემულ სივრცეებში. მათ შორის განსხვავება მდგომარეობს კომპაქტურობის კონცეფციის ფორმალიზებაში. თუმცა, ეს არ ამცირებს და ყოველ შემთხვევაში ზრდის თვითდაწყების ალგორითმების მნიშვნელობას, რადგან ხშირად თავად სურათები არანაირად არ არის მნიშვნელოვანი და ამოცანა მდგომარეობს იმაში, თუ როგორ უნდა წარმოადგინოთ ქვეჯგუფები მოცემულ სივრცეში є სურათები.

ასეთი განცხადების მაგალითი მოცემულია სოციოლოგიურ კვლევაში, როდესაც ადამიანთა ჯგუფები ჩანს კერძების ნაკრებიდან. ასეთი მარტივი ამოცანისთვის, თვითდაწყებული ალგორითმები წარმოქმნიან მანამდე უცნობ ინფორმაციას გამოსახულების მოცემულ სივრცეში არსებობის შესახებ, რომლებიც ადრე არ იყო აღმოჩენილი.

გარდა ამისა, თვითინსტრუქციის შედეგი ახასიათებს შერჩეული სივრცის ვარგისიანობას საწყისი ამოცნობის კონკრეტული ამოცანისთვის. როგორც აბსტრაქტული გამოსახულებები, რომლებიც ხედავენ საკუთარი თავის სიამოვნების სივრცის, გაურბიან რეალურს, მაშინ სივრცე იშლება. რაც უფრო მეტი აბსტრაქტული გამოსახულებები განსხვავდება რეალურთან, მით უფრო რთულია სივრცის შერჩევა კონკრეტული ამოცანისთვის.

დღესდღეობით ჩვენ ვუწოდებთ ვიბრაციის პროცესს მიმდინარე სისტემაში და სხვა რეაქციებს გარე იდენტური სიგნალების ჯგუფებზე, რაც იწვევს გარე კორექტირების სისტემაში დიდ შემოდინებას. ამ შესწორების წარმოქმნის მექანიზმი თითქმის მთლიანად დამოკიდებულია სწავლის ალგორითმზე.

თვითდაჯერებულობა ძირს უთხრის იმ ფაქტს, რომ არ არის მოწოდებული დამატებითი ინფორმაცია სისტემის რეაქციის სიზუსტის შესახებ.

ადაპტაცია არის სისტემის პარამეტრებისა და სტრუქტურის და, შესაძლოა, სხვა მონაცემების შეცვლის პროცესი, რომელიც დაფუძნებულია გადინებულ ინფორმაციას ისე, რომ მიაღწევს სისტემის ბირთვს და ცვლის რობოტის გონებას.

დასაწყისი არის პროცესი, რომლის შედეგია ის, რომ სისტემა თანდათან იძენს უნარს, უპასუხოს საჭირო რეაქციებს გარე შეყვანის მთლიანობაზე, ხოლო ადაპტაცია არის პარამეტრების და სისტემის სტრუქტურის კორექტირება, რათა მიაღწიოს საჭირო ფსკერს. გონების კონტროლის სისტემა არის გარე გონების მუდმივი ცვლილება.


ფილმების ამომცნობი სისტემები.

ენა ადამიანებისთვის კომუნიკაციის მთავარი საშუალების როლს ასრულებს და ამიტომ კომუნიკაცია ადამიანის ინტელექტუალური სისტემის ერთ-ერთი ყველაზე მნიშვნელოვანი კომპონენტია. ამოცნობა არის აკუსტიკური სიგნალის სიგნალად გადაქცევის პროცესი, რომელიც წარმოიქმნება მიკროფონის ან ტელეფონის გამომავალზე.

უფრო რთული ამოცანები მოიცავს ენის გაგების ამოცანას, რომელიც დაკავშირებულია აკუსტიკური სიგნალის გამოვლენილ გრძნობასთან. და აქ აღქმის ამოცნობის ქვესისტემის გამომავალი ემსახურება როგორც დაზვერვის გაგების ქვესისტემის შეყვანას. ენის ავტომატური ამოცნობა (APP სისტემები) ბუნებრივი ენის დამუშავების ერთ-ერთი პირდაპირი ტექნოლოგიაა.

მეტყველების ავტომატური ამოცნობა დგინდება EOM-ში ტექსტების შეყვანის ავტომატიზაციისას, მონაცემთა ბაზებზე და საინფორმაციო ხმოვან სისტემებზე ჩვეულებრივი მოთხოვნების ფორმირებისთვის, სხვადასხვა ინტელექტუალური მოწყობილობებისთვის ჩვეულებრივი ბრძანებების გენერირებისთვის.

ენის ამომცნობი სისტემების ძირითადი ცნებები.

ენის ამოცნობის სისტემები ხასიათდება მრავალფეროვანი პარამეტრით.

ერთ-ერთი მთავარი პარამეტრი არის სიტყვების ამოცნობის (LR) დარბილება. ეს პარამეტრი მერყეობს ამოუცნობი სიტყვების რიცხვიდან წარმოთქმული სიტყვების რაოდენობამდე.

სხვა პარამეტრები, რომლებიც ახასიათებს ფილმის ავტომატური ამოცნობის სისტემებს, არის:

1) ლექსიკის ზომა,

2) სარეკლამო რეჟიმი,

3) ფილმის სტილი,

4) საგნობრივი სფერო,

5) სპიკერზე დამოკიდებულება,

6) აკუსტიკური ხმაურის მოცულობა,

7) შეყვანის არხის ინტენსივობა.

APP სისტემის ლექსიკონი მკაცრად იყოფა ჯგუფებად:

ლექსიკის მცირე ზომით (100 სიტყვამდე),

ლექსიკონის საშუალო ზომიდან (100 სიტყვიდან რამდენიმე ათას სიტყვამდე),

ლექსიკონის დიდი ზომით (10000-ზე მეტი სიტყვა).

ენის რეჟიმი ახასიათებს სიტყვების წარმოთქმის ხერხს. არსებობს მავნე ენის ამოცნობის სისტემები და სისტემები, რომლებიც საშუალებას გაძლევთ ამოიცნოთ ცალკეული სიტყვები. იზოლირებული სიტყვების ამოცნობის რეჟიმში მოსაუბრეს სჭირდება მოკლე პაუზები სიტყვებს შორის.

ენის სტილის მიხედვით, APP სისტემები იყოფა ორ ჯგუფად: დეტერმინისტული ენობრივი სისტემები და სპონტანური ენობრივი სისტემები.

დეტერმინისტული ენის ამოცნობის სისტემებში მოსაუბრე ქმნის ენას, იცავს ენის გრამატიკულ წესებს. სპონტანურ ენას ახასიათებს გრამატიკული წესების დარღვევა და უფრო რთული ამოსაცნობია.

საგნის სფეროდან გამომდინარე, შეგიძლიათ ნახოთ APP სისტემები, რომლებიც ორიენტირებულია უმაღლესი განათლების სფეროებზე (მაგალითად, მონაცემთა ბაზებზე წვდომა) და APP სისტემები შეუზღუდავი სტაგნაციის ზონით. დანარჩენი ხაზს უსვამს ლექსიკის მნიშვნელობას და შეუძლია უზრუნველყოს სპონტანური ენის ამოცნობა.

მეტყველების და დინამიკების ავტომატური ამოცნობის უამრავი სისტემა არსებობს. ეს გადასცემს სისტემის წინასწარ კორექტირებას კონკრეტული სპიკერის კონკრეტულ საჭიროებებზე.

ენის ამოცნობის ამოცანის სირთულე აიხსნება აკუსტიკური სიგნალების დიდი მრავალფეროვნებით. ეს სიმრავლე აიხსნება რამდენიმე მიზეზით:

უპირველეს ყოვლისა, არსებობს ფონემების მრავალფეროვანი განხორციელება - ენის ხმოვანი სტრუქტურის ძირითადი ერთეულები. აბონენტის ფონემების განხორციელების სიმრავლე ყოველდღიური ბგერების შემოდინებაში ადამიანის ქოთანში. ფონემების განხორციელების ვარიაციებს, ბგერითი გამონათქვამების მსგავსი, ალოფონები ეწოდება.

სხვა სიტყვებით რომ ვთქვათ, ჩვენ ვხდებით აკუსტიკური მოწყობილობების მახასიათებლები.

მესამე, ერთი და იგივე დიქტორის დაწინაურების პარამეტრების შეცვლით, დიქტორის განსხვავებული ემოციური მდგომარეობის, მისი დაწინაურების ტემპის გათვალისწინებით.

ამოცნობის სისტემის ძირითადი კომპონენტები წარმოდგენილია ქვემოთ:

როდესაც სიგნალი ციფრულია, ის მიდის წინა დამუშავების ბლოკში, სადაც ჩანს ნიშანი, რომელიც მოითხოვს ხმის ამოცნობას. ბგერების ამოცნობა ხშირად მიიღწევა ხელოვნური ნერვული ქსელების მოდელების გამოყენებით. შემდეგ შეირჩევა აუდიო ერთეულები სიტყვების თანმიმდევრობის მოსაძებნად, რომელიც საუკეთესოდ ემთხვევა შეყვანის სიგნალს.

სიტყვების თანმიმდევრობის ხმა მისდევს აკუსტიკური, ლექსიკური და ვერბალური მოდელების დახმარებით. მოდელების პარამეტრები განისაზღვრება საწყისი მონაცემების საფუძველზე ძირითადი ალგორითმების საფუძველზე.

ფილმის სინთეზი ტექსტით. Ძირითადი ცნებები

ხშირ შემთხვევაში, დაზვერვის სისტემების შექმნა მისი შერწყმის ელემენტებით იწვევს ინფორმაციის შექმნას ფიზიკური ფორმის შესახებ. პატარა გვიჩვენებს ინტელექტუალური ელექტრომომარაგების სისტემის ბლოკ დიაგრამას მობილური ინტერფეისით:

მალიუნოკი 1.

წაიღეთ ოლეგის რამდენიმე ლექცია

მოდით შევხედოთ სარეკლამო ელემენტების ამოცნობის ემპირიული მიდგომის თავისებურებებს. მნიშვნელობა მდგომარეობს წინადადების სიტყვებზე მინიჭებულ ტეგებში: არსებითი სახელი, სიტყვა, აპლიკატორი, დანართი და ა.შ. გარდა ამისა, აუცილებელია სახელებისა და სახელების გარკვეული დამატებითი ნიშნების მითითება. მაგალითად, სახელისთვის - რიცხვი, ხოლო სიტყვისთვის - ფორმა. ჩვენ ვაფორმებთ დავალებას.

წარმოვიდგინოთ სიტყვები, როგორც სიტყვების თანმიმდევრობა: W=w1 w2…wn, სადაც wn არის ცვლადი ცვლილება, რომელიც წაშლის ერთ-ერთ შესაძლო მნიშვნელობას, რომელიც ეკუთვნის ენის ლექსიკონს. ნიშნების თანმიმდევრობა, რომლებიც ენიჭება სიტყვის სიტყვებს, შეიძლება წარმოდგენილი იყოს X = x1 x2 ... xn თანმიმდევრობით, სადაც xn არის შემთხვევითი ცვლილებები, რომელთა მნიშვნელობები განისაზღვრება შესაძლო ნიშნების უპიროვნოობაზე.

ამრიგად, ფილმის ნაწილების მითითებული ამოცნობა მდგომარეობს x1, x2, …, xn ნიშნების ყველაზე უნიკალური თანმიმდევრობის ძიებაში w1, w2, …, wn სიტყვების მოცემული თანმიმდევრობის შემდეგ. წინააღმდეგ შემთხვევაში, აუცილებელია ვიცოდეთ ნიშნების ისეთი თანმიმდევრობა X*=x1 x2 … xn, რომელიც უზრუნველყოფს მაქსიმალურ გონებრივ ვალიდობას P(x1, x2, …, xn| w1 w2.. wn).

მოდით გადავიწეროთ P(X|W) მენტალიტეტი ამ ფორმით P(X|W)=P(X,W)/P(W). აქედან გამომდინარე, აუცილებელია ვიცოდეთ მაქსიმალური გონებრივი შესაძლებლობები P(X,W) X ცვლადიდან, გამოვაკლოთ X*=arg x max P(X,W). კონკურენტული ინტელექტი P(X,W) შეიძლება დაიწეროს გონებრივი ინტელექტის სახით: P(X,W) = სიმტკიცე i-1-ზე n vid P(x i |x1,…,x i -1 , w1,…,w i -1 ) P (wi | x1, ..., x i -1, w1, ..., w i -1). ამ გაგების მაქსიმუმის განურჩეველი ძიება კიდევ უფრო რთულია და მიუხედავად დიდი მნიშვნელობებისა, საძიებო სივრცე კიდევ უფრო დიდი ხდება. მაშასადამე, მნიშვნელობები, რომლებიც ჩაწერილია ამ ნაშრომში, უფრო ადვილად მიახლოებულია მარტივი გონებრივი მნიშვნელობებით: P(xi|xi-1) P(wi|wi-1). ამ შემთხვევაში მნიშვნელოვანია, რომ მნიშვნელოვანი ნიშანი x i დაკავშირებული იყოს მხოლოდ წინა ნიშანთან x i -1 i და არ დევს ადრინდელი ნიშნების უკან, ასევე, რომ სიტყვის w i ავთენტურობა განისაზღვროს მხოლოდ ნაკადის ნიშნით x i. . მნიშვნელოვან ვარაუდებს მარკოვიანს უწოდებენ, ხოლო უმაღლეს ვარაუდებს მარკოვის მოდელების თეორიას. მარკივის ვარაუდების მიხედვით შეიძლება დაწეროთ:

X*= arg x1, …, xn max P i =1 n P(x i | x i -1) P(wi|wi-1)

დე გონივრულობა ფასდება საწყისი მონაცემების უპიროვნებაზე

X* ნიშნების თანმიმდევრობის ძიება მიჰყვება ვიტერბის დინამიური პროგრამირების ალგორითმს. ვიტერბის ალგორითმი შეიძლება ჩაითვალოს ძებნის ალგორითმის ვარიანტად სადგურების გრაფიკზე, სადაც წვეროები წარმოდგენილია ხაზების ეტიკეტებით.

დამახასიათებელია, რომ ნებისმიერი დინების წვეროსთვის უსახო ქალიშვილის ნიშნები ყოველთვის ერთნაირია. მათ ზემოთ მამის მწვერვალების უსახურობის კანის ასული მწვერვალებიც ერთად ეშვებიან. აღვნიშნავთ, რომ სადგურების გრაფიკი შეძლებს ყველა შესაძლო ნიშანზე გადასვლას. მარკოვის გეგმა უზრუნველყოფს ენის ნაწილების გამარტივებულ ამოცნობას, ხოლო სიტყვებში ნიშნების ამოცნობაში მაღალი სიზუსტის შენარჩუნებას.

ამრიგად, 200 ნიშნის არსებობისთვის, სიზუსტე არის დაახლოებით 97%. დიდი ხნის განმავლობაში, იმპერიული ანალიზი ეყრდნობოდა სტოქასტური კონტექსტისგან თავისუფალი გრამატიკების დახმარებას. მას აქვს დამახასიათებელი შინაარსის სიმცირე. სიმართლე ისაა, რომ სხვადასხვა გრამატიკულ ანალიზს ახალი ვალიდობა შეიძლება მივიჩნიოთ. ეს რეალიზდება იმით, რომ გრამატიკული ანალიზის თანმიმდევრულობა წარმოდგენილია ანალიზში მონაწილე წესების თანმიმდევრულობის გარეგნობით. რაც დრო გადის, ხდება სხვადასხვა წესების ანალიზი, რომლებიც ხასიათდება ახალი განსხვავებებით, რაც პრობლემას წარმოშობს. საუკეთესო შედეგებს აღწევს გრამატიკა, რომელიც მოიცავს ენობრივ ლექსიკას.

ამ ტიპის წესი მოიცავს აუცილებელ ლექსიკურ მახასიათებლებს, რომლებიც უზრუნველყოფენ ერთი და იმავე წესის მოქმედების სხვადასხვა მნიშვნელობას სხვადასხვა ლექსიკურ განმარტებებში. იმპერიული სინტაქსური ანალიზი დიდწილად მხარს უჭერს სურათების ამოცნობას და არა კლასიკური მეტყველების ტრადიციულ გრამატიკულ ანალიზს.

განმეორებითმა კვლევამ აჩვენა, რომ ბუნებრივი ენის დამატებების იმპერიული გრამატიკული ანალიზის სისწორე შედარებულია ტრადიციულ გრამატიკულ ანალიზთან.

დღევანდელი რობოტები, ტექნიკური ხედვის სისტემებით, კარგად მუშაობენ რეალურ სამყაროში მუშაობისთვის. სუნი შეიძლება მუშაობდეს, როგორც მინიშნებები იმის შესახებ, თუ რა ტიპის ობიექტებია წარმოდგენილი, რა ძარღვებში გვხვდება სუნი ერთმანეთთან, როგორ იქმნება ჯგუფები.

ამოცნობის ამოცანის არსი მდგომარეობს იმაში, რომ დაადგინოთ და დააყენოთ ობიექტები, რომლებიც შედის, ნიშნების ფიქსირებული ბოლო ნაკრებით, რაც საშუალებას გაძლევთ შეხვიდეთ პირველ კლასში.

გამოსახულების ამოცნობის მეცნიერების მიზნები:

ადამიანის ექსპერტის ან დასაკეცი საექსპერტო სისტემის შეცვლა უფრო დიდი მარტივი სისტემით (აქტივობის ავტომატიზაცია და დასაკეცი სისტემების გამარტივება);

არის სისტემები, რომლებიც იწყებენ გადაწყვეტილების მიღებას მკაფიო წესების დანერგვის გარეშე და სისტემები, რომლებიც იწყებენ გადაწყვეტილების მიღების წესების სინთეზს იშენის სწორი აპლიკაციების სისტემის „დემონსტრაციების“ საბოლოო რაოდენობის საფუძველზე.

Zavodannya აღიარებაშეიძლება დახასიათდეს ამ გზით.

1. ეს არის საინფორმაციო მონაცემი, რომელიც შედგება ორი ძირითადი ეტაპისგან: გამომავალი მონაცემების ამოცნობის ფორმაში გადაყვანა და სიმძლავრის ამოცნობა.

2. ამ ნაშრომებში შესაძლებელია საგნების ანალოგიისა და მსგავსების ცნების დანერგვა და საგნების სიახლოვის ცნების ჩამოყალიბება, როგორც ობიექტის პირველ კლასში დამაგრების საფუძველი.

3. ამ ამოცანების შესრულება შესაძლებელია აპლიკაციების კომპლექტით, რომელთა კლასიფიკაციაც მონაცემები და ფორმალიზებული აღწერილობების ტიპი შეიძლება წარმოდგენილი იყოს ამოცნობის ალგორითმში ამოცანის პროცესის რეგულირებისთვის.

4. ამ კვლევებისთვის მნიშვნელოვანია ფორმალური თეორიები და კლასიკური მათემატიკური მეთოდები.

5. ამ ადგილებს შეიძლება ჰქონდეს ცუდი ინფორმაცია.

აღიარების განყოფილების ტიპი:

წარმოდგენილი ობიექტის გაფართოება ერთ-ერთ კლასზე (დაიწყება მასწავლებლით);

ავტომატური კლასიფიკაცია – მათი აღწერის უკან არსებული უპიროვნო ობიექტების (სიტუაციების) დაყოფა კლასობრივ სისტემად, რომელიც არ იცვლება;

დეინსტალაციისას აირჩიეთ საინფორმაციო ნიშნების ნაკრები;

გამომავალი მონაცემების შემცირება ფორმაზე, რომელიც ადვილად ამოსაცნობია;

დინამიური ამოცნობა და დინამიური კლასიფიკაცია;

პროგნოზი გაკეთებულია.

მთავარი მიზანი

გამოსახულება- ობიექტის ან ობიექტის აღწერილობის სტრუქტურირების პროცესი, მისი წარმოდგენა ნიშნების ვექტორით, რომლის კანის ელემენტი წარმოადგენს ერთი ნიშნის რიცხვით მნიშვნელობას, რომელიც ახასიათებს ამ ობიექტს. სხვა სიტყვებით რომ ვთქვათ: გამოსახულება არის ობიექტი, რომლისთვისაც შეიძლება შეიქმნას რიცხვითი ნიშნების ნაკრები. გამოსახულების მაგალითი: ასო, გამოსახულება, კარდიოგრამა და ა.შ.

რიცხვითი ნიშანი(ან უბრალოდ ნიშანი). - ეს არის ფორმულა ან სხვა აღწერა ობიექტზე გარკვეული რიცხვითი მახასიათებლების მინიჭების მეთოდის გამოსახულების ამოცნობის კონკრეტული ამოცანის საზღვრებში. კანის ობიექტზე შეიძლება გამოვლინდეს მრავალი განსხვავებული ნიშანი, ისევე როგორც რიგი რიცხვითი მახასიათებლები.

გაფართოების ნიშანი.N არის ჩაბნელებული სივრცე, მნიშვნელობა ამ ამოცნობის ამოცანისთვის, სადაც N არის ჩაბნელებული სიმბოლოების ფიქსირებული რაოდენობა ნებისმიერი ობიექტისთვის. ვექტორი სივრცით არის ნიშანი, რომელიც წარმოადგენს ამოცნობის ობიექტს, N-განზომილებიანი ვექტორი კომპონენტებით (x1, x2, ..., xN), რომლებიც წარმოადგენს ამ ობიექტის მნიშვნელოვან ნიშანს.

OBJECT->N ნიშანი->M-world ვექტორული ნიშანი

Კლასი- არაფორმალური (როგორც წესი) განცხადებები ამოცნობის ობიექტების უპიროვნებიდან საკმარისი ობიექტის ობიექტების ერთ ჯგუფში შემოტანის შესაძლებლობის შესახებ. ერთი და იმავე კლასის ობიექტებისთვის გადადის მსგავსების ხარისხი. გამოსახულების ამოცნობის დასაზუსტებლად შეიძლება დაინიშნოს კლასების საკმარისი რაოდენობა, 1-ზე მეტი. კლასების რაოდენობა მითითებულია ნომრით S.

ზაგალის აზრით, გამოსახულების ამოცნობის პრობლემა შედგება ორი ნაწილისაგან: ამოცნობა და სწავლა.

ნიმუშის ამოცნობა გულისხმობს საგნების სასიმღერო ჯგუფის კლასიფიკაციას სიმღერის მახასიათებლების საფუძველზე. ობიექტები, რომლებიც მოხვდება სურათების ერთ კლასში, ატარებენ უფრო დიდ ძალას. კლასიფიკაციის მიზეზები შეიძლება განსხვავებული იყოს, რადგან სხვადასხვა სიტუაციებში შეიძლება იყოს საჭირო სხვადასხვა ტიპის კლასიფიკაცია.

მაგალითად, ინგლისური ასოების ამოცნობისას იქმნება სურათების 26 კლასი. თუმცა, ინგლისური ასოებისა და ჩინური სიმბოლოების განსხვავების მიზნით, საჭიროა მხოლოდ ორი კლასის გამოსახულება.

უმარტივესი მიდგომა სურათების ამოცნობის თანაბარი სტანდარტებით. ამ შემთხვევაში, რამდენიმე სურათი, ერთი კანის კლასში, ინახება აპარატის მეხსიერებაში. შეყვანის (ამოცნობის) სურათი (კლასისთვის უხილავი) უდრის კანის კლასის იდეალს. კლასიფიკაცია ეფუძნება მსგავსებისა და მსგავსების კრიტერიუმების შერჩეულ კრიტერიუმებს. წინააღმდეგ შემთხვევაში, როგორც ჩანს, თუ შეყვანის სურათი უკეთესად ემთხვევა სურათების i-th კლასის სტანდარტს, ვიდრე ნებისმიერი სხვა სტანდარტი, მაშინ შეყვანილი სურათი კლასიფიცირდება, როგორც სურათების i-th კლასის კუთვნილება.

მცირე განსხვავებაა ამ მიდგომაში, ანუ კომპოზიციაში ექსპრესიასთან, მაგრამ მთელი რიგი დარღვევებისთვის მნიშვნელოვანია გამოსახულების კანის კლასიდან შესაბამისი გამოხატვის შერჩევა და გარეგნობისთვის აუცილებელი კრიტერიუმის დადგენა.

უფრო საფუძვლიანი მიდგომა მდგომარეობს იმაში, რომ კლასიფიკაცია ეფუძნება შერჩეულ ვიმირებს, რომლებიც წარმოიქმნება შეყვანის სურათებზე. ეს შერჩეული მნიშვნელობები, სახელწოდებით „ნიშნები“, გადმოცემულია როგორც უცვლელი ან უგრძნობი ცვლილებებისა და ცვლილებების მიმართ, რომლებიც გამკაცრდებიან და იწვევს მცირე ქედმაღლობას.

სხვა მიდგომის გარდა, „გაქრობის ნიშანი“, რომელშიც სტანდარტები შენარჩუნებულია, როგორც გადაშენებული ნიშნები და კლასიფიკატორი იყენებს სპეციალურ კლასიფიკაციის კრიტერიუმს (გათანაბრება).

ნიშნები იდენტიფიცირებულია სპეციალისტების მიერ და უნდა იყოს უცვლელი ობიექტების ორიენტაციის, ზომისა და ფორმის ვარიაციების მიმართ.