გამოსახულების დამუშავების მეთოდები და ალგორითმები. სისტემის დანერგვა. წინა გამოსახულების მორთვა

პოდნია სურათი

გამოსახულების ორი ძირითადი ტიპი არსებობს - ვექტორული და რასტრული.

ვექტორულ ფაილში გამოსახულება აღწერილია ხაზების (ვექტორების) ნაკრებით, რომელიც მიუთითებს საწყისი და დასასრული წერტილების კოორდინატებს, წრფის გამრუდებას და სხვა გეომეტრიულ მახასიათებლებს და აღწერს წესებს სხვადასხვა უბნების ფორმისა და ფორმისთვის. ფერის მახასიათებლები. სხვა სიტყვებით რომ ვთქვათ, რასტრული ფენომენისთვის აუცილებელია გარკვეული მათემატიკური მოდელის ჩამოყალიბება. აქედან გამომდინარე, მნიშვნელოვანია, რომ არ გამოვავლინოთ ვიკორიზმის ნიშნები, მნიშვნელოვანია, რომ გამოსახულების სინთეზის სათნო ამოცანის ჟამს. თუ გსურთ გამოიყენოთ გამოსახულების ამოცნობის ალგორითმები თქვენი რობოტებისთვის, თქვენ უნდა ამოიღოთ თავად ვექტორი, რომელიც აუცილებელია გამომავალი სურათიდან.

რასტერულ გამოსახულებებს აქვთ ერთი ან მეტი მატრიცა, რომელიც აღწერს გამოსახულების მახასიათებლების სივრცით განაწილებას ნებისმიერ დეკარტის კოორდინატულ ბადეზე. ამ ტიპის სურათს ექნება მრავალი წერტილი და რასტრული სტრუქტურა. გამოსახულების რასტრული წარმოდგენის მთავარი ელემენტია პიქსელი (მოკლე ფრაზა „სურათის ელემენტები“), რომელიც შეიცავს კოორდინატებს რასტრულ კოორდინატთა სისტემაში და სხვადასხვა ატრიბუტებს (ფერი, სიკაშკაშე, სიცხადე და ა.შ.). პიქსელების რაოდენობა X და Y კოორდინატების უკან (ჰორიზონტალური და ვერტიკალური) განსაზღვრავს გამოსახულების ცალკეულ ზომას (განზომილებას). პიქსელის ფერი განისაზღვრება სიღრმით - ბიტების რაოდენობა, რომელიც საჭიროა ნებისმიერი ფერის დასაყენებლად.

რასტერული გამოსახულებები, პიქსელის ფერისა და გამოსახულების სიმძლავრის მითითების მეთოდებიდან გამომდინარე, იყოფა:

ორობითი

ნაპივტონოვი

პალიტროვი

მეტი ფერები

ბინარულ მონაცემებში, პიქსელის ფერი შეიძლება იყოს თეთრი ან შავი და დაშიფრულია ერთი ბიტით. სურათი არის მატრიცა. მატრიცის კანის ელემენტს I (i, j) აქვს მნიშვნელობები 0 ან 1, სადაც i არის მწკრივის რიცხვი, ხოლო ნომერი j არის ელემენტის სვეტი, რომელიც შეესაბამება მოცემულ პიქსელს (ნახ. 1). ).

ნაცრისფერი მასშტაბის სურათებში პიქსელებს აქვთ სიკაშკაშის მნიშვნელობები, რომლებიც შეესაბამება ნაცრისფერ ფერებს. მატრიცის ინდექსები, რომლებიც აღწერს პიქსელის სურათებს, მიუთითებენ პიქსელის პოზიციას რასტერზე და მატრიცის ელემენტის მნიშვნელობებს

- ადგენს მის სიკაშკაშეს I (i, j) (ნახ. 2).

პალიტრის სურათები აღწერილია ორი მატრიცით (ნახ. 3). ერთი ინახავს ინდექსის მნიშვნელობებს, რათა მიუთითოთ ზრდა პალიტრის მატრიცის მწკრივზე. პალიტრის მატრიცა არის ფერადი რუკა. არსებობს ფერების 3 ჯგუფი - წითელი "R", მწვანე "G" და ლურჯი "B" ფერების მსგავსი. შეგიძლიათ დააყენოთ შესაბამისი პიქსელის ფერი.

პალიტრა არის Nc 3 და Nc ზომების მატრიცა - ფერების რაოდენობა.

ნაჩვენებია წინსვლის დამუშავების ალგორითმები

მრავალფერადი სურათები იქნება RGB ფორმატში და არის სამი მატრიცა R (i, j), G (i, j), B (i, j). კანის მატრიცის ძირითადი ელემენტები ათავსებენ პიქსელისთვის წითელი, მწვანე და ლურჯი ფერების ინტენსივობის მნიშვნელობებს, რაც მითითებულია მატრიცის ინდექსებით. ამრიგად, მრავალფეროვან სურათს არ აქვს ფერადი რუკა და კანის პიქსელის ფერი წარმოდგენილია მსგავსი მატრიცებიდან აღებული სამი რიცხვით (ნახ. 4).

მატრიცებში რიცხვების ფორმატი შეიძლება იყოს მთელი ან მცურავი წერტილის ფორმატი. პირველი საკითხი ეხება ე.წ. თავად ამ ფორმატში, სურათის შესახებ ინფორმაცია ინახება სტანდარტულ გრაფიკულ ფაილებში.

კიდევ ერთი ვარიანტია შიდა წარმოდგენების გამოყენება მათი დამუშავების დროს გამოსაჩენად. ამ შემთხვევაში, თქვენ ხელით ახდენთ ინტენსივობის მონაცემების ნორმალიზებას ერთ დიაპაზონში, მაგალითად, დიაპაზონში და ახორციელებთ სხვადასხვა გამოთვლებს მცურავი რიცხვებით, შემდეგ კი შედეგს გარდაქმნით გამომავალ მთელ რიცხვში. ეს მეთოდი საშუალებას გაძლევთ შეცვალოთ გამოთვლები და გააუმჯობესოთ დამუშავების შედეგის სიზუსტე.

მრავალფერადი სურათებისთვის, ერთ-ერთი პარამეტრი არის ფერების მაქსიმალური რაოდენობა, რომელიც შეიძლება იყოს წარმოდგენილი ამ ფორმატში. ყველაზე ხშირად გამოყენებული სურათებია 16, 256, 65536 (მაღალი ფერი) და 10,7 მილიონი (ნამდვილი ფერი).

ნაჩვენებია წინსვლის დამუშავების ალგორითმები

0 0 0 0 1 1 1 0 0

120 122 125 128 115 117 118

1 0 0 0 1 1 1 1 0

119 121 124 125 128 130 133

1 1 0 0 1 1 0 0 1

122 122 124 123 127 126 128

120 121 123 125 127 125 126

1 1 1 0 1 1 0 0 0

118 110 109 108 108 109 110

0 0 1 0 0 1 0 0 1

ნაჩვენებია წინსვლის დამუშავების ალგორითმები

ინდექსის მატრიცა

31 15 03 09

პალიტრის მატრიცა

ნაჩვენებია წინსვლის დამუშავების ალგორითმები

სრული ფერადი სურათები შეიძლება იყოს ხელმისაწვდომი არა მხოლოდ RGB ფორმატში, არამედ სხვა ფერთა სისტემებშიც.

HSB სისტემაში ფერი წარმოდგენილია შემდეგი ფერის მახასიათებლებით: Hue - ფერის ტონი;

სატურაცია – გაჯერება; სიკაშკაშე - სიკაშკაშე.

მნიშვნელოვანია აღინიშნოს, რომ ეს ფერის სისტემა ასახავს ადამიანის ფერის აღქმის თავისებურებებს.

LAB სისტემაში ფერი განიხილება, როგორც სიკაშკაშის (სიმსუბუქის) ჯამი და ორი დამოუკიდებელი ფერის მნიშვნელობა, რომელიც მიუთითებს პიქსელის ნამდვილ ფერზე. ფერი A – საწყობის ფერი შეირჩევა იისფერიდან მწვანემდე დიაპაზონში. ფერი B - საწყობის სხვა ფერი შეირჩევა ღიადან შავამდე დიაპაზონიდან.

შეიმუშავეთ ფერის მიწოდების სხვა სისტემები. ბუნებრივია, ერთ ფენომენთან დაკავშირებული სუნი შეიძლება სხვაგვარად იქნას უარყოფილი. შემუშავებულია ფერადი სისტემების განვითარება, რომელიც დაკავშირებულია დამატებით აღჭურვილობასთან. მაგალითად, ფერის კორექცია უფრო ადვილია LAB სისტემაში, სურათების ჩვენება მონიტორის ეკრანზე RGB სისტემაში და სხვა მეთოდები უფრო მარტივია.

ნაჩვენებია წინსვლის დამუშავების ალგორითმები

Vikorist CMYK გამოვლინებები. თუმცა, ნებისმიერ შემთხვევაში, სურათების დამუშავებისას, მათი აღიარებული გამოსახულებები მუშავდება გამოსახულების რასტრული წარმოდგენის გამოყენებით, რომელსაც შეუძლია მოთავსდეს ერთი ან მეტი მატრიცა.

წინა დამუშავების ალგორითმების კლასიფიკაცია

სურათების გაფართოებული დამუშავების ალგორითმები კლასიფიკაციის ნიშნის მიხედვით იყოფა სხვადასხვა ჯგუფად. გაფართოებული დამუშავების ყველა ალგორითმი ან უნდა დახატოს გამოსახულება გარკვეული გაგებით, ან გარდაქმნას ის სახეზე, რომელიც ყველაზე მოსახერხებელია შემდგომი დამუშავებისთვის.

ალგორითმებს, რომლებიც მიზნად ისახავს სურათის ფერის გადაცემის გაძლიერებას, ეწოდება ფერის კორექტირების ალგორითმები. ამ ჯგუფში ასევე შედის ალგორითმები, რომლებიც მუშაობენ ჰიპერტონულ სურათებთან მათი სიკაშკაშისა და კონტრასტის მახასიათებლების შესაცვლელად.

ალგორითმები, რომლებიც უშუალოდ გამოიყენება სურათების სივრცითი მახასიათებლების დამუშავებაზე, ეწოდება ალგორითმები სივრცითი ფილტრაციაეს ჯგუფი შეიცავს ტრანსკოდების ჩახშობის ალგორითმებს, სივრცის გასწორების ალგორითმებს და სივრცის გაუმჯობესების ალგორითმებს, სივრცის სიხშირეების ჩახშობისა და გაძლიერების ალგორითმებს.

სურათებიდან გეომეტრიული მოქმედებების შეერთების ალგორითმები გეომეტრიული დამუშავების ალგორითმები. მათთვის გასაგებია:

ნაჩვენებია წინსვლის დამუშავების ალგორითმები

გამოსახულების კადრირება არის ხედი მართკუთხა ფორმის ნაწილის გამომავალი გამოსახულებიდან;

შეცვალეთ სურათის ზომა. ეს ალგორითმები იყენებენ ინტერპოლაციის სხვადასხვა მეთოდებს, რომლებიც საშუალებას გაძლევთ ან სწორად შეავსოთ ყოველდღიური პიქსელები უფრო დიდ სურათზე, ან ხელახლა შეასწოროთ პიქსელის მნიშვნელობები შეცვლილ სურათში.

სურათის როტაცია. ეს ალგორითმები საშუალებას გაძლევთ დაატრიალოთ გამომავალი გამოსახულება ამოჭრილი მნიშვნელობების საფუძველზე, სწორად დაარეგულიროთ პიქსელის მნიშვნელობები და გამოიყენოთ სხვადასხვა ინტერპოლაციის მეთოდები.

ერთი ფერის სისტემის მეორეში გადაქცევის ალგორითმები ეწოდება ფერის ტრანსფორმაციის ალგორითმები. ისინი ასევე შეიცავს ალგორითმებს ნაპივტონში ფერადი სურათების გადასაყვანად და ბინარიზაციის ალგორითმებს გამომავალი გამოსახულების ორობითად გადაქცევისთვის.

ალგორითმებს, რომლებიც გამომავალ სურათზე ჩანს სხვადასხვა ზონაში, სეგმენტაციის ალგორითმები ეწოდება. ასეთი ალგორითმის გამოყენება შეიძლება იყოს ალგორითმი, რომელიც პასუხისმგებელია გამოსახულ დოკუმენტში ტექსტისა და გრაფიკული ინფორმაციის არეების დანახვაზე, ან ალგორითმი, რომელიც ხედავს გამოსახულ ტექსტში უბნებს, რომლებიც დაკავშირებულია მიმდებარე სიტყვებთან.

ნაჩვენებია წინსვლის დამუშავების ალგორითმები

სივრცითი ფილტრაციის ალგორითმები

გამოსახულების სივრცითი ფილტრაცია მათემატიკური ხედით დისკრეტული სურათების დისკრეტული ჯგუფის გამოყენებით სივრცითი ფილტრის იმპულსური პასუხით

თუ (i, j)

Im(i m, jn)h (m, n), de:

m N11 n N21

Im, თუ გამომავალი და გაფილტრული სურათის მატრიცა, ფილტრის იმპულსური პასუხის h მატრიცა,

N 11, N 21 არის იმპულსური მახასიათებლების ქვედა და ზედა საზღვრები, N 12, N 22 არის იმპულსური მახასიათებლების მარცხენა და მარჯვენა საზღვრები.

იმპულსური პასუხის მატრიცის მოძიება შესაძლებელია სივრცის ფილტრის გაფართოებისას მითითებულ პარამეტრებზე დაყრდნობით. არსებობს დიდი რაოდენობით ლიტერატურა, რომელიც ეძღვნება ციფრულ ფილტრაციას, მაგალითად, ეძღვნება სივრცითი ფილტრების შემუშავების მეთოდებს. პრაქტიკული დიზაინისთვის შეგიძლიათ გამოიყენოთ სტანდარტული მათემატიკური პაკეტები, მაგალითად, MATLAB სისტემა მოიცავს Image Filter Design ფილტრის დიზაინის სისტემას.

მნიშვნელოვანია, რომ ფილტრაცია შეიძლება განხორციელდეს სიხშირის დომენში. ცომში

ნაჩვენებია წინსვლის დამუშავების ალგორითმები

ყოველ ჯერზე ფილტრაციის შეტევების თანმიმდევრობაა:

გადაიყვანეთ სურათები სივრცული დომენიდან სიხშირეზე, ვიკორისტულ და ორგანზომილებიან დისკრეტულ ფურიეს ტრანსფორმაციაზე

შეასრულეთ გამოსახულების სიხშირის მატრიცის ელემენტარული გამრავლება ფილტრის სიხშირის მატრიცით

წაართვით შედეგი და გადააქციეთ იგი ფურეს ორი სამყაროს დისკრეტული ტრანსფორმაციის ფართო ზონად, ვიკორისტად და კარიბჭედ.

მე (x, y)

მე (f x, f y)

თუ (f x , f y ) Im (f x , f y ) H (f x , f y )

თუ (fx,fy)

თუ (x, y).

სიხშირის რეგიონში სურათების გაფილტვრა რთულია გაანგარიშების მაღალი ღირებულების გამო. თუმცა, ეს ფილტრაციის მეთოდი ფართოდ გამოიყენება თეორიულ გამოთვლებში გამოსახულების დამუშავების ვარიანტების ანალიზისას. ეს საშუალებას გაძლევთ ნათლად დაადგინოთ, საჭიროა თუ არა ფილტრაცია. მაგალითად, თუ თქვენ გჭირდებათ სურათზე სიკაშკაშის მკვეთრი ცვლილებების დანახვა, აშკარაა, რომ საჭიროა მაღალი გამტარი ფილტრების რეგულირება. თუმცა, თუ საჭიროა დაბალი სიხშირის დამახინჯების თავიდან აცილება - რყევიანი სქემები და ა.შ., მაშინ უნდა გამკაცრდეს დაბალი გამტარი ფილტრები. ფილტრის სპეციფიკური პარამეტრები შეირჩევა ტრანზიტორების სიხშირის ანალიზიდან და გამომავალი გამოსახულების სიმძლავრით.

ლაბორატორიული რობოტი No1

გამოსახულების დამუშავების ალგორითმები

ყელის ოპერაცია

ყელი არის ფართოდ განსაზღვრული ალგორითმი, რომელიც შეიძლება გამოყენებულ იქნას როგორც გამოსახულების გაფართოებული დამუშავებისთვის, ასევე ობიექტების ამოცნობისა და იდენტიფიკაციისთვის. მოდით გამოსახულება მითითებული იყოს სიკაშკაშის ორგანზომილებიანი მატრიცით " და იმპულსური პასუხის მატრიცა . მათემატიკურად პატარა მატრიცაა ბირთვით შეიძლება გამოითვალოს შემდეგი ფორმულის გამოყენებით:

დე M2xN2 – ყელის ბირთვის მატრიცის ზომა. მატრიცის ზომა ძველი (M1+M2-1)x(N1+N2-1), სადაც M1xN1 - გამომავალი მატრიცის ზომა " . მატრიცა აუცილებელია ელემენტების დამატება მატრიცის კიდეებზე, როგორც წესი, რათა მათ საჭირო ზომამდე მივიდეთ. გაითვალისწინეთ, რომ კიდეებზე გამომავალი მატრიცა სავსეა ნულებით მატრიცის სიგანის ნახევრის ტოლი. მემარცხენე და მემარჯვენე და თანაბრად ნახევარ სიმაღლეზე ზემოთ და ქვემოთ. ასევე მოჭრილი მატრიცის ზომა იყოს იგივე, რაც მატრიცა " .

ყელი შეიძლება გამოითვალოს პირდაპირ ერთი მატრიცის "გაშვებიდან" მეორეში, როგორც ეს ზემოთ არის ნაჩვენები. ნახ. სურათი 1 გვიჩვენებს ყელის გამოთვლის სქემას (დაჭერის ნიღბის მატრიცის ზომა უდრის 3x3). ყელის ოპერატორი შეიძლება განიხილებოდეს, როგორც კოეფიციენტების მატრიცა (ნიღბები), რომლებიც ელემენტალურად მრავლდება გამოსახულების ხილულ ფრაგმენტთან შემდგომი შეყვანით, რათა გამოიტანოს ახალი მნიშვნელობა გაფილტრული სურათის ელემენტისთვის. ეს მატრიცა შეიძლება იყოს ნებისმიერი ზომის, მაგრამ ის სულაც არ არის კვადრატული.

Პატარა 1. ყელის ოპერაციის განხორციელება.

ზავდანნია

    განახორციელეთ ალგორითმი, რომელიც ასრულებს გამომავალი სურათის კოლაფსის ოპერაციას ნიღბის მატრიცით.

    მატრიცის ნიღბის ზომას და ტიპს ადგენს დიზაინერი.

    გამოიყენეთ ეს ნიღბის მატრიცები გამოსახულების დამუშავების სხვადასხვა ალგორითმების განსახორციელებლად:

    • გამოსახულების ხმაურის გასასწორებლად და ჩასახშობად, შექმენით 3x3 ზომის ნიღბის მატრიცა:

    კონტურების გასაძლიერებლად გამოიყენება შემდეგი ტიპის მატრიცები-ნიღბები:

1/9*

    კონტურების სანახავად გამოიყენეთ ნიღაბი, რომელიც ასე გამოიყურება:

4. დანერგეთ მედიანური ფილტრი, რომელიც გამოიყენება წერტილის და პულსის გარდამავალი ფაქტორების ჩასახშობად. გამოსახულების პიქსელი და მისი მეზობელი იმ ზონაში, რომელიც ნახულობს, შეირჩევა ვარიაციის სერიად (პიქსელის მნიშვნელობების გაზრდის ან შესაცვლელად) და მისი ვარიაციის სერიის ცენტრალური მნიშვნელობა შეირჩევა ახალ მნიშვნელობად Excel. საშუალო ფილტრაციის შედეგია ის, რომ ნებისმიერი ხმაური, რომელიც სურათზეა, ეფექტურად მოიხსნება. ეს ნიშნავს, რომ თუ ანალიზებულ ზონებს შორის პიქსელის ინტენსივობის უეცარი ცვლილებაა, მაშინ ის დალაგებულია. ის განთავსდება ამ ტერიტორიის დახარისხებული მნიშვნელობების ან ზედა ან ქვედა ნაწილში და არ იქნება ჩართული, რადგან ელემენტების ახალი მნიშვნელობისთვის პირველად შეირჩევა ცენტრალური მნიშვნელობები.

5. განახორციელეთ ჭედური ალგორითმი. ჭედური ვიბრირებს ისევე, როგორც ალგორითმები საშუალოდ და კონტურების გასაუმჯობესებლად. გამოსახულებაში თითოეული პიქსელი გარშემორტყმულია ბირთვით (მატრიცა-ნიღაბი) 3x3 ჭედურით. მაგალითად, როგორც ჭედურობის ბირთვი, შეგიძლიათ აიღოთ მატრიცა-ნიღაბი:

მას შემდეგ, რაც პიქსელის მნიშვნელობა გარშემორტყმულია ჭედური ბირთვით, შედეგი არის 128. ამრიგად, ფონის პიქსელის მნიშვნელობებს ექნება საშუალო ნაცრისფერი ფერი (წითელი = 128, მწვანე = 128, ლურჯი = 128). 255-ზე მეტი ჯამი შეიძლება დამრგვალდეს 255-მდე.

ჭედურ ​​ვერსიაში გამოსახულების კონტურები ზედაპირზე დაჭერით ჩანს. პირდაპირ გადართვა შეიძლება შეიცვალოს ბირთვში 1 და -1 პოზიციების შეცვლით. თუ, მაგალითად, თქვენ შეცვლით მნიშვნელობებს 1 და -1, მაშინ ქვეგადამრთველი შებრუნებულია.

6. გამოსახულების აკვარელი. აკვარელის ფილტრი გარდაქმნის სურათებს და რედაქტირების შემდეგ აკვარელში დაწერილი ჩანს:

    გამხმარი აკვარელის ფილტრის პირველი ფენა არის გამოსახულების ფერების გლუვი. დამარბილების ერთ-ერთი მეთოდია კანის წერტილზე საშუალო საშუალო ფერის წასმა. კანის პიქსელის ფერის მნიშვნელობები და 24 პიქსელი (მატრიცის ნიღბის ზომა იგივეა, რაც 5x5) ნაჩვენებია ვარიაციების სერიაში, როდესაც ისინი მცირდება ან იზრდება. ვარიაციის სერიაში ფერის მედიანური (მეცამეტე) მნიშვნელობა ენიჭება ცენტრალურ პიქსელს.

    ფერების გასწორების შემდეგ, აუცილებელია კონტურის გამაძლიერებელი ფილტრის დაყენება, რათა ნახოთ ფერების გადასვლებს შორის.

ციფრული ხმაური არის გამოსახულების დეფექტი, რომელსაც ახასიათებს დაჩრდილვის ადგილები, რომლებიც ახლოსაა პიქსელის ზომასთან და განსხვავდება სიკაშკაშისა და ფერში გამომავალ სურათში. ხმაურის შემცირება მნიშვნელოვან როლს ასრულებს ვიდეო თანმიმდევრობებისა და სურათების გადაცემაში, დამუშავებასა და შეკუმშვაში.

ვიდეოში ხმაური შეიძლება წარმოიშვას მრავალი მიზეზის გამო:

1. არ არის იდეალური ვიდეოს შესანახად.

2. მოსაწყენი გონება ფოტოების გადაღებაზე - მაგალითად, ღამით ფოტო/ვიდეოს გადაღება, ცუდ ამინდში სურათების გადაღება.

3. ანალოგური არხებით გადაცემის დროს შეფერხებები - ჩარევა ელექტრომაგნიტური ველებიდან, ხმაური ელექტროგადამცემი ხაზის აქტიური კომპონენტებიდან (ძალა). კონდახი შეიძლება იყოს სატელევიზიო სიგნალი.

4. უზუსტობების გაფილტვრა ანალოგური კომპოზიციური სიგნალიდან ნათელი და ფერებით მდიდარი სიგნალების ნახვისას.

სურათზე ხმაურის რაოდენობა შეიძლება განსხვავდებოდეს კარგ შუქზე გადაღებული ციფრული ფოტოგრაფიის უმცირესი რაოდენობით დაწყებული ასტრონომიულ დონეებამდე, სადაც დერეფნის ხმაური შეიცავს ინფორმაციის უმეტეს ნაწილს, თუ როგორ შეგიძლიათ თავი დააღწიოთ გამოსახულების დამუშავების შრომატევად პროცესს.

ხმაური სხვადასხვა ტიპისაა, რაც დამოკიდებულია სურათზე გამოსახული ამოვარდნის განყოფილების ბუნებაზე. სინამდვილეში, ყველაზე გავრცელებული ტიპებია:

თეთრი გაუსის ხმაური

ერთ-ერთი ყველაზე გავრცელებული ხმაურია დანამატი გაუსის ხმაური, რომელიც ხასიათდება გამოსახულების კანის პიქსელზე ნორმალური განაწილებით და ნულოვანი საშუალო მნიშვნელობების დამატებით. ტერმინი "დამატება" ნიშნავს, რომ ამ ტიპის ხმაური ემატება წითელ სიგნალს. მიღებულ სიგნალში ცუდ გონებას ადანაშაულებს.

ციფრული ხმაური

ციფრული ხმაურის მიზეზი ყველაზე ხშირად დაკავშირებულია ჩაწერისთვის გამოყენებული აღჭურვილობის მახასიათებლებთან - მატრიცის არასაკმარისი სინათლის მგრძნობელობის გამო. ამ ტიპის ხმაური ხასიათდება გამოსახულების ზოგიერთი პიქსელის ჩანაცვლებით ფიქსირებული ან ცვლადი მნიშვნელობებით. ვინაიდან წერტილების სიკაშკაშე დაახლოებით იგივეა, ციფრულ ხმაურს ასევე უწოდებენ იმპულსურ ხმაურს. ვინაიდან წერტილების ინტენსივობა შეიძლება განსხვავდებოდეს შავიდან თეთრამდე, ასეთ ხმაურს მარილისა და პილპილის ხმაურს უწოდებენ.

იმის გამო, რომ ამ ტიპის ხმაური ასახავს სურათში მხოლოდ პიქსელების მცირე რაოდენობას.

კომბინირებული ხმაური

საგულისხმოა, რომ ამოვარდნილობა ნაკლებად ხშირად ვლინდება, თუ გამოსახულება ხმაურიანია გაუსის ხმაურით და ამოვარდნილი პულსებით. ამ აგრეგატს კომბინირებული ხმაური ეწოდება.

დეფექტები დასკანერებულ სურათზე

სურათებზე შეიძლება ასევე იყოს ნაჩვენები მესამე მხარის ეფექტები, როგორიცაა ბზარები, ლაქები ან სისხლჩაქცევები. ამ არტეფაქტებს არ აქვთ ერთგვაროვანი სტრუქტურა და მათი მნიშვნელოვანი ფორმა და ნიმუში ექვემდებარება მათემატიკურ ანალიზს. ამ სახის დეფექტებთან ბრძოლა მხოლოდ გამოსახულების ხელით დამუშავებითაა შესაძლებელი, საიდანაც რობოტები ჩანს.

ხმაურის მოცილების ალგორითმები

რა თქმა უნდა, არსებობს უამრავი ალგორითმი სურათებიდან ხმაურის მოსაშორებლად და მათი კომბინირება შესაძლებელია არა მხოლოდ სპეციალურ დამუშავების პროგრამებთან, არამედ ათობით ფოტო და ვიდეო კამერასთან. მიუხედავად იმისა, რომ ჯერ კიდევ არ არსებობს უნივერსალური ფილტრაციის ალგორითმი, გამოსახულების დამუშავებისას ყოველთვის არის საჭირო არჩევანის გაკეთება არასაჭირო ეფექტების აღმოფხვრისა და სხვა დეტალების შენახვის ეტაპებს შორის, შესაძლოა, მსგავსი მახასიათებლები ხმაურის გარეშე. გარდა ამისა, ალგორითმს, რომელიც ადვილად უმკლავდება ერთი ტიპის ხმაურს, შეუძლია მხოლოდ სურათების სხვა ტიპის ტრანსკოდთან გაერთიანება.

მოდით გადავხედოთ სურათებში ხმაურის ჩახშობის ყველაზე პოპულარულ ალგორითმს.

ხაზოვანი საშუალო პიქსელები

უმარტივესი იდეა ხმაურის მოსაშორებლად არის პიქსელის მნიშვნელობების საშუალოდ მიმდებარე ტერიტორიის გარშემო. ვინაიდან ხმაური დამოუკიდებლად იცვლება პიქსელიდან პიქსელამდე, მეზობელი პიქსელების ხმაური, როდესაც უზრუნველყოფილია, სათითაოდ ანაზღაურებს. ფანჯარა პირდაპირ არის დაყენებული ისე, რომ გამოსახულების თითოეული პიქსელი მასზე იყოს გადანაწილებული. ცენტრალური პიქსელის მნიშვნელობები გამოითვლება ფანჯრის არეში მისი ყველა მეზობელი პიქსელის ანალიზით. ცხადია, რაც უფრო გრძელია ფანჯარა, მით მეტი იქნება საშუალო მნიშვნელობა, რაც იწვევს ძლიერ ეფექტს, რომელიც განზავდება.

უმარტივეს ვარიანტში მეზობელი პიქსელების ანალიზი ეფუძნება ნაპოვნი საშუალო არითმეტიკულ მნიშვნელობას. პიქსელების ნაკადის შესაცვლელად ისე, რომ ისინი არ იყვნენ იმავე უბანში, როგორც ნანახი (მაგალითად, მუქი მონახაზი ღია ფონზე), შეგიძლიათ შეიყვანოთ გარკვეული რიცხვითი ბარიერი და დაარეგულიროთ მნიშვნელობა მხოლოდ ამ გემების დათვლისას. არის ცენტრალური პიქსელის ზოგიერთი ტიპი, რომელიც არ აჭარბებს ამ ზღვარს. რაც უფრო დიდია სასაზღვრო მნიშვნელობა, მით უფრო სავარაუდოა საშუალოდ. ეს ვარიანტი შეიძლება გამარტივდეს კანის სისხლძარღვთა პიქსელის ვაგალური კოეფიციენტების შეყვანით გაანალიზებული უბნის ცენტრში.

ეს მეთოდი ასევე შეიძლება იყოს საათის ზონაში, საშუალო კანის პიქსელი ვიდეო ნაკადის მომდევნო კადრებზე (კანის პიქსელი იქნება საშუალოდ იმავე პოზიციაზე განლაგებულ პიქსელებზე მომდევნო კადრებში).

ეს ალგორითმი ძალიან მარტივია, მაგრამ ის არ იძლევა კარგ შედეგს, რაც ხშირად იწვევს სურათის დეტალების ძლიერ დაბინდვას.

გაუსის ფილტრი

მოქმედების პრინციპი წინა მეთოდის მსგავსია და იგივე გზით მიმდინარეობს ფილტრების გასწორებამდე. ამასთან, დამატებითი ხაზოვანი ფილტრის ხმაურის ჩახშობას, რომელიც საშუალოდ ითვლება, მცირე ნაწილია: არჩეული პიქსელის ყველა მეზობელი ქმნის ახალ ეფექტს შედეგზე, მიუხედავად მათი ფონისა. თავად გაუსის ფილტრი აფასებს ცენტრალურ პიქსელს და მის მეზობლებს მოცემულ გალუზაში, მაგრამ მიჰყვება გაუსის ფუნქციის მიერ დადგენილ მარტივ კანონს.

პარამეტრი აქ განსაზღვრავს განაწილების სტადიას, ხოლო პარამეტრი A უზრუნველყოფს ნორმალიზებას. შედეგად, არეალის ცენტრალურ პიქსელს ექნება უმაღლესი მნიშვნელობა, რომელიც შეესაბამება გაუსის განყოფილებას. ელემენტების მნიშვნელობები სულ უფრო და უფრო ნაკლებად შემოვა სამყაროში ცენტრიდან უფრო მოშორებით.

დადგენილი ფორმულის მიხედვით მორგებულ მატრიცულ ფილტრს ეწოდება გაუსიანი; რაც უფრო დიდია ზომა, მით უფრო ძლიერია გავრცელება (ფიქსირებული ღირებულებით). ამ ფილტრის ფრაგმენტები განცალკევებულია, რომელთა ვიზუალიზაცია შესაძლებელია შემდეგნაირად:

ნათელია, რომ აგრეგაცია შეიძლება განხორციელდეს თანმიმდევრულად რიგებში და წყობებში, რაც იწვევს მეთოდის მნიშვნელოვან აჩქარებას დიდი ზომის ფილტრებით.

2Dcleaner ალგორითმი

ცვლის გამოსახულების კანის პიქსელს კანის პიქსელების საშუალო მნიშვნელობით, რომელიც აღებულია გარკვეული რადიუსით გარშემორტყმულ ზონაში. ამ შემთხვევაში, აშკარად არის წერტილები, რომლებსაც აქვთ რადიუსი, ან რომელთა მნიშვნელობები იყოფა ცენტრალური პიქსელიდან მითითებული მნიშვნელობის (ზღურბლის) მიღმა. ამიტომ, ერთნაირად გაჯერებული ადგილები უფრო ძლიერად, ნაკლებად მკვეთრად ბუნდოვდება ობიექტებს შორის. ეს საშუალებას გაძლევთ შეამციროთ დაბალი დონის ხმაური გამოსახულებაში, ამავდროულად შეინარჩუნოთ სხვა დეტალები.

მედიანური ფილტრაცია

წრფივი ალგორითმები კიდევ უფრო ეფექტურია გაუსიანი ტიპის გადასვლების ჩახშობის შემთხვევაში, თუ ცალკეულ პიქსელებს აქვთ გარკვეული ცვლადი მნიშვნელობა, მაგრამ იკარგებიან გარკვეულ საშუალო მნიშვნელობას შორის, რომელიც დამახასიათებელია იმ ფართობისთვის, სადაც ისინი დევს. თუმცა, დედას ხშირად მარჯვნივ მოჰყავთ სხვა სახის დარღვევებით შექმნილი სურათებიდან. ასეთი დამახინჯების შედეგია იმპულსური ხმაური, რომელიც ვლინდება ეპიზოდური სიკაშკაშის ქაოტურად მიმოფანტული წერტილების გამოსახულებით. საშუალო ამ ფორმით "ნაცხებს" კანს მიმდებარე პიქსელებზე ისეთ წერტილს, რაც გამოსახულების გაღრმავებას იწვევს.

იმპულსური ხმაურის ჩახშობის სტანდარტული მეთოდია მედიანური ფილტრაცია. სურათის დამუშავების ეს არაწრფივი მეთოდი საშუალებას გაძლევთ დაამატოთ მკვეთრი გამოსახულებები, ან ხაზოვანი ალგორითმების ნაცვლად, რომლებიც დაკარგულია, აღმოფხვრას პიქსელების ერთფეროვანი თანმიმდევრობა ცვლილების გარეშე. ამრიგად, მედიანური ფილტრები შექმნილია იმისთვის, რომ შეინარჩუნოს ობიექტების კონტურები და განსხვავებები სხვადასხვა სიკაშკაშის ზონებს შორის, რითაც ეფექტურად თრგუნავს არაკორელაციური გადასვლები და მცირე ნაწილები.

გაფილტვრის პრინციპი: დაყენებულია დაუწყვილებელი ზომის ფანჯარა და გამოსახულების თითოეული პიქსელი თანმიმდევრულად არის გადანაწილებული. ყველა პიქსელს შორის, რომელიც დაიკარგა გამოკვლეულ ზონაში, მათ შორის ცენტრალური, ნაპოვნია მედიანური მნიშვნელობა, რაც იწვევს არეალის ცენტრალურ პიქსელს. მედიანა ჩვეულებრივ არის დახარისხებული პიქსელის მნიშვნელობების მასივის შუა ელემენტი, რომელიც მდებარეობს რეგიონში. დაუწყვილებელი ფანჯრის ზომა არჩეულია იმისთვის, რომ შუა პიქსელი ხელუხლებელი დარჩეს.

შესაძლებელია მედიის ფილტრის გამოყენება სურათზე თეთრი გაუსის ხმაურის ჩასახშობად. თუმცა, დამატებითი მედიანური ფილტრაციის ხმაურის ჩახშობის შესწავლა აჩვენებს, რომ მისი ეფექტურობა უმაღლესი ამოცანისთვის უფრო დაბალია, ვიდრე ხაზოვანი ფილტრაციისას.

მედიანური ფილტრაცია არ მცირდება ხმაურის შემამცირებელი ფილტრების უმეტესობით - უფრო დიდი ნიღბის ზომით ხმაურის ჩახშობის დონის გასაზრდელად, მცირდება გამოსახულების სიცხადე და კონტურის განაწილება. თუმცა, აშკარად შესაძლებელია უარყოფითი ეფექტების მინიმუმამდე შემცირება მედიანური ფილტრაციის სტაგნაციის გზით დინამიური ნიღბის ზომით (დამატებითი მედიანა ფილტრაცია).ფილტრის ეკრანები შეიძლება შეიცვალოს წყაროს პიქსელების სიკაშკაშის მიხედვით.

გამოსახულების სიმკვეთრის გაზრდა

გამოსახულების ხმაურის ჩახშობის თითქმის ყველა ალგორითმი იწვევს ერთსა და იმავე გავრცელებას, რის შედეგადაც იკარგება წვრილი დეტალები, რაც ართულებს გამოსახულების ამოცნობას. ხშირად ანაზღაურეთ ეს უარყოფითი ეფექტი და გაზარდეთ კონტურის კონტრასტისა და ფერის გადასვლების მოხმარება პერსონალური ფილტრის გამოყენებით გამოსახულების სიმკვეთრის გასაზრდელად. სიმკვეთრე ასევე შეიძლება დამოკიდებული იყოს სხვა მრავალ ფაქტორზე - როგორიცაა ლინზის სიკაშკაშე, არჩეული დიაფრაგმის ტიპი, ციფრული კამერების უმეტესობის სენსორზე ნაპოვნი ანტიმური ფილტრის ტიპი და ა.შ. გარე სამყაროდან სურათები ბუნდოვანია. ასევე, გამოსახულების სიმკვეთრე ხშირად უნდა გაიზარდოს მათი ზომების შეცვლის შემდეგ, რაც აუცილებლად იწვევს გარკვეული ინფორმაციის დაკარგვას და მასთან ერთად კონტურების სიცხადეს.

რბილი ნიღაბი არის ტექნიკა, რომელიც საშუალებას აძლევს გამოსახულების ტონებს შორის გადასვლები იყოს უფრო ნათლად ხილული გაზრდილი სიმკვეთრის ილუზიით. სინამდვილეში, სიმკვეთრე იკარგება იმავე დონეზე და პრინციპში შეუძლებელია სურათზე დეტალების დაკარგვა, მაგრამ განსხვავებული სიკაშკაშის ზონებს შორის კონტრასტის შემცირება გამოიწვევს გამოსახულების უფრო მკვეთრ გადაღებას.

Malyunok 5.1 - "კონტურის სიმკვეთრის" კონცეფციის ილუსტრაცია

გამოსახულების სიმკვეთრე დამოკიდებულია სიკაშკაშის სხვაობის სიდიდეზე (W) შორის, რომლებიც განსაზღვრავენ კონტურებს და ამ სხვაობის ცვლილების სიმკვეთრეზე (H).

წვრილი ნიღბის ტექნიკა უპირველეს ყოვლისა იყო გადაფურთხული ფოტოების სტაჟირება და რედაქტირება. ციფრული დამუშავებისას გამოსახულება ოდნავ განსხვავდება ორიგინალისგან: გამოსახულება ჩანს ეგრეთ წოდებული „არამკვეთრი ნიღაბი“ - ასლი გაფართოებულია და ინვერსიულია. ჩანთას ემატება ახალი გამოსახულება ორიგინალის მსუბუქი კონტურების შესაცვლელად. მუქი კონტურების ამოღება შესაძლებელია მხოლოდ შედეგის შებრუნებით.

მათ დაიწყეს გამომავალი სურათიდან მუქი კონტურების ამოღება და სინათლის დამატება, რითაც გაზარდეს კონტრასტი კანის სიკაშკაშის განსხვავებასთან.

ორიგინალის გასამრავლებლად, „რბილი ნიღბის“ მოხსნის მეთოდის გამოყენებით, შეგიძლიათ გამოიყენოთ ნებისმიერი ხმაურის შემამცირებელი ფილტრი, მაგალითად, გაუსის ფილტრი.

Malyunok 5.2 - თხელი ნიღბის სტაგნაციის შედეგი

ყელის ოპერაცია ხშირად გადაიდო გამოსახულების დამუშავებისთვის. სიმკვეთრის გაზრდის გარდა, იგი გამოიყენება სიკაშკაშის, სიკაშკაშის გასაძლიერებლად და ა.შ.

სურათის მოძიება არის მოცემული პიქსელის ახალი მნიშვნელობის გამოთვლის ოპერაცია, რაც იწვევს მიმდინარე პიქსელების მნიშვნელობებს, რომლებიც წარმოადგენენ მას. ლიტერატურული გაგებით, ეს ტერმინი ნიშნავს ხატვის მოქმედებას გამოსახულების კანის ნაწილზე.

ყელის მთავარი ელემენტია ყელის ნიღაბი - ეს არის მატრიცა (საკმარისი გვერდების ზომისა და ფორმისთვის). ასეთ ნიღაბს ხშირად უწოდებენ ფილტრს, ბირთვს, შაბლონს ან ფანჯარას. მატრიცის ელემენტების მნიშვნელობებს ჩვეულებრივ უწოდებენ კოეფიციენტებს.

ყველაზე ხშირად, კვადრატული მატრიცა გამოიყენება ყელის ბირთვად.

გამოსახულების დამუშავება ყელის ოპერაციით ხორციელდება შემდეგი თანმიმდევრობით: მატრიცის ცენტრალური ელემენტი, სახელწოდებით "წამყვანი", თანმიმდევრულად ზედმიწევნით დგას გამოსახულების კანის პიქსელზე. ნახული პიქსელის ახალი მნიშვნელობა გამოითვლება, როგორც ადგილობრივი პიქსელების მნიშვნელობის ჯამი, გამრავლებული ყელის ნიღბის ზოგად კოეფიციენტებზე.

გაყვანის ეფექტი მდგომარეობს ყელის შერჩეულ ბირთვში.

კონტრასტის ცვლის ფილტრის ბირთვს აქვს 1-ზე მეტი მნიშვნელობა წერტილში (0, 0), ყველა მნიშვნელობის ჯამი 1-ზე მეტია. მაგალითად, კონტრასტის გადამცვლელ ფილტრს აქვს ფილტრები ბირთვებით, რომლებიც მითითებულია მატრიცებით:

კონტრასტის გაძლიერების ეფექტი მიიღწევა იმით, რომ ფილტრი აძლიერებს განსხვავებას მეზობელ პიქსელების ინტენსივობას შორის, რომლებიც ერთმანეთისგან განსხვავებული ინტენსივობით არიან. ეს ეფექტი უფრო ძლიერი იქნება, მით უფრო დიდი იქნება ბირთვის ცენტრალური წევრის მნიშვნელობა.

ყელზე დაფუძნებული კონტრასტის ხაზოვანი ფილტრაციამ შეიძლება გამოიწვიოს ხილული ფერის ჰალოები გამოსახულების კონტურების გარშემო.

განათების ღირებულების კომპენსაცია

გამოსახულების სიკაშკაშესთან დაკავშირებული პრობლემები ყველაზე ხშირად წარმოიქმნება ჩარჩოს ფანჯრის, მზის ან სხვა არარეგულირებადი განათების მოწყობილობების დაზიანებისას.

ამ სიტუაციას უწოდებენ "ზედმეტად მსუბუქს" და მივყავართ იმ ფაქტს, რომ ზედმეტად განათებული საყრდენის საშუალებით, ობიექტების დეტალები და ფერები, რომლებიც გავრცელებულია ზედმეტად კაშკაშა საგნების ბუგრებზე, ნადგურდება, შესამჩნევად იკვეთება.

ასევე, ხშირად ხდება სინათლის ნაკლებობის სიტუაცია. ეს შეიძლება გამოწვეული იყოს ბნელი ადგილების ცუდი განათებით კომბინაციით, ასევე ვიდეო აღჭურვილობის შეზღუდული მგრძნობელობის დიაპაზონით.

ერთი მასშტაბის Retinex ალგორითმი

თუ ცდილობთ გამოსახულების განათებას კანის პიქსელის სიკაშკაშის გაზრდით ფიქსირებულ მნიშვნელობაზე, სინათლის ზონები შეიძლება კიდევ უფრო მეტად იყოს გამოფენილი.

ასეთ სიტუაციებში აუცილებელია ფერების „გონივრული“ კორექტირება, რათა ეფექტურად დაბალანსდეს გამოსახულების განათება, ხაზს უსვამს სინათლის ნაკვთებს სიბნელის ქვემოთ ნაკლები შუქით.

ჩვენ ყველაზე მეტად კმაყოფილი ვართ ერთი მასშტაბის Retinex ალგორითმით, რომელიც ეფუძნება თვალის ბადურის რეცეპტორების პრინციპებს. მეტაალგორითმის მთავარი მიზანია სურათების დაყოფა კომპონენტებად, რომლებიც მიუთითებენ სიმსუბუქესა და დეტალებზე. ვინაიდან გამოსახულებაში არსებული პრობლემები დაკავშირებულია სცენის განათებასთან, მაშინ, იმ კომპონენტის აღმოფხვრით, რომელიც წარმოადგენს განათებას, შესაძლებელი ხდება მისი გარდაქმნა გამოსახულების გარშემო, რითაც მნიშვნელოვნად გაზრდის მის სიკაშკაშეს.

გამოსახულების დანახვა არის თუ არა მაღალი სიხშირის სიგნალის (სარკე - R) და დაბალი სიხშირის სიგნალის (სიმსუბუქე - I) დამატება.

S (x, y) = I (x, y) * R (x, y) (5.6)


სურათი 5.3 - გამოსახულების გაგზავნა Retinex ალგორითმის გამოყენებით.

ახლომდებარე სურათების ამოღება შესაძლებელია დაბალი გამტარი ფილტრის დახმარებით - წინააღმდეგ შემთხვევაში, გამომავალი სურათების გარჩევა ადვილია, მაგალითად, გაუსის ფილტრით.

de G - გაუსის ფილტრი

ვინაიდან სიგნალის ლოგარითმი არ ცვლის სიხშირეს და ლოგარითმული ფუნქციის სიმძლავრის გამო (შექმნის ლოგარითმი ტოლია მულტიპლიკატორთა ლოგარითმების ჯამის), სიგნალის მინიჭება ქმნილებაზე შეიძლება გამარტივებული დავალება სიგნალების ჯამისთვის.

ამიტომ, თქვენ აღარ დაგჭირდებათ სიგნალის მაჩვენებლის გამოსავლის აღება, რათა გადაატრიალოთ იგი გამომავალი ამპლიტუდის მასშტაბზე. ამოღებული მაღალი სიხშირის კომპონენტი შეიძლება დამახინჯდეს გამომავალი გამოსახულებების დასარბილებლად და გასანათებლად, რაც ჩნდება სიმსუბუქის ახალ მოდელად.

სიკაშკაშის დონის აღმოფხვრით, ეფექტი შეიძლება ბევრად უფრო ძლიერი გამოჩნდეს (ბნელი ადგილები გახდება ისეთივე ნათელი, როგორც მსუბუქი ადგილები). ეფექტის შესაცვლელად, შეგიძლიათ უბრალოდ შეურიოთ ჩარჩოში ჩასმული სურათი ორიგინალურს პროპორციულად.

გამა კორექტირება

გამა კორექტირების მთავარი მიზანია ანაზღაურდეს ფერების ნაკლოვანებები, რომლებიც ნაჩვენებია სხვადასხვა ეკრანის მოწყობილობებზე, რათა გამოსახულება ერთნაირად გამოიყურებოდეს სხვადასხვა მონიტორზე ნახვისას. სტაგნაციის სტატიკური ფუნქციის არაწრფივი გარეგნობის მიუხედავად, გამა კორექტირება ასევე საშუალებას გაძლევთ გაზარდოთ გამოსახულების ბნელი უბნების კონტრასტი, ნათელი დეტალების ხაზგასმის გარეშე და ნიშნების დაკარგვის გარეშე გამოსახულების ფოტოების ზონებს შორის.

ინფორმაცია სიკაშკაშის შესახებ ანალოგური ნახვისას სამაუწყებლო კოშკში, ისევე როგორც ციფრული ნახვისას ყველაზე ფართო გრაფიკულ ფორმატებში, ინახება არაწრფივი მასშტაბით. მონიტორის ეკრანზე პიქსელის სიკაშკაშე შეიძლება დარეგულირდეს პროპორციულად

de I - პიქსელის სიკაშკაშე ეკრანზე (ან საფონდო ფერების სიკაშკაშე, წითელი, მწვანე და ლურჯი),

V არის ფერის რიცხვითი მნიშვნელობა 0-დან 1-მდე და

d - გამა კორექტირების მაჩვენებელი.

თუ g 1-ზე ნაკლებია, ხაზების გადაცემის მახასიათებელი იქნება ამოზნექილი და მიღებული გამოსახულება უფრო ნათელი, დაბალი ფერის. თუ g 1-ზე მეტია, ხაზების გადაცემის მახასიათებლები გადახრილი იქნება და შედეგად გამოსახულება უფრო მუქი, დაბალი ფერის იქნება.

ნაგულისხმევად, პარამეტრი g უდრის 1-ს, რაც აჩვენებს თანაბარი ნაწილების გადაცემის ხაზოვან მახასიათებლებს და გამა კორექტირების არსებობას.

გამოსახულების კონტურების ხილვადობა

კონტურის ანალიზი შეიძლება გამოყენებულ იქნას გარე სურათებში წარმოდგენილი გრაფიკული ობიექტების აღწერისთვის, ამოცნობის, გასწორებისა და მოსაძებნად. ზოგიერთი ვიკორისტული კონტური მოიცავს ობიექტის შიდა წერტილებს ხედიდან, რაც შესაძლებელს ხდის მნიშვნელოვნად შეამციროს ოპერაციის გამოთვლითი და ალგორითმული სირთულე.

სურათი 5.4 - სტატიკური ფუნქციის ტიპის შეცვლა r პარამეტრის მიხედვით

ობიექტის მონახაზი არის წერტილების სია, რომელიც არის გამოსახულების მრუდი, რომელიც აძლიერებს ობიექტს ფონზე. ყველაზე ხშირად, კონტური ფრთხილად იჭრება სიკაშკაშისა და ფერის მიხედვით.

გამოსახულების კონტურების ძიების გასამარტივებლად, შეგიძლიათ შეასრულოთ ბინარიზაცია.

Sobel-ის ფილტრი ხედავს ობიექტებს შორის მათი სიკაშკაშის მიხედვით. საწყობის ფერის ფრაგმენტები არ არის დაფარული, გამოსახულებები უპირველეს ყოვლისა პასუხისმგებელია ნაცრისფერ ფერებში გადაქცევაზე.

Sobel-ის ფილტრი თანმიმდევრულად რეგულირდება კანის პიქსელთან, გამოითვლება მისი სიკაშკაშის გრადიენტის მნიშვნელობა. გამოსახულების კანის წერტილის გრადიენტი (სიკაშკაშის ფუნქცია) არის ორგანზომილებიანი ვექტორი, რომლის კომპონენტებია გამოსახულების იგივე სიკაშკაშე ჰორიზონტალურად და ვერტიკალურად.

გამოსახულების კანის წერტილში არის ორიენტაციების გრადიენტური ვექტორი სიკაშკაშის უდიდესი ზრდის ადგილზე, რაც მიუთითებს სიკაშკაშის ცვლილების სიდიდეზე. ეს მონაცემები საშუალებას გაძლევთ გამოთქვათ ვარაუდები ობიექტის კორდონზე დაკვირვებული წერტილის მდებარეობის შესაძლებლობის შესახებ, ასევე ამ კორდონის ორიენტაციის შესახებ.

რომ. Sobel-ის ოპერატორის მუშაობის შედეგი მუდმივი სიკაშკაშის რეგიონის წერტილში იქნება ნულოვანი ვექტორი, ხოლო წერტილი, რომელიც მდებარეობს სხვადასხვა სიკაშკაშის რეგიონებს შორის, იქნება ვექტორი, რომელიც გადაკვეთს კორდონს სიკაშკაშის გაზრდისას.

გამოსახულების კანის წერტილის მახლობლად მსგავსების მნიშვნელობის გამოსათვლელად, Sobel-ის ფილტრი იყენებს ვიკორისტიკულ პაკეტს 3x3 მატრიცით.

სობელის მატრიცის კოეფიციენტები:

გრადიენტის სუბსუმკოვური მნიშვნელობა გამოითვლება ფორმულის მიახლოებით:

|გ| = | Gx | + | Gy |

კენის კორდონის დეტექტორი

მიუხედავად იმისა, რომ კენის რობოტი შესრულდა კომპიუტერული გარიჟრაჟზე (1986), კენის კორდონის დეტექტორი ერთ-ერთი საუკეთესო დეტექტორია. კენის მეთოდს აქვს მდიდარი ნაბიჯ-ნაბიჯ ალგორითმი და მოიცავს შემდეგ ნაბიჯებს:

1. გამოსახულების გაწმენდა ხმაურისა და წვრილი დეტალებისგან.

2. გამოსახულების გაწმენდა ხმაურისა და წვრილი დეტალებისგან.

3. მოძებნეთ გამოსახულების გრადიენტები, მაგალითად, Sobel-ის ოპერატორის მიერ.

4. არამაქსიმების დათრგუნვა. ლოკალური მაქსიმუმები მითითებულია როგორც საზღვრები.

5. ორმაგი ზღურბლის ფილტრაცია. პოტენციური საზღვრები არის განსაზღვრული ზღვრები.

6. კონტურების დახაზვა (კონტურის კიდეების შეკვრა)

ვინაიდან სურათზე ყველაზე მცირე ხმაურს შეუძლია გაანადგუროს მისი კონტურების მთლიანობა, ძიების დაწყებამდე რეკომენდებულია სურათის გაფილტვრა ხმაურის შემცირების ზოგიერთი მეთოდის გამოყენებით. მუშაობის მაღალი სიჩქარისა და განხორციელების სიმარტივის გამო, ყველაზე ხშირად გამოიყენება გაუსის ფილტრი. სურათზე არსებული კორდონები შეიძლება იყოს სხვადასხვა მიმართულებით, ამიტომ კენის ვიკორისტის ალგორითმი იყენებს ფილტრებს ჰორიზონტალური, ვერტიკალური და დიაგონალური კორდონების იდენტიფიცირებისთვის. კორდონების გამოვლენის ოპერატორის (მაგალითად, სობელის ოპერატორის) დაჩქარების შემდეგ, შეგიძლიათ მიიღოთ მნიშვნელობები ჰორიზონტალური სწორი ხაზის პირველი მოძრაობისთვის (Gу) და ვერტიკალური სწორი ხაზისთვის (Gx). ამ გრადიენტიდან შეგიძლიათ პირდაპირ კორდონამდე გაჭრა:

კორდონის სწორი ხაზი მომრგვალებულია ოთხიდან ერთ კუთხემდე, რომელიც წარმოადგენს ვერტიკალურ, ჰორიზონტალურ და ორ დიაგონალს (მაგალითად, 0, 45, 90 და 135 გრადუსი). არჩეულია იმ პიქსელებს შორის, რომლებიც მიაღწევენ გრადიენტის ვექტორის გასწვრივ გრადიენტის ადგილობრივ მაქსიმუმს. მნიშვნელობა პირდაპირ არის 45°-ის ჯერადი. არამაქსიმების დათრგუნვით კიდეები უფრო ზუსტი და თხელი ხდება.

შემდეგ ეტაპზე, კანის პიქსელის ფილტრაციის ბარიერი განისაზღვრება და გამოიყენება სურათებს შორის. რაც უფრო სქელია ზღვარი, მით უფრო ერთგვაროვანი იქნება კონტურები, ხოლო სუსტი კიდეების იგნორირება შესაძლებელია. მეორეს მხრივ, როდესაც ბარიერი იცვლება, ალგორითმის მგრძნობელობა ხმაურის მიმართ იზრდება. კენის კორდონის ხედი აჩვენებს ორ ფილტრაციის ზღურბლს: თუ პიქსელის მნიშვნელობა უფრო მაღალია, ვიდრე ზედა ზღვარი, მნიშვნელობა აღწევს მაქსიმალურ მნიშვნელობას (კორდონი ითვლება საიმედოდ), თუ ის უფრო დაბალია, პიქსელი დარეგულირდება, წერტილები და მნიშვნელობები, რა ეცემა ზღურბლებს შორის დიაპაზონში ვიღებთ ფიქსირებულ საშუალო მნიშვნელობებს (ისინი მითითებული იქნება) შეტევის ეტაპზე).

გამოსახულების დამუშავების დარჩენილი ეტაპი მოიცავს მიმდებარე კიდეების ერთგვაროვან კონტურებთან დაკავშირებას. პიქსელები, რომლებიც აღებულია შუა მნიშვნელობის წინა ბოლოში, ან შეკუმშულია (ისე, რომ არ მიეკრას არსებულ კიდეებს) ან შეესაბამება იმავე კონტურს.

სეგმენტაცია

ფოტო და ვიდეო აღჭურვილობაში შემავალი სურათების უმეტესობა რასტერიზებულია, ამიტომ ისინი შედგენილია ფერადი წერტილებისგან, რომლებიც მართკუთხა ბადეს ჰგავს. ზოგიერთი ადამიანი აღიქვამს ზედმეტ სინათლეს, როგორც მთლიანი ობიექტების კრებულს და არა წერტილების მატრიცას. ადამიანის ტვინს შეუძლია აითვისოს გამოსახულების განსხვავებული დეტალები იმავე ზონაში, ნათლად დაყოს ის ობიექტებად. ამ პროცესს სეგმენტაცია ეწოდება და შეიძლება განხორციელდეს პროგრამულად კომპიუტერული გამოსახულების ანალიზისა და ნიმუშის ამოცნობის ყველაზე მნიშვნელოვანი ამოცანებისთვის. სეგმენტაცია განისაზღვრება ანალიზის პირველ ეტაპზე და მის სიცხადეს შეუძლია გავლენა მოახდინოს მის სითხესა და სიზუსტეზე.

სეგმენტაციის მეთოდები შეიძლება დაიყოს ორ კლასად: ავტომატური - რომელიც არ საჭიროებს კლიენტთან ინტერაქციას და ინტერაქტიული - რომელიც უშუალოდ მოჰყვება კლიენტის შეყვანას სამუშაო პროცესში.

პირველ ეტაპზე არ არის შერჩეული აპრიორი ინფორმაცია რეგიონების სიმძლავრის შესახებ, მაგრამ სურათის სტრუქტურაზე გარკვეული გავლენები ზემოქმედებს (მაგალითად, ყველა რეგიონი ერთნაირია ფერითა და ტექსტურით). ვინაიდან, სეგმენტაციის პრობლემის ამ ფორმულირებით, ობიექტის გამოსახულების შესახებ აპრიორი ინფორმაცია არ მოიპოვება, ამ ჯგუფის მეთოდები უნივერსალური და სტაგნაციაა ნებისმიერი სურათისთვის.

მეთოდის ეფექტურობის უხეში შეფასებისთვის კონკრეტულ ამოცანაში, განიხილეთ მთელი რიგი უფლებამოსილებების ჩაწერა, რომლებიც პასუხისმგებელნი არიან კარგ სეგმენტაციაზე:

§ რეგიონების ერთგვაროვნება (ფერისა და ტექსტურის ერთგვაროვნება);

§ მეზობელი რეგიონების უმსგავსობა;

§ კორდონის რეგიონის სიგლუვეს;

§ მცირეა სხვადასხვა „ხეების“ რაოდენობა რეგიონების შუაში;

ზღურბლის სეგმენტაცია

ბარიერის დამუშავება უმარტივესი მეთოდია, რომელიც ფოკუსირებულია მსგავსი ნაკვეთების გამოსახულების დამუშავებაზე, რომლებიც იყოფა საშუალო სიკაშკაშეზე. თუმცა, თუ გამოსახულება არათანაბრად განათებულია, ზოგიერთი ობიექტი შეიძლება გახდეს ძალიან ინტენსიური, რაც საზღვრების სეგმენტაციას არაეფექტური გახდის.

ბარიერის სეგმენტაციის უმარტივესი და ყველაზე ხშირად გამოყენებული ტიპი არის ბინარული სეგმენტაცია, როდესაც სურათზე მხოლოდ ორი ტიპის იდენტური ნაკვეთები ჩანს.

ამ შემთხვევაში გამომავალი გამოსახულების კანის წერტილის ტრანსფორმაცია გამოსავალზე მიჰყვება წესს:

სადაც x0 არის დამუშავების ერთი პარამეტრი, რანგის ბარიერი. გამომავალი სიკაშკაშის დონეები y0 და y1 შეიძლება იყოს საკმარისი, თუ ისინი არ აირჩევენ ნიშნების ფუნქციებს, რაც ხელს უწყობს რუკის მონიშვნას, რომელიც ამოღებულია K1 და Bo K2 კლასების ქულების დამატებით. ვინაიდან წამალი, რომელიც განიკურნება, მზადდება ვიზუალური გამოყენებისთვის, მისი მნიშვნელობა ხშირად ადარებენ შავ-თეთრს. თუ ორ კლასზე მეტია, მაშინ ზღურბლის დამუშავებისას მითითებულია ზღურბლების ოჯახი, რათა გააძლიეროს სხვადასხვა კლასის მრავალფეროვნება ერთდროულად.

ზღურბლის სეგმენტაცია საუკეთესოდ შეეფერება სურათზე მცირე რაოდენობის ობიექტების სანახავად, რომლებიც არ იცვლებიან, ბუნდოვდებიან ერთიანი სტრუქტურა და ნათლად ჩანს ფონიდან. გამოსახულების ჰეტეროგენურობის დონის მატებასთან ერთად, სეგმენტების რაოდენობისა და მათი სირთულის გამო, ამ ტიპის სეგმენტაცია ხდება არაეფექტური.

სეგმენტაცია ეფუძნება გრაფის განაწილებას

გრაფიკის თეორიის მეთოდები გამოსახულების სეგმენტაციის ერთ-ერთი ყველაზე აქტიურად განვითარებული მეთოდია.

ამ ჯგუფის მეთოდების საიდუმლო იდეა არის ეს. სურათი წარმოდგენილია როგორც კარგად ცნობილი გრაფიკი, გამოსახულების წერტილებში წვეროებით. გრაფიკის თითოეული კიდე გვიჩვენებს მსგავს წერტილებს გაგებით (დადექით იმავე მეტრიკის მიღმა არსებულ წერტილებს შორის). სურათის ზომები მოდელირებულია გრაფიკის სექციებით.

გამოვიყენოთ გრაფიკის თეორიის მეთოდები ჭრის „vartost“ ფუნქციონალურობის შესაცნობად, რაც ამცირებს შედგენილი სეგმენტაციის სიძლიერეს. ამრიგად, გამოსახულების ერთგვაროვან ზონებად დაყოფის ამოცანა მცირდება ოპტიმიზაციის ამოცანამდე, გრაფიკზე მინიმალური გამომავალი თვალსაზრისით. ეს მიდგომა იძლევა კერამიკული სეგმენტების ფერისა და ტექსტურის ერთგვაროვნებას, აგრეთვე სეგმენტების ფორმას, მათ ზომას, კორდონების დასაკეცი და ა.შ.

მინიმალური მეჭეჭის მქონე ჭრილის მოსაძებნად გამოიყენება სხვადასხვა მეთოდი: ხარბი ალგორითმები (კანის კიდეზე შერჩეულია კიდე ისე, რომ ჭრილის მთლიანი მეჭეჭა მინიმალური იყოს), დინამიური პროგრამირების მეთოდები (გარანტირებულია, რომ ოჰ, ოპტიმალურის არჩევით კიდე კანის კიდეზე, შედეგად ამოღებულია ოპტიმალური გზა), ალგორითმი Dykstree და ა.შ.

ინტერპოლაცია

კომპიუტერულ გრაფიკაში ინტერპოლაციის მეთოდი ხშირად ჩერდება გამოსახულების მასშტაბის შეცვლის პროცესში. გამოსახულების პიქსელების რაოდენობის შეცვლით, ინტერპოლაცია ხელს უწყობს გამოსახულების უკიდურესი პიქსელაციის აღმოფხვრას მნიშვნელოვანი დეტალების გაზრდის ან დაკარგვისას შეცვლისას.

გამოსახულების პიქსელებს შორის ინტერპოლაციის პროცესში ჩასმულია დამატებითი წერტილები, რომელთა გადაცემის ტონი და ფერი გამოითვლება სპეციალური ალგორითმით, რომელიც ეფუძნება პიქსელების არეების რეალური მონაცემების ანალიზს. სამწუხაროდ, თუ რაიმე ინტერპოლაცია შემოიფარგლება მასთან ახლოს მყოფებთან, სურათები აუცილებლად დაიკარგება ყოველ ჯერზე, თუ ისინი ინტერპოლაციას ემორჩილებიან.

ინტერპოლაცია უახლოესი გემის მეთოდით

ეს ალგორითმი არის ინტერპოლაციის უმარტივესი ტიპი, უბრალოდ გაზრდის გამოსახულების კანის პიქსელს საჭირო მასშტაბამდე. საუკეთესო შედეგის მისაღწევად დამუშავების მინიმალური დრო დასჭირდება.

ორხაზოვანი ინტერპოლაცია

ამ ტიპის ინტერპოლაცია ხორციელდება ორგანზომილებიანი ბადის კანის სხვადასხვა კოორდინატებზე. გამოსახულება ჩანს როგორც ზედაპირი, ფერი არის მესამე განზომილება. თუ გამოსახულება ფერადი კოდირებულია, ინტერპოლაცია ტარდება ცალკე სამ ფერზე. ახალი სურათის კანის უცნობი წერტილისთვის, თეთრი ხაზის ინტერპოლაცია უყურებს კვადრატს რამდენიმე დამატებითი ხილული პიქსელით. როგორ ხდება მნიშვნელობების ინტერპოლაცია, განისაზღვრება რამდენიმე პიქსელის საშუალოდ. შედეგად, გამოსახულებები საგრძნობლად უფრო გლუვი გამოიყურება, რაც ყველაზე ახლო წნევის მეთოდის გამოყენების შედეგია.

ორმხრივი ინტერპოლაცია კარგად მუშაობს სკალირების კოეფიციენტების მაღალ მნიშვნელობებზე, რაც მნიშვნელოვნად აფერხებს გამოსახულების მკვეთრ საზღვრებს.

ბიკუბური ინტერპოლაცია მიდის ერთი ნაბიჯით წინ ხაზის უკან, უყურებს მასივს 4x4 დამატებითი პიქსელით - ჯამში 16. რა პიქსელი იშლება მეტი სივრცის ზომის გაფართოებისას? ბიკუბური ინტერპოლაცია აწარმოებს მნიშვნელოვნად მკვეთრ სურათებს შემდეგი ორი მეთოდის გამოყენებით და შეიძლება იყოს ოპტიმალური იმავე დამუშავების დროისა და გამომავალი ხარისხისთვის. ამ მიზეზით, ის გახდა სტანდარტი სხვადასხვა გამოსახულების რედაქტირების პროგრამისთვის (მათ შორის Adobe Photoshop), პრინტერის დრაივერებისთვის და ჩაშენებული კამერის ინტერპოლაციისთვის.

მასშტაბური სურათი შეიძლება იყოს მნიშვნელოვნად ნაკლებად მკვეთრი. ინტერპოლაციის ალგორითმები, რომლებიც უკეთ ინარჩუნებენ სიმკვეთრეს, ასევე უფრო მგრძნობიარეა მურის მიმართ, ხოლო ის, ვინც გამორთავს მუირს, უფრო რბილ შედეგს იძლევა. სამწუხაროდ, ასეთი კომპრომისის მიღწევა შეუძლებელია.

ამის წინააღმდეგ ბრძოლის ერთ-ერთი საუკეთესო გზაა დაბინდვის ნიღბის გაყინვა სკალირების შემდეგ, თითქოს ორიგინალი უკვე გაზრდილი სიმკვეთრე იყო.

5.2 ქვესისტემისთვის ალგორითმების შერჩევის საფუძველზე

გაფართოებული პროგრამული პაკეტის მთავარი მიზანი იყო ვიდეო ნაკადის შეფერხების მინიმუმამდე შემცირება გამოთვლით კლასტერზე მისი პირველი დამუშავების დროს. გარდა ამისა, პრობლემა შეიძლება წარმოიშვას ნებისმიერ გონებაში, რაც ნიშნავს, რომ მოკლედ საჭირო იყო დიდი რაოდენობით მარტივი ფილტრების დანერგვა სხვადასხვა უარყოფითი ეფექტების გასანეიტრალებლად. გარდა ამისა, საჭირო იყო მოკლე დროში გამოეკვლია ვიდეოში გამოსახული უარყოფითი ფაქტორების დიდი რაოდენობა და მათი განეიტრალებისთვის მარტივი ფილტრების დანერგვა. ალგორითმები, რომლებიც აკმაყოფილებენ წარმოდგენილ სარგებელს, არის ადვილად ხელმისაწვდომი, კარგად ოპტიმიზირებული, აქვთ მაღალი საიმედოობა და, ამავე დროს, განხორციელების სიმარტივე. ასეთი ძალა მდგომარეობს OpenCV ბიბლიოთეკის ფუნქციებში; ამიტომ, ვიდეო ნაკადის დასამუშავებლად ფილტრების განხორციელების კონკრეტული მეთოდების არჩევისას, პრიორიტეტი ენიჭება ალგორითმებს, მათ შორის სხვა ხედებს, რომლებიც მდებარეობს მასში და ბიბლიოთეკარებს.

ყველა ალგორითმი, რომელიც განიხილება საბოლოო საკვალიფიკაციო რობოტის თეორიულ ნაწილში, განხორციელდა ტესტის სახით, რათა მათი მახასიათებლები პრაქტიკაში გათანაბრდეს. თუმცა, პრიორიტეტი მიენიჭა კომპრომისს ვიდეო ნაკადის კადრის დამუშავების სიჩქარესა და შედეგად მიღებული შედეგის სიცხადეს შორის.

გამოთვლით კლასტერზე ვიდეო ნაკადების დასამუშავებლად ფილტრების დანერგვის შედეგად შეირჩა შემდეგი ალგორითმები:

1. „დამატებითი თეთრი“ ხმაურის მოსაშორებლად აირჩიეს გაუსის ალგორითმი. როგორც ხმაურის შემცირების ყველაზე მოწინავე მეთოდი, არსებობს კიდევ უკეთესი ოპტიმიზაცია და, შესაბამისად, მაღალი სამუშაო სიჩქარე

2. „დამატებითი თეთრი“ ხმაურის მოსაშორებლად აირჩიეს გაუსის ალგორითმი. როგორც ხმაურის შემცირების ყველაზე მოწინავე მეთოდი, ის უაღრესად ოპტიმიზირებულია და, შესაბამისად, იწვევს მუშაობის მაღალ სიჩქარეს

3. „იმპულსური“ ხმაურის მოსაშორებლად, არჩეული იქნა მედიანური ფილტრაცია. ეს მეთოდი ასევე კარგად არის ოპტიმიზირებული, გარდა იმისა, რომ სპეციალურად შექმნილია იმპულსური ხმაურის შესამცირებლად და „მარილისა და პილპილის“ ხმაურის შესამცირებლად.

4. გამოსახულების სიმკვეთრის გასაზრდელად გამოიყენეს მცირე რაოდენობა, რათა უკეთ იმოქმედოს ნაზი ნიღბებით, რაც ხშირად სასიამოვნო შედეგს იძლევა.

5. OpenCV ბიბლიოთეკა არ ცვლის ფერის კორექციის ალგორითმებს - გადაწყდა, რომ Single Scale Retinex ალგორითმი განახორციელებდა ყველაზე მეტ გაუმჯობესებას და კარგ დოკუმენტაციას. ამ მეთოდს აქვს ძალიან მაღალი ეფექტურობა, მაგრამ ასევე უზრუნველყოფს ოპტიმიზაციას რობოტის სიჩქარის აჩქარებისთვის.

6. კონტურების ნახვის მეთოდად შეირჩა კენის ალგორითმი, რომელიც ხშირად იძლევა მკაფიო შედეგებს, უფრო დაბალი ვიდრე სობელის ფილტრი.

7. OpenCV ბიბლიოთეკაში წარმოდგენების პირამიდული სეგმენტაციის ალგორითმი მუშაობს ძალიან კარგად, რომელიც ეფუძნებოდა ადრე განხილულ ალგორითმს გრაფიკებზე სეგმენტაციისთვის.

8. ინტერპოლაცია - ბიკუბური ინტერპოლაციის ახალი მეთოდი, როგორც ყველაზე გონივრული კომპრომისი მუშაობის სიჩქარესა და შედეგის სიცხადეს შორის.

შერჩეული პროგრამული უზრუნველყოფის ფუნქციების ინსტალაცია და კონფიგურაცია.

გამოთვლით კლასტერზე, რომელიც ტესტირებას განიცდის, დაინსტალირებულია GNU Linux სისტემა (Ubuntu).

ოპერაციული სისტემის დაყენების შემდეგ, საჭიროა დაინსტალიროთ მთელი რიგი ბიბლიოთეკები გამოსახულების ფაილების წაკითხვისა და ჩაწერის მხარდასაჭერად, ეკრანზე ხატვის, ვიდეოსთან მუშაობისთვის და ა.შ.

CMake-ის ინსტალაცია

პროექტი აგებულია დამატებითი CMake-ის გამოყენებით (საჭიროა 2.6 ან უფრო მაღალი ვერსია). შეგიძლიათ დააინსტალიროთ ბრძანებით:

apt-get install cmake

ასევე შეიძლება დაგჭირდეთ შემდეგი ბიბლიოთეკები:

build-essential libjpeg62-dev libtiff4-dev libjasper-dev libopenexr-dev libtbb-dev libeigen2-dev libfaac-dev libopencore-amrnb-dev libopencore-amrwb-dev libtheora-dev libvor

ffmpeg-ის ინსტალაცია

იმისათვის, რომ opencv-მ სწორად დაამუშაოს ვიდეო ფაილები, თქვენ უნდა დააინსტალიროთ ffmpeg ბიბლიოთეკა. ფრთხილად იყავით შეტევითი ბრძანებებით:

1) ბიბლიოთეკის გამომავალი კოდების შენარჩუნება

wget http://ffmpeg.org/releases/ffmpeg-0.7-rc1.tar.gz

2) არქივის გახსნა გამომავალი კოდებით

tar-xvzf ffmpeg-0.7-rc1.tar.gz

3) ბიბლიოთეკის შეცვლა

კონფიგურაცია --enable-gpl --enable-version3 --enable-nonfree --enable-postproc

Enable-libfaac --enable-libopencore-amrnb --enable-libopencore-amrwb

Enable-libtheora --enable-libvorbis --enable-libxvid --enable-x11grab

Enable-swscale --enable-გაზიარებული

4) ბიბლიოთეკის დაკეცვა და დაყენება

დაინსტალირებულია GTK

OpenCV ფანჯრების საჩვენებლად, თქვენ უნდა დააინსტალიროთ GTK+ 2.x ბიბლიოთეკა ან მეტი, სათაურის ფაილების ჩათვლით (libgtk2.0-dev)

apt-get დააინსტალირეთ libgtk2.0-dev

Opencv ინსტალაცია

ყველა თანმხლები ბიბლიოთეკის დაყენების შემდეგ, opencv2.2 ინსტალაცია სრულდება შემდეგი ბრძანებებით:

1) OpenCV ბიბლიოთეკის გამომავალი კოდების შენარჩუნება

http://downloads.sourceforge.net/project/opencvlibrary/opencv-unix/2.2/OpenCV-2.2.0.tar.bz2

2) არქივის გახსნა გამომავალი კოდებით

tar -xvf OpenCV-2.2.0.tar.bz2

3) Makefile გენერაცია CMake-ის გამოყენებით.

4) OpenCV ბიბლიოთეკის დაკეცვა და ინსტალაცია

5) ასე რომ, შეიძლება დაგჭირდეთ ბიბლიოთეკამდე მარშრუტის რეგისტრაცია

ექსპორტი LD_LIBRARY_PATH=/usr/local/lib:$LD_LIBRARY_PATH

ფრაგმენტირებული პროგრამული პაკეტის ინსტალაცია და შედგენა

აუცილებელია პროგრამის გამომავალი კოდების კოპირება დისკიდან, რომელიც შედის განმარტებით ჩანაწერში. თქვენ უნდა დააკოპიროთ სერიული ფაილი build_all.sh იმავე საქაღალდიდან და შემდეგ გაუშვათ. თუ სისტემაზე დაინსტალირებულია gcc შემდგენელი, კომპილაცია ავტომატური იქნება.

გამოსახულების დამუშავების არსი მდგომარეობს იმაში, რომ სცენის გამომავალი გამოსახულება შემცირდეს იმ ხედამდე, რომელიც საშუალებას იძლევა ობიექტების სპეციფიკური ამოცნობა.

SVT-ში გამოსახულების დამუშავების საბოლოო მეთოდი არის სცენის ობიექტების მომზადება ამოცნობამდე, ე.ი. მათი ჩანაწერები ნაჩვენები იქნება მომდევნო კლასის დავალებამდე. ინფორმაციის ტრანსფორმაციის პროცედურების პრეზენტაციის მრავალფეროვნების მიუხედავად, STS-ს აქვს დამუშავების სამი ძირითადი ეტაპი:

1) გამოსახულების წინა ჩარჩო;

2) სეგმენტაცია;

3) აღწერა

წინა დამუშავებას, თავის მხრივ, აქვს ორი ძირითადი ეტაპი: გამოსახულების ფორმირება და მისი კოდირება (შეკუმშვა). ეტაპების თანმიმდევრობა არ არის ხისტი და დამოკიდებულია კონკრეტულ ამოცანაზე.

წინა გამოსახულების მორთვა

STS-ში გამოსახულების დამუშავების ყველა მეთოდი დაფუძნებულია სივრცესა და სიხშირეზე. ფართო მეთოდები არის პროცედურები, რომლებიც მოქმედებს უშუალოდ გამოსახულების პიქსელებზე. სიკაშკაშე გამოიყენება როგორც გამოსახულების მახასიათებელი Y(x, y).სიხშირის მეთოდები დაკავშირებულია გამოსახულების კომპლექსურ ზონად გადაქცევასთან ფურიეს ტრანსფორმაციის დახმარებით.

გაფართოებული დამუშავების პროცედურების განხილვისას, ჩვენ შემოვიფარგლებით მარტივი მეთოდებით და საბოლოო სურათები ძალიან მნიშვნელოვანია.

მოწინავე დამუშავების პირველ ეტაპზე, გამოსახულების ფორმირება.გამოსახულების ფორმირება არის ვიდეო პროცესორის მეხსიერებაში მდებარე დისკრეტული ელემენტების მასივიდან - პიქსელებიდან გამოსახულების უშუალო გადაღების პროცედურა, რომლებიც ქმნიან მატრიცას და კონტურს.

STZ-ში, გამოსახულების ფორმირების ეტაპზე, თქვენ ირჩევთ სიკაშკაშის ზღურბლს სიკაშკაშის რეგულირებით და გამოსახულების გაფილტვრით.

ფილტრაციაგამოსახულება წინა დამუშავების ყველაზე რთული და დასაკეცი ეტაპია. ზოგადად, ფილტრაციას აქვს შემდეგი ძირითადი ამოცანები:

· გლუვი ("თოვლის" ტიპის მაღალი სიხშირის დამახინჯების შემცირება);

· გაზრდილი კონტრასტი;

· კონტურის ხილვადობა.

გლუვის პროცედურა ტარდება სიკაშკაშის ზღვრის შერჩევის შემდეგ. ეს ადგილი მდგომარეობს სიკაშკაშის ფუნქციის მნიშვნელობაში, რომელიც საშუალოდ არის წინა წესის შემდეგ Y(X, y)გაანალიზებული გამოსახულების ფრაგმენტის შუაში.

"თოვლის" ტიპის მაღალი სიხშირის ხმაურის შესამცირებლად გამოიყენეთ დაბალი გამტარი ფილტრი. Არც ისე ბევრი დაბალი გამტარი ფილტრაციამცირდება გამოსახულების კონტრასტი.

სეგმენტაცია



გამოსახულების გაფართოებული დამუშავების შედეგად მოთავსებულია ერთი ან რამდენიმე კონტურის ობიექტი. ამ კონტურების დაყოფისა და ძირითად ობიექტებთან დაკავშირების პროცედურას ე.წ სეგმენტაცია.

როგორც აპრიორი ცნობილია, რომ სურათები შედგება რამდენიმე ობიექტისგან, სეგმენტაციის პროცედურა ტარდება კონტურების ნახვის შემდეგ გამოსახულების კოდირების ეტაპამდე.

სეგმენტაციის ალგორითმები, როგორც წესი, ეფუძნება განსხვავებებს კონტურსა და მსგავს ადგილებში. პირველ ფაზაში არის წრე და არის პროგრამის შემოვლითი წესის დასაყენებლად. თუ წრე დახურულია, მნიშვნელოვანია, რომ ის ეკუთვნის ობიექტს. სხვა ტიპში იდენტიფიცირებულია გამოსახულების ის ადგილები, რომლებსაც აქვთ ძლიერი გავლენა (მაგალითად, პიქსელების სიკაშკაშე). ასეთი უბნების აღმოჩენისას, იგივე ხორციელდება ან ფონზე ან ობიექტზე.

სურათის კოდი

სისტემებისთვის, რომლებიც ამუშავებენ გადანაწილებულ სურათებს სივრცითი მეთოდების გამოყენებით, არსებობს კოდირების ორი ძირითადი მეთოდი:

· სურათების კოდირება დოვჟინის სერიის კოდირების მეთოდით;

· გამოსახულების კონტურის კოდირება Lanzug Freeman კოდის გამოყენებით.

ორივე შემთხვევაში კოდირებისას მნიშვნელოვანი ცვლილებაა გამოსახულების დამახასიათებელ მონაცემებში. კოდირების ეფექტურობა განისაზღვრება გამოსახულების შეკუმშვის ხარისხით.

კოდირების არსი კოდის მეთოდის გამოყენებით დოვჟინის სერია,დანერგილი დამატებითი RLE ალგორითმის გამოყენებით, წარმოდგენილი სურათი წარმოდგენილია ბუხრის რიგების ერთგვაროვან ნაჭრებად, მაგრამ პიქსელების სიკაშკაშე და ფერი იგივეა. ამ შემთხვევაში კანის სერია ხასიათდება მსგავსი მნიშვნელობებით და იგივე სერიებით (პიქსელების რაოდენობა).

გამოსახულების კონტურის ცენტრის გარეშე კოდირებისთვის ყველაზე ხშირად გამოიყენება Lancium ფრიმანის კოდი(ნახ. 6.22, ბ).ამ ფორმით, ობიექტის კონტური, დაწყებული ნებისმიერი წერტილიდან, მითითებულია ვექტორების თანმიმდევრობით, რომლებიც იღებენ დისკრეტულ მნიშვნელობებს, საიდანაც მოდული იყოფა 45-ზე. მოდულის მნიშვნელობები უდრის 2-ს, ვინაიდან ვერტიკალური ან ჰორიზონტალური პოზიციის დროს ვექტორის მოდული ხდება 45 და 1. ვექტორის მიმართულების შეცვლა მრუდის ერთი წერტილიდან მეორეზე გადაადგილებისას ასახავს მრუდის ცვლილების ბუნებას, რომელიც მოდელირებულია.



სურათის აღწერა

პიდ აღწერა ეს ნიშნავს, რომ ობიექტის დამახასიათებელი პარამეტრები განისაზღვრება - ნიშანი(დისკრიმინატორები), აუცილებელი ხედვა ყურებს შორის, ქმნის სცენას.

მათი ფიზიკური არსის მიღმა ნიშნები იყოფა გლობალურ და ლოკალურად. გლობალური ნიშანიგამოსახულება არის ნიშანი, რომელიც შეიძლება გამოითვალოს ობიექტის ნებისმიერი სურათისთვის.

ადგილობრივი ნიშნები vikorist შემდეგი; სუნი ახასიათებს მთელ სურათს, თუნდაც მის ნაწილს. ისინი მიიღწევა ორ კონტურულ ხაზს შორის, გამოსახულ ობიექტზე ღიობების რაოდენობასა და პარამეტრებს შორის.

გამოსახულების ამოცნობა

Აღიარებამას უწოდებენ პროცესს, რომლის დროსაც ობიექტის კონკრეტული გამოსახულების სიმბოლოების სიმრავლიდან განისაზღვრება მისი კუთვნილება სასიმღერო კლასში.

ამოცნობა ახორციელებს ვიზუალური გამოსახულების ანალიზის ფუნქციას.

ინტელექტუალურად, ყველა ამოცნობის მეთოდი შეიძლება დაიყოს ორ ჯგუფად: თეორიულ და სტრუქტურულ. აღიარების ყველაზე ვრცელი თეორიული მეთოდები დაფუძნებულია ქებული გადაწყვეტილებების თეორიის პრინციპებზე.

შეუძლებელია ობიექტის ნიშნის რეალური მნიშვნელობის დადგენა, ვინაიდან მნიშვნელობა იცვლება კანის გაღიზიანებასთან ერთად. მაშასადამე, ამოცნობის ამოცანა დგება შემდეგნაირად: განსაზღვროს ობიექტის მოცემულ კლასში მოხვედრის შესაძლებლობა.

STS-ში შაბლონის ამოცნობის ერთ-ერთი ყველაზე მნიშვნელოვანი მიმართულება დაკავშირებულია მახასიათებლების ამოცნობის ალგორითმების შემუშავებასთან. ამოცნობის (დამოწმების) ალგორითმი ახლოსაა რეგისტრაციის ალგორითმთან. ნაკადის სურათიდან დანახული სიმბოლოები გაერთიანებულია ვექტორულ სიმბოლოსთან, რომლის კომპონენტები უდრის მონაცემთა ბაზაში მდებარე ყველა ვექტორის შესაბამის კომპონენტებს.

1

ეს სტატია არღვევს ინტელექტუალური მობილური რობოტების მიერ გამოსახულების დამუშავების ალგორითმებს ბუნდოვან ლოგიკასა და ნერვულ გაზომვებზე დაყრდნობით, რაც უზრუნველყოფს სურათზე კორდონების ხილვას Sobel ოპერატორის დახმარებით. გამოსახულების დამუშავების არსი მდგომარეობს იმაში, რომ სცენის გამომავალი გამოსახულება შემცირდეს იმ ხედამდე, რომელიც საშუალებას იძლევა ობიექტების სპეციფიკური ამოცნობა. ძირითადი პრობლემები, ისევე როგორც მათი გადაწყვეტილებები, განიხილება გამოსახულების პირველადი მომზადების დროს ამოცნობამდე. დამუშავების ალგორითმი ბუნდოვანი ლოგიკის გამოყენებით და გამოსახულების ბინარიზაციის პროცესი დეტალურად არის აღწერილი. გამოსახულებაში ხილული კორდონების ბუნდოვანი დამუშავების ალგორითმი შეიქმნა Sobel ოპერატორის გამოყენებით.

სურათის რედაქტირება

ბუნდოვანი ლოგიკა

ინტელექტუალური სისტემა

ობიექტის ამოცნობა

1. Vesnin O.M., Veto A.V., Tsariov V.A. კვების დაწყებამდე ტექნიკური ზედამხედველობის ადაპტური ოპტოელექტრონული სისტემების დაშლისა და სტაგნაციის შესახებ // ავტომატიზაცია ინდუსტრიაში, 2009 წ. - No 11. - გვ. 48-52.

2. გრიშინი ვ.ა. ტექნიკური მეთვალყურეობის სისტემები უპილოტო საფრენი აპარატების მართვის უმაღლესი დონისათვის // სენსორები და სისტემები, No2, 2009. - გვ.46-52.

3. Klevalin V.A., Polivanov A.Yu. ციფრული ამოცნობის მეთოდები სამრეწველო რობოტების ტექნიკური ზედამხედველობის სისტემებში // მეკატრონიკა, ავტომატიზაცია, კონტროლი, 2008 No 5. - გვ. 56-56.

4. მიხაილოვი ს.ვ., რომანოვი ვ.ვ., ზაიკინ დ.ა. მასალების ჭრის პროცესის დიაგნოსტიკის ტექნიკური მონიტორინგის სისტემა// კომპიუტერული და საინფორმაციო ტექნოლოგიების ბიულეტენი, 2007 No3. - გვ 12-19.

5. სიომინ მ.ს. გამოყენებული ამოცანების გადაწყვეტილებების მიმოხილვა დამატებითი ტექნიკური მეთვალყურეობის სისტემების გამოყენებით// http://www.videoscan.ru/page/718#13.

ნინას ავტომატური გამოსახულების დამუშავება ერთ-ერთი ყველაზე მნიშვნელოვანი მიმართულებაა ხელოვნური ინტელექტის სფეროში და გადასცემს რობოტული კომპლექსების განვითარებას გამოსახულების ამოცნობის შესასრულებლად. სისტემაში შაბლონების ამოცნობის ერთ-ერთი ყველაზე ეფექტური საშუალება ეფუძნება ბუნდოვან ლოგიკასა და ხელოვნურ ნერვულ ზომებს. ტექნიკური მეთვალყურეობის სისტემა (TSS) მოითხოვს უამრავ მეთოდს და ალგორითმს ერთი და იგივე ამოცანის გადასაჭრელად სხვადასხვა გზით, რაც უზრუნველყოფს სიჩქარის კოდის საჭირო ინდიკატორებს და იდენტიფიკაციის საიმედოობას.

მობილური რობოტული კომპლექსების STS (MRK) გამოსახულების დამუშავების ჰიბრიდული ალგორითმის არსი მდგომარეობს სცენის გამომავალ გამოსახულებაში იმ ფორმით, რომელიც საშუალებას გაძლევთ გადაჭრათ ობიექტების ამოცნობის პრობლემა.

ალგორითმი გამოსახულების წინ გადასამუშავებლად STS-ში დამატებითი ბუნდოვანი სისტემის გამოყენებით

გამოსახულების დამუშავებამდე, ბუნდოვანი დამუშავება ხორციელდება სხვადასხვა ბუნდოვანი მიდგომების გარეშე, როგორიცაა გაგება, მანიფესტაცია, გამოსახულების დამუშავება, სეგმენტები და ბუნდოვანი მულტიპლიკატორები. შაბლონის ამოცნობის პროცესში დიდი მნიშვნელობა ენიჭება გამოსახულების წინასწარი ბუნდოვანი დამუშავების პროცესს, ასე რომ, ინახება იმ მონაცემების რაოდენობა, რომელიც შემდეგ შეიძლება შეინახოს ნერვული ქსელის შეყვანაში. განყოფილებების გაშლილი ამოცანის ფარგლებში, წინსვლის ბუნდოვანი დამუშავების ალგორითმი შეიძლება წარმოდგენილი იყოს შემდეგი ნაბიჯების თანმიმდევრობით (ნახ. 1): გამოსახულების შენახვა დამატებითი ვებ კამერის მიღმა; შერჩეული ფერის გამოსახულების გარდაქმნა გამოსახულებად ნაცრისფერი ფერის გრადაციებით; გაურკვეველი სურათის დამუშავება.

Პატარა 1. წინ ბუნდოვანი გამოსახულების დამუშავების ალგორითმი

ამ გზით, პირველი ბუნდოვანი დამუშავების პირველი ნაბიჯი არის გამოსახულების ტრანსფორმაცია ფერადიდან ნაცრისფერ ფერებში. გამოსახულების ფერების ნაცრისფერ ფერებში გადაყვანა შეიძლება ამ გზით. ფერების მთელი პალიტრა წარმოდგენილია კუბის სახით, რომლის წვეროები სხვადასხვა ფერს წარმოადგენს. ნაცრისფერი მასშტაბი ვრცელდება კუბის დიაგონალის გასწვრივ, აკავშირებს შავ და თეთრ წვეროებს.

გამოსახულების ხელახალი ფორმისთვის, წითელი, მწვანე და ლურჯი საწყობის ფერების ინტენსივობა ჩანს ნაცრისფერ ჩრდილში გამოსახულების კანის წერტილისთვის, შემდეგ კი ფერი აღდგება შემდეგი ფორმულის გამოყენებით:

დე - ფერის ახალი მნიშვნელობა, - წითელი საწყობის ფერის ინტენსივობა, - მწვანე საწყობის ფერის ინტენსივობა და - ლურჯი საწყობის ფერის ინტენსივობა. კანის ალგორითმის გამომავალი ნაცრისფერი ჩრდილისთვის არის 0-დან 1-მდე. ვიკორზე გამოსახულების ტრანსფორმირებისთვის, მხოლოდ ნაცრისფერი ჩრდილი გამოიყენება იმავე გზით. სიმსუბუქის მინიჭების მეთოდით განისაზღვრება საშუალო ორ უდიდეს და ნაკლებად მნიშვნელოვან ფერს შორის: . საშუალო ღირებულების მეთოდი ითვლის სამივე ფერის საშუალო მნიშვნელობას: . სიკაშკაშის ხაზგასმის მეთოდში მნიშვნელოვანია სამივე ფერის საშუალო მნიშვნელობა, რაც კარგია ადამიანებისთვის. ამრიგად, ადამიანის თვალი ყველაზე მეტად თანაუგრძნობს მწვანე ფერს, რომელსაც პატივს სცემს ყველაზე მნიშვნელოვანი: . სიკაშკაშის განსაზღვრის მეთოდი განისაზღვრება გამოსახულების დამუშავების პროგრამული უზრუნველყოფით. ფუნქციის განხორციელებისას " rgb2gray" MATLAB გარემოში და ხშირად გამოიყენება კომპიუტერული მიზნებისთვის. წინა ბუნდოვანი დამუშავების პროცესში გამოსახულება ფერიდან (RGB) გარდაიქმნება ნაცრისფერ ჩრდილში, სიკაშკაშის რეგულირების განსხვავებული მეთოდის გამოყენებით. შემდეგ გამოსახულება იცვლება ნაცრისფერიდან შავ-თეთრამდე (სურ. 2).

Პატარა 2. გამოსახულების ფერიდან ნაცრისფერში გადაყვანის პროცესი

გამოსახულების ბინარიზაცია დამუშავების საათში

გამოსახულების მოწინავე ბუნდოვანი დამუშავების მეთოდია გამოსახულების ფორმირება და შემდგომი შემცირება, მისი ბინარიზაცია და კოდირება (ზოკრემა, კონტურის მორთვა). გამოსახულების ბინარიზაცია არის გამოსახულების გარდაქმნის პროცესი, რომელიც შედგება ერთი ფერის (ჩვეულებრივ ნაცრისფერი) გრადაციისგან ორობით გამოსახულებაში. ნებისმიერ სურათზე, თითოეულ პიქსელს შეიძლება ჰქონდეს ორი ფერი (ჩვენს ვერსიას აქვს შავი და თეთრი ფერები). ამ ტრანსფორმაციის შედეგად პიქსელის ფერი ითვლება ნულის ან ერთის ტოლად, ამ შემთხვევაში ნულოვანი მნიშვნელობების მქონე პიქსელს (ამ შემთხვევაში თეთრი ფერის პიქსელები) ეწოდება ფონი და ამ მნიშვნელობების მქონე პიქსელებს უდრის ერთი Itsi (შავი ფერი) ეწოდება წინა პლანზე. ალტერნატიულად, ასეთი ტრანსფორმაციის შედეგად გადაღებული ორობითი გამოსახულება ორიგინალის იდენტურია, რომელიც ხასიათდება ობიექტებზე ბუნდოვანებისა და დარღვევების გამოჩენით, მსგავს ადგილებში სურათზე ხმაურის გამოჩენით, ასევე დაკარგვით. სტრუქტურებისა და ობიექტების მთლიანობის შესახებ.

ობიექტის მთლიანობის დაკარგვა, ისევე როგორც ობიექტის განადგურება, წარმოიქმნება დაბალი მიზეზების გამო, როგორიცაა ობიექტის ან წერტილის განათების დიდი უთანასწორობა (და ობიექტების გადახურვა ერთმანეთზე). თავად გადაფარვა ნიმუშში განსაკუთრებით დასაკეცია (და ტანჯვა გადაფარვის მეორე მხარეს ჰგავს), რადგან ერთის მხრივ, მრავალი ობიექტის გამოსახულება შეიძლება განიმარტოს, როგორც ერთი ობიექტი, ხოლო მეორეს მხრივ, ალგორითმები, რომლებიც ამოწმებენ ობიექტის გეომეტრიულ მთლიანობას, იმ ადგილებში, სადაც დაფარულია ცრემლების ფორმირება, რომლებიც წარმოადგენენ მას ფონზე. დამუშავების სირთულე მდგომარეობს იმაში, რომ არ არსებობს თეორიული პირველადი ამოცანის ინტერპრეტაცია ზედმიყენებული ობიექტების შესახებ, რადგან ინფორმაციის ნაწილი იკარგება. პრაქტიკაში ალგორითმების დანერგვისას სწორი გადაწყვეტილებაა ერთ-ერთი შემდეგი ვარიანტის მიღება - ან ქსელი შედის ნაკადის ობიექტის გაგრძელებაში, ან გადაფარვის არე ჩაირთვება ფონზე.

ბარიერის დამუშავება გარდაქმნის გამოსახულების ფერს ან ნაცრისფერს შავ-თეთრ სურათად. ზღვრული გარდაქმნები ცენტრალურ ადგილს იკავებს გამოყენებითი სეგმენტაციის ამოცანებში, რათა უზრუნველყოს ინტუიციურად გონივრული ძალა და განხორციელების სიმარტივე. სურათზე კანის პიქსელისთვის თვალთვალის ინტენსივობის დონე უფრო მაღალია, ვიდრე გარკვეული ზღურბლის დონე, რომელიც შეესაბამება თეთრ ფერს. თუ ფასი დადგენილ ზღვარზე დაბალია, ის დაყენებულია შავზე. ბარიერის დონე იქნება 0-დან 255-მდე.

ამჟამად გამოიყენება ბინარიზაციის მრავალი მეთოდი. რასტრული სურათების ამ ტრანსფორმაციის არსი მდგომარეობს ნაკადის პიქსელის სიკაშკაშის მუდმივ ანალიზში გარკვეული სასაზღვრო მნიშვნელობებით: თუ ნაკადის პიქსელის სიკაშკაშე აღემატება სასაზღვრო მნიშვნელობებს, მაშინ. , მაშინ ორობით სურათზე პიქსელის ფერი იქნება თეთრი, წინააღმდეგ შემთხვევაში ფერი შავი. ზღურბლის ზედაპირი არის მატრიცა, რომლის ზომა მიუთითებს გამომავალი გამოსახულების ზომაზე.

ბინარიზაციის პროცესში ყველა მეთოდი იყოფა ორ ჯგუფად სასაზღვრო ზედაპირის პრინციპით - ბინარიზაციის გლობალური და ლოკალური დამუშავების მეთოდი. p align="justify"> გლობალური ბინარიზაციის დამუშავების მეთოდებში ზღურბლის ზედაპირს აქვს სიბრტყე ზღურბლის სიკაშკაშის მუდმივი მნიშვნელობებით. ბარიერის მნიშვნელობები განისაზღვრება მთელი გამოსახულების ჰისტოგრამების ანალიზის საფუძველზე და იგივეა გამომავალი სურათის ყველა პიქსელისთვის. გლობალურ ზღურბლს აქვს უმნიშვნელო ეფექტი - ვინაიდან გამომავალი გამოსახულება არ არის ერთნაირად განათებული, ტერიტორიები, რომლებიც უფრო მაღალ განათებულია, ზოგადად კლასიფიცირდება როგორც წინა პლანზე. ბინარიზაციის დამუშავების ადგილობრივ მეთოდებში, ზღვრული მნიშვნელობები ცვლის კანის წერტილებს კანის სხვადასხვა უბნებიდან, რომლებიც მდებარეობს ამ წერტილის გარშემო. თუმცა, ამგვარი ტრანსფორმაცია განპირობებულია რობოტული ალგორითმების დაბალი სიჩქარით, რაც ასოცირდება გამოსახულების კანის წერტილის ზღვრული მნიშვნელობების ზედმეტ კორექტირებასთან.

როგორც მოცემული ამოცანის მიღწევის მეთოდი, ის დაჩქარებულია ბერნსენის მეთოდით. მეთოდი დაფუძნებულია ტრანსფორმირებული პიქსელის სიკაშკაშის გათანაბრების იდეაზე ადგილობრივი საშუალოების მნიშვნელობებთან, რომლებიც გამოითვლება მთლიანად. გამოსახულების პიქსელები დამუშავებულია ისე, რომ მათი ინტენსივობა გაათანაბროს ფანჯრებში საშუალო სიკაშკაშის მნიშვნელობებისგან, წერტილებში ცენტრებით (ნახ. 3).

Პატარა 3. გამოსახულების პიქსელის შეცვლა

ბუნდოვანი დამუშავების ალგორითმი გამოსახულების სეგმენტაციას შორის დასანახად

გამოსახულების შავ-თეთრად გადაქცევის შემდეგ, გრადიენტური გამოსახულება გამოდის Sobel ოპერატორის გამოყენებით და გადადის ბუნდოვანი გამოსახულების დამუშავების (FID) შეყვანებზე (ნახ. 4).

ბუნდოვანი გამოსახულების დამუშავება შედგება სამი ძირითადი ეტაპისგან: გამოსახულების ფაზირება, ბუნდოვანი ჩვენების სისტემა აქსესუარის მნიშვნელობებზე და გამოსახულების დეფაზირება. ძირითადი ბუნდოვანი გამოსახულების დამუშავება მდებარეობს შუა წრეში (ფუზი გამომავალი სისტემა). გამოსახულების მონაცემების ნაცრისფერი დონიდან ფაზირების გზით გადაცემის შემდეგ, ბუნდოვანი ჩვენების სისტემა ენიჭება აქსესუარის მნიშვნელობებს. Fuzzification არის გამოსახულების მონაცემების დაშიფვრა, ხოლო დეფუზიზაცია არის შედეგების დეკოდირება, რაც საშუალებას იძლევა სურათების დამუშავება ბუნდოვანი მეთოდების გამოყენებით.

გამოსახულება - ზომა ნაცრისფერი ადგილებიდან და შეიძლება განისაზღვროს, როგორც ბუნდოვანი ერთპუნქტიანი სიმრავლის მასივი (ფუზური მულტიპლიკატორები შეიძლება დაიყოს მხოლოდ ერთი წერტილით), რაც მიუთითებს კანის პიქსელის მნიშვნელობაზე, რომელიც მიეკუთვნება გამოსახულების ძალას (მაგალითად, სიგლუვეს და ა.შ.).

(1)

de - პიქსელის კუთვნილება დანიშნულ ბუნდოვან მულტიპლიკატორებში. ძალაუფლების მნიშვნელოვანი ღირებულება მდგომარეობს სპეციალური სტაზის სპეციფიკურ მახასიათებლებში და ცოდნის საფუძველში.

სისტემის გამომავალი შეყვანის სისტემისთვის მოცემულია შემდეგი ფორმულით:

(2)

Პატარა 4. კორდონების გამოსახულების ბუნდოვანი დამუშავების ალგორითმი

სურათის ამოცნობისთვის ნერვული ქსელების დაარსება

მრავალბურთიანი პერცეტრონი არის ნერვული ქსელის ნაწილი, რომელიც შედგება მრავალი შეყვანის კვანძისგან, რომლებიც ქმნიან შეყვანის ბურთს, ნეირონების ერთ ან ბევრ გამოთვლით ბურთულს და ერთი გამომავალი ბურთისგან (ნახ. 6). ასეთ ხაზებში, სიგნალი, რომელიც გამოიყენება შეყვანის ბურთზე, თანმიმდევრულად გადაეცემა პირდაპირ ბურთიდან ბურთზე. ამ ტიპის INS წარმატებით პასუხობს სხვადასხვა ამოცანებს, მათ შორის კონკრეტული სურათის ამოცნობას.

წინა გლობუსის ნერვული ქსელი შედგება ნეირონების მრავალი ბურთისგან, ხოლო წინა ბურთის კანის ნეირონი დაკავშირებულია წინა ბურთის კანის ნეირონთან. ასეთ ზომებში, ბურთების რაოდენობის და კანის ბურთის ელემენტების რაოდენობის დადგენის შემდეგ, აუცილებელია ღონისძიების მნიშვნელობების და ზღვრების გამოთვლა ისე, რომ მინიმუმამდე დაიყვანოს პროგნოზის დამახინჯება. ეს ამოცანა ხორციელდება სხვადასხვა ალგორითმის გამოყენებით. ამ ალგორითმების არსი მდგომარეობს საწყის მონაცემებზე გამოყენებულ ზომაში. განხორციელებული ღონისძიების დახვეწა გულისხმობს ყველა შეყვანის მონაცემის გაშვებას და ღონისძიების გამოსავალზე რეალური მნიშვნელობების სამიზნე მნიშვნელობებთან გათანაბრებას. შემდეგ გაპრიალებულ რაზნიციას ვარაუდობენ, რომ აქვს ეგრეთ წოდებული შესწორების საიდუმლო ფუნქცია, რაც ახასიათებს საზღვრის ექსტრალეგალურ შესწორებებს. უფრო ხშირად, ვიდრე არა, როგორც საქონლის ფუნქცია, იღება საქონლის კვადრატების ჯამი.

მდიდარი ბურთის ნერვული გაზომვების განვითარების ერთ-ერთი ყველაზე მოწინავე ალგორითმი არის საპირისპირო განაწილების ალგორითმი. ეს ალგორითმი ითვლის დაზიანების გრადიენტის ვექტორს. შემდეგ მას ათჯერ ვაყენებთ ვექტორის პირდაპირი მიმართულებით (თუ გვითხრეს, რომ მივმართოთ ყველაზე აშკარა დაღმართს), სადაც შემცირების მნიშვნელობა კიდევ უფრო ნაკლები იქნება. ეს ბოლო ნაბიჯი თანდათან მიგვიყვანს რძის მინიმუმამდე. სწორედ აქ წარმოიქმნება სირთულეები ზომის სიდიდესთან დაკავშირებით, რაც გამოწვეულია გაჟონვით. ვინაიდან ქერქის ზომა აშკარად დიდი იქნება, ეს გამოიწვევს ყველაზე მკაფიო დაღმართს, მაგრამ არსებობს "ხელახალი გაშიშვლების" შესაძლებლობა.

მჭირდება წერტილი ან არასწორი მიმართულებით წავიდე, რადგან ზემოდან შეიძლება შეავსოს დასაკეცი ფორმა. მაგალითად, თუ ზედაპირი არის ვიწრო ფენა ციცაბო ფენებით, ალგორითმი უფრო მიდრეკილია ერთი ფენიდან მეორეზე გადაცურვისკენ. თუ ვადის მნიშვნელობა მცირეა, მაგრამ იმისათვის, რომ იპოვოთ ყველაზე ოპტიმალური შედეგი, შეგიძლიათ მნიშვნელოვნად გაზარდოთ გამეორებების რაოდენობა. ყველაზე ოპტიმალური შედეგის მისაღწევად, დახრილობის მნიშვნელობა აღებულია მიკროსქემის ციცაბოს პროპორციულად მუდმივი სიჩქარის მუდმივით. ამ მუდმივთა არჩევანი ექსპერიმენტული გზაა და დევს კონკრეტული განყოფილების გონებაში.

მოდით გავაცნოთ შემდეგი მნიშვნელობები. თქვენი კოეფიციენტების მატრიცა შეყვანიდან მიღებულ ბურთამდე მნიშვნელოვანია, ხოლო ცვლადების მატრიცა, რომელიც აკავშირებს შეყვანებსა და გამომავალ ბურთს არის . ინდექსებისთვის მიიღება შემდეგი აღნიშვნები: შეყვანები დანომრილია მხოლოდ ინდექსით, დაბრუნებული ბურთის ელემენტები დანომრილია ინდექსით, ხოლო გამოსავლები დანომრილია ინდექსით. ქსელში შეყვანის რაოდენობა იგივეა, ნეირონების რაოდენობა შეყვანის ბურთში იგივეა, ნეირონების რაოდენობა გამომავალ ბურთში იგივეა. ღონისძიება არჩევნებიდან დაიწყოს. შემდეგ მრავალბურთიანი პერცეტრონის დიზაინის ალგორითმი ასე გამოიყურება:

ვადა 1. საზღვრის ინიცირება. თქვენს კოეფიციენტებს მოცემულია მცირე ცვლადი მნიშვნელობები, მაგალითად, დიაპაზონში (-0.3, 0.3); დაყენებულია დასაწყისის სიზუსტის პარამეტრი, დაწყების სიჩქარის პარამეტრი (როგორც წესი, შეიძლება შეიცვალოს დაწყების დროსაც), გამეორებების მაქსიმალური დასაშვები რაოდენობა.

ვადა 2. გამომავალი სიგნალის გაანგარიშება. საწყისი შერჩევის ერთ-ერთი გამოსახულება მიეწოდება ქსელის შეყვანას და განისაზღვრება ნეირომეტრის ყველა ნეირონის გამომავალი მნიშვნელობები.

Krok 3. ამინდის პროგნოზის კორექტირება. ამოიღეთ შეყვანის ცვლილება ნერვული ქსელის გამომავალი ბურთისთვის ფორმულების გამოყენებით:

დე , . ამოიღეთ ვაგის შეცვლა მიმაგრებული ბურთისთვის ფორმულების გამოყენებით: , დე

Croc 4. Crocs 2-3 მეორდება საწყის ვექტორებში. პროცესი სრულდება მას შემდეგ, რაც კანი მიაღწევს სარეცხი ფუნქციის საწყის მნიშვნელობას, რომელიც არ აღემატება ან გამეორებების მაქსიმალურ დასაშვებ რაოდენობას.

მეორეს მხრივ, 2 ვექტორი საწყისი თანმიმდევრობიდან უფრო სავარაუდოა, რომ უზრუნველყოს შეყვანა შემოდგომის წესრიგში.

საზღვრის შეყვანისა და გამომავალი რაოდენობა კარნახობს ოსტატის გონებას, ხოლო მიმაგრებული ბურთის ზომა განისაზღვრება ექსპერიმენტულად. დააყენეთ ნეირონების რაოდენობა შეყვანის რაოდენობის 30-50%. მოზიდულ ბურთში ძალიან ბევრი ნეირონია იმ წერტილამდე, სადაც ის ატარებს დროს დასრულებამდე (უბრალოდ იმახსოვრებს საწყისი შერჩევის ელემენტებს საფუძვლიანად და არ პასუხობს მსგავს სიტყვებს, რაც უსიამოვნოა ამოცნობის ამოცანისთვის). ვინაიდან მიმაგრებულ სფეროში ნეირონების რაოდენობა ძალიან მცირეა, ლიმიტის სწავლა უბრალოდ შეუძლებელია.

ვისნოვოკი

ძირითადი პრობლემები, ისევე როგორც მათი გადაწყვეტილებები, განიხილება გამოსახულების პირველადი მომზადების დროს ამოცნობამდე. დამუშავების ალგორითმი ბუნდოვანი ლოგიკის გამოყენებით და გამოსახულების ბინარიზაციის პროცესი დეტალურად არის აღწერილი. გამოსახულებაში ხილული კორდონების ბუნდოვანი დამუშავების ალგორითმი შეიქმნა Sobel ოპერატორის გამოყენებით.

მიმომხილველები:

გაგარინა ლ.გ., ტექნიკურ მეცნიერებათა დოქტორი, პროფესორი, მოსკოვის ეროვნული პოსტ-საშუალო უნივერსიტეტის „MIET“-ის „ინფორმატიკისა და პროგრამული უზრუნველყოფის გამოთვლითი სისტემების“ განყოფილების ხელმძღვანელი.

პორტნოვი ე.მ., ტექნიკურ მეცნიერებათა დოქტორი, „ინფორმატიკისა და გამოთვლითი სისტემების პროგრამული უზრუნველყოფის“ კათედრის პროფესორი, მოსკოვის ეროვნული წინასწარი კვლევითი უნივერსიტეტის „MIET“ კვლევითი ლაბორატორიის „კონტროლის საინფორმაციო სისტემების“ ხელმძღვანელი.

ბიბლიოგრაფიული საფოსტო გაგზავნა

Aung C.H., Tant Z.P., Fedorov A.R., Fedorov P.A. ინტელექტუალური მობილური რობოტების მიერ გამოსახულების დამუშავების ალგორითმების შემუშავება საეჭვო ლოგიკასა და ნერვულ ტერმინებზე დაფუძნებული // მეცნიერებისა და განათლების აქტუალური პრობლემები. - 2014. - No6.;
URL: http://science-education.ru/ru/article/view?id=15579 (გამოქვეყნების თარიღი: 02/01/2020). გვინდა წარმოგიდგინოთ ჟურნალები, რომლებიც ხელმისაწვდომია საბუნებისმეტყველო მეცნიერებათა აკადემიაში