Görüntü işleme için yöntemler ve algoritmalar. Sistemin uygulanması. Ön resim çerçevesi

resim gönderme

Görüntünün iki ana görsel tezahürü vardır - vektör ve raster.

Bir vektör dosyası için, mısır ve uç noktaların koordinatlarını, çizgilerin eğriliğini ve diğer geometrik özellikleri ölçmek için görüntü bir dizi çizgiyle (vektörler) tanımlanır, farklı alanları ve renk özelliklerini uyarmak için kurallar açıklanır. . Başka bir deyişle, bir raster tezahürü için matematiksel bir model oluşturmak gerekir. Bu nedenle, vektör vyyavlennya vikorivuyutsya değil, daha da önemlisi, görüntünün sentezi için mükemmellik saatinin altında. Kendi robotları için görüntü tanıma algoritmaları kullanmak isteyen robotlar, çıkış görüntüsünü yakalamak için gerekli olduğu için vektörün kendisinin algılanmaması gerekiyor.

Gerçek bir Kartezyen koordinat ızgarasında görüntü özelliklerinin dağılımının genişliğini tanımlayan bir veya daha fazla matris kullanan görüntü raster. Bu sayede görüntü birden çok noktaya sahip olacak ve raster bir yapıya sahip olabilecektir. Bir görüntünün raster temsilinin ana öğesi, raster koordinat sisteminde koordinatlara ve diğer niteliklere (renk, netlik, netlik, vb.) Sahip olabilen bir pikseldir ("resim öğeleri" ifadesinin kısaltması - görüntü öğeleri). . X ve Y koordinatlarının arkasındaki piksel sayısı (yatay ve dikey olarak) görüntünün boyutunu ayarlar. Pikselin rengi derinliğe göre belirlenir - savaş sayısı, herhangi bir renk için gerekli ayar.

Pikselin rengini ve çıktı görüntüsünün gücünü ayarlama yöntemlerinde takip edilen raster görüntüler şuralarda paylaşılır:

ikili dosyalar

Napіvtonovі

Paletler

Yeni renkler

Bir ikili dosya için, bir pikselin rengi beyaz veya siyah olabilir ve bir bit ile kodlanabilir. Görüntü bir matristir. Matrisin dış görünüm öğesi I(i, j), 0 veya 1 değerine sahip olabilir; burada i, satır sayısıdır ve verilen piksele karşılık gelen öğe sütununun j sayısıdır (Şekil 1). 1).

Navtonlu görüntülerde, pikseller gri tonlarına benzer şekilde daha parlak hale gelir. Belirli bir görüntüyü tanımlayan matris dizinleri, pikselin raster üzerindeki konumunu ve matris öğesinin değerini ayarlar.

- Yoğurdu belirtin I (i, j) (Şek. 2).

Görüntü paletleri iki matrisle tanımlanır (Şekil 3). Palet matrisinin sırasını tanımlayan dizinlerin değeri alınır. Paletin matrisi renk haritasıdır. Kırmızı "R", yeşil "G" ve mavi "B" renkleriyle eşleşen 3 renk grubunun intikamını almak için kazandı. Voni ve karşılık gelen pikselin rengini ayarlayın.

Palet, Nc 3 de Nc genişleme matrisidir - renk sayısı.

Görüntü ileri işleme algoritmaları

Yeniden renklendirilmiş görüntüler - RGB formatında üç matris R (i , j ), G (i , j ), B (i , j ) ve є olacaktır. Cilt matrisinin belirli öğeleri, matris indeksleri tarafından belirlenen piksel için kırmızı, yeşil ve mavi renklerin yoğunluk değerlerini belirler. Bu şekilde, her renkli görüntü için bir renk haritası yoktur ve cilt pikselinin rengi, farklı matrislerden alınan üç sayı ile temsil edilir (Şekil 4).

Matrislerdeki sayıların formatı hem tamsayı hem de kayan nokta formatı olabilir. İlk adım, çeşitli ataşmanların (tarayıcılar, dijital kameralar, televizyon kameraları vb.) Bu formatta, görüntü hakkındaki bilgiler standart grafik dosyalarında toplanır.

Başka bir seçenek de, işleme saatinde görüntünün dahili sunumu için kazanmaktır. Bu şekilde, verilen yoğunluğu bir aralığa, örneğin aralığa manuel olarak normalleştirin ve kayan sayılarla hesaplamalarda bir fark gerçekleştirin ve ardından sonucu belirli bir tamsayı görünümüne dönüştürün. Bu yöntem, af sayısını değiştirmenize ve işleme sonucunun doğruluğunu artırmanıza olanak tanır.

Tam renkli görüntüler için parametrelerden biri, bu formatta sunulabilen maksimum renk sayısıdır. En yaygın görüntüler 16, 256, 65536 (Yüksek Renk) ve 10,7 milyon (Gerçek Renk) renktir.

Görüntü ileri işleme algoritmaları

0 0 0 0 1 1 1 0 0

120 122 125 128 115 117 118

1 0 0 0 1 1 1 1 0

119 121 124 125 128 130 133

1 1 0 0 1 1 0 0 1

122 122 124 123 127 126 128

120 121 123 125 127 125 126

1 1 1 0 1 1 0 0 0

118 110 109 108 108 109 110

0 0 1 0 0 1 0 0 1

Görüntü ileri işleme algoritmaları

indeks matrisi

31 15 03 09

palet matrisi

Görüntü ileri işleme algoritmaları

Yeni bir renkli görüntü sadece RGB formatında değil, diğer renk sistemlerinin yardımı için de kullanılabilir.

HSB sisteminde renk, şu renk özellikleriyle temsil edilir: Ton - renk tonu;

Doygunluk - doygunluk; Parlaklık - parlaklık.

Renk sisteminin, insanın renk doğasının özellikleriyle tutarlı olması önemlidir.

LAB sisteminde renk, renk doygunluğu (açıklık) ve pikselin gerçek rengini gösteren iki bağımsız renk değeri olarak görülür. Renk A - deponun rengi mordan yeşile kadar seçilir. Renk B - Deponun diğer rengi sarıdan siyaha kadar olan aralıktan seçilir.

Renk veren diğer sistemleri Іsnuyut. Doğal olarak, bir tezahürle ilişkilendirilen kokular daha sonra alınabilir. Renk sistemlerinin rozmaїttya'sı ek görevlerle doludur. Örneğin LAB sisteminde rengi düzeltmek daha kolay, RGB sisteminde monitör ekranında görüntü oluşturmak, daha iyi hale getirmek,

Görüntü ileri işleme algoritmaları

CMYK kullanan vicorist. Bununla birlikte, her halükarda, görüntüleri işlerken, matrislerden birinin veya diğerinin intikamını almak için bu tanımalar görüntünün taramalı temsilleriyle işlenir.

İleri işleme için algoritmaların sınıflandırılması

Görüntünün ileriye doğru işlenmesi için algoritmalar, bir sınıflandırma işareti şeklinde farklı nadas gruplarına ayrılır. İleri işlemenin tüm algoritmaları, ya bir anlamda görüntünün netliğini iyileştirmekten ya da daha sonraki işleme için en uygun görünmesi için onu dönüştürmekten suçludur.

Bir görüntünün renk düzeltmesini yönlendirmek için kullanılan algoritmalara renk düzeltme algoritmaları denir. Bu grup ayrıca navtone görüntülerle çalışan, keskinlik ve kontrast özelliklerini değiştiren algoritmaları da içerir.

Görüntü alanı özelliklerinin işlenmesini yöneten algoritmalara algoritmalar denir. uzay filtrasyonu Gruptan önce kaymaların bastırılması için algoritmalar, uzay yumuşatma için algoritmalar ve uzay büyütme için algoritmalar, uzay frekanslarının bastırılması ve yükseltilmesi için algoritmalar bulunur.

Görüntülerden geometrik işlemleri eşleştirmek için algoritmalar geometrik işleme algoritmaları. Onlardan önce görülebilir:

Görüntü ileri işleme algoritmaları

Görüntü çerçeveleme - dikdörtgen şeklin bir parçasının dış görüntüsünün görünümü;

Görüntüyü değiştirmek. Günlük pikselleri daha büyük bir görüntüde doğru şekilde depolamaya veya görüntü değiştirildiğinde piksel değerlerini geçersiz kılmaya izin veren farklı enterpolasyon yöntemleri ayarlamak için algoritmalar

Görüntü döndürme. Algoritmalar zdіysnyuyut çıktı görüntüsünün kut görevlerinde dönüşü, piksellerin değerlerini doğru bir şekilde kaydırmak, muzaffer olarak farklı enterpolasyon yöntemleri.

Bir renk sisteminden diğerine dönüşümü dönüştüren algoritmalara ne ad verilir? renk dönüştürme algoritmaları. Bunlardan önce, navtonlardaki renkli görüntüleri dönüştürmek için algoritmalar ve görsel görüntüleri ikiliye çeviren ikilileştirme algoritmaları da vardır.

Görsel görüntüde görülen algoritmalar, genellikle gayri resmi beyinler tarafından segmentasyon algoritmaları olarak adlandırılır. Böyle bir algoritmaya örnek olarak, belge alanının görüntüsündeki metin ve grafik bilgilerini görmekten suçlu olan bir algoritma veya alanın görülebilen metnin görüntüsünde görülen algoritma verilebilir. son söz.

Görüntü ileri işleme algoritmaları

Alan filtreleme algoritmaları

Görüntünün matematiksel bir şekilde Prostorov filtrelemesi, ayrık bir görüntünün uzamsal bir filtrenin darbe yanıtıyla ayrı bir katlanmasıdır.

Eğer (i, j)

Im(im , j n )h (m , n ), de:

m N11 n N21

Im, Çıktı ve filtrelenmiş görüntülerin matrisleri ise, h, filtrenin impuls yanıtının matrisidir,

N 11, N 21 alt ve üst stovptsіv dürtü özellikleri, N 12, N 22 sol ve sağ sıralar arası dürtü özellikleri.

Verilen parametrelere bağlı olarak uzay filtresi genişletilirken dürtü yanıtının matrisi çıkarılabilir. Dijital filtrelemeye adanmış büyük miktarda literatür, örneğin uzay filtrelerinin rozrahunka yöntemlerine adanmıştır. Pratik tasarım için standart matematiksel paketler kullanabilirsiniz, örneğin "MATLAB" sisteminin deposuna "Image Filter Design" filtre tasarlama sistemi dahil edilebilir.

Frekans alanında filtreleme yapılabilmesi önemlidir. tsyumu'da

Görüntü ileri işleme algoritmaları

zaman zaman filtreleme saldırılarının sırası:

Görüntüyü açık alandan frekansa çevir, vicorist, iki dünya ayrık dönüşüm Fur'є

Görüntünün frekans matrisinin filtrenin frekans matrisiyle eleman bazında çarpımını oluşturun

Ferah bir alana dönüşmenin sonucunu ortadan kaldıran zafer, iki dünyayı ayrı ayrı dönüştüren Fur'є'u çeviriyor.

ben(x, y)

ben(f x , f y )

Eğer (f x , f y ) Im(f x , f y ) H (f x , f y ) ise

Eğer (fx, f y)

Eğer(x, y).

Görüntüyü frekans alanında filtrelemek, büyük hesaplama zorunluluğu nedeniyle nadiren zastosovuetsya dosit. Ancak, bu filtreleme yöntemi, görüntü işleme seçeneklerinin analizinde teorik hesaplamalarda yaygın olarak kullanılmaktadır. Vіn, filtrelemenin gerekli olduğunu göstermek için yerinde yapmanızı sağlar. Örneğin görüntü üzerinde keskin parlaklık farkları görmek gerektiğinden, yüksek frekans filtrelerini değiştirmek gerektiği aşikardır. Navpaki, düşük frekanslı geçişlerden - titreyen devrelerden kurtulmanız gerekiyorsa, düşük frekanslı filtreleri durdurmanız gerekir. Filtrelerin belirli parametreleri, çıkış görüntüsünün geçişlerinin ve güçlerinin frekans analizine dayalı olarak seçilir.

Laboratuvar robotu №1

Görüntü işleme algoritmaları

boğaz operasyonu

Zgorka - hem görüntünün ileriye doğru işlenmesi hem de nesnelerin tanınması ve tanımlanması için bükülebilen geniş tarama için aynı algoritma. Görüntünün iki boyutlu bir netlik matrisi tarafından ayarlanmasına izin verin F" ve dürtü tepki matrisi H. Matematiksel olarak bir avuç matris Fçekirdekli H aşağıdaki formülle belirlenebilir:

de M2xN2 - boğaz çekirdeğinin matrisinin genişlemesi. Matris genişletme F dorіvnyuє (M1+M2-1)x(N1+N2-1), de M1xN1 - Dış matris genişlemesi F" . matris F gerekli boyuta getirmek için belirli bir kuralı izleyerek matrisin kenarlarına elemanlar eklemek için yoldan çıkın. Ses, kenarlardaki görünür matris, matrisin genişliğinin yarısı için sıfırlarla tamamlanır. H solak ve sağlak ve yarı yükseklikte yokuş yukarı ve döşeme aşağı. Alınan matrisin boyutu R kendin gibi ol, matrix gibi F" .

Düğüm, daha fazla gösterildiği gibi, aracı bir matrisi birbiri ardına "kırmadan" sayılabilir. Şek. 1, katlamayı hesaplama şemasını gösterir (yakalama maskesinin matrisinin boyutu 3x3'e eşittir). Yakınlaştırma operatörü, bir katsayılar (maskeler) matrisi olarak kabul edilebilir, çünkü filtrelenmiş bir görüntünün bir öğesinin yeni bir değerini almak için daha fazla alt toplama ile bir görüntünün görünür bir parçasıyla öğe öğe çarpılır. Tsya matrisi bir tür razmіru, neobov'yazkovo karesi olabilir.

Mal. 1. Boğaz operasyonunun uygulanması.

müdür

    Bir maske matrisi ile bir görünüm görüntüsünü görüntüleme işlemini gerçekleştiren bir algoritma uygulayın.

    Biberiye ve bu tip matriks-maske bir koristuvach tarafından verilir.

    Çeşitli görüntü işleme algoritmalarını uygulamak için aşağıdaki maske matrislerini kullanın:

    • galip gelenin görüntüsündeki gürültünün boğuculuğunu yumuşatmak için, saldırgan tipte 3x3 boyutunda bir matris maskesi:

    konturları desteklemek için saldırgan görünümün matris maskeleri kullanılır:

1/9*

    muzafferin hatlarını görmek için böyle bir görünümün maskesi yapılır:

4. Nokta ve darbe geçişlerini bastırmak için kullanılabilen bir medyan filtresi uygulayın. Görüntünün pikseli ve bakılan alandaki ikinci nesne, bir varyasyon satırında birleştirilir (piksellerin değerini artırmak veya değiştirmek için) ve varyasyon satırının merkezi değeri, yeni bir değer olarak seçilir. piksel. Ortalama filtrelemenin sonucu, görüntüden gizlenen bir tür depresyon gürültüsü varsa, etkili bir şekilde uykulu olacak olanlardır. Bu nedenle, analiz edilen alanın sınırlarında bir pikselin yoğunluğunda keskin bir değişiklik varsa, bunun ayıklanması gerekir. bölgenin sıralanmış değerinin üstüne veya altına yerleştirmek ve vrakhovuvatimetsya yapmamak gerekir, bu nedenle öğelerin yeni değeri için merkezi değer seçilir.

5. Kabartma algoritmasını uygulayın. Kabartma viroblyaetsya, kontur sayısının ortalamasını almak için algoritmalara benzer. Görüntünün cilt pikseli, 3x3 boyutunda kabartmalı bir çekirdek (matris-maske) tarafından işlenir. Örneğin, bir kabartma çekirdeği olarak, bir sonraki maske matrisini alabilirsiniz:

Kabartma çekirdeği ile piksel değeri yuvarlandığı için yenisine 128 eklenir.Bu sırayla kamptaki arka plan piksellerinin değerleri orta gri renk olur (kırmızı = 128, yeşil = 128) , mavi = 128). 255'in üzerinde olan sumi 255'e yuvarlanabilir.

Kabartmalı versiyonda, görüntünün konturları yüzeyin üzerinde görünür gibi görünür. Doğrudan anahtarlama, çekirdekteki 1 ve -1 konumları değiştirilerek değiştirilebilir. Örneğin 1 ve -1 değerlerini değerlerle değiştirirseniz o zaman direkt olarak tersi yapılır.

6. Görüntünün sulu hale getirilmesi. Suluboya filtresi görüntüyü dönüştürür ve kesimden sonra şöyle görünür, sulu boya ile yazılır:

    Sulu boya filtresinin boyanmasındaki ilk adım, görüntüdeki renklerin yumuşatılmasıdır. Pürüzsüzleştirmenin yollarından biri, cilt noktasındaki medyan rengin ortalamasını almaktır. Cilt pikseli ve yoga 24 susidiv renginin değeri (matriks-maske boyutu 5x5'tir), azalan veya artan bir varyasyon satırında düzenlenir. Varyasyon serisindeki renk değerinin medyanı (on üçüncü) merkezi piksele atanır.

    renkleri yumuşattıktan sonra konturları desteklemek için bir filtre eklemek gerekir, böylece renklerin geçişleri arasında görebilirsiniz.

Dijital gürültü, bölgenin bir varyantı olan, bir piksel boyutuna yakın olabilen ve dışarıdan görüntüden renkli veya renkli olarak görülebilen görüntüdeki bir kusurdur. Gürültü azaltma, video dizilerinin ve görüntülerin iletilmesinde, işlenmesinde ve sıkıştırılmasında önemli bir rol oynar.

Videodaki gürültü birkaç nedenden dolayı suçlanabilir:

1. Video istiflemek için ideal değil.

2. Pogani razum zyomki - örneğin, fotoğraf / video zomka yok, zyomka utanç içinde.

3. Analog kanallarla iletim sırasında anahtarlama - elektromanyetik alanların dzherelinden yönlendirme, iletim hattının aktif bileşenlerinin (yan kuruluşlarının) nemli gürültüsü. Popo bir televizyon sinyali olabilir.

4. Çok ince bir analog bileşik sinyalden parlak ve renkli sinyaller görüldüğünde filtreleme hataları.

Görüntüdeki gürültünün büyüklüğü, iyi ışıkta kırılan bir dijital fotoğrafta karatavuk kadar değişebilir, astronomik işaretlere kadar, gürültünün en önemli kısımlarından bazılarının ayrıntılarını alabileceğiniz gibi, temel bilgiler de vardır. zahmetli yol.

Farklı türlerdeki gürültü, görüntüdeki vypadkovy rozpodіl kaymasının doğası gereği nadasa bırakılmıştır. Aslında, çoğu zaman şöyle ses çıkarırlar:

Beyaz Gauss gürültüsü

En geniş gürültülerden biri, görüntünün cilt pikseline normal yayılma ve sıfır ortalama değerle bir değer eklenmesiyle karakterize edilen toplamsal Gauss gürültüsüdür. "Ek" terimi, kahverengi sinyale belirli bir tür gürültünün eklendiği anlamına gelir. Alınan sinyalin pis zihinleri için suçlayın.

dijital gürültü

Dijital gürültüyü suçlamanın nedeni, çoğunlukla ekipmanın yakalamaya yönelik özellikleriyle ilgilidir - matrisin ışık hassasiyetinin olmamasından kaynaklanır. Bu gürültü türü, görüntüdeki piksellerin bir kısmının sabit bir büyüklükteki değerlerle değiştirilmesiyle karakterize edilir. Bir noktanın parlaklığı yaklaşık olarak eşit olmasına rağmen, dijital gürültü aynı zamanda dürtüsel olarak da adlandırılır. Noktaların yoğunluğu siyahtan beyaza değişebildiğinden, bu tür gürültüye güçlü ve biber tipi gürültü denir.

Bu tür bir paraziti yalnızca görüntüdeki az sayıdaki piksel için seslendirin.

Kombinasyon gürültüsü

Anlamlı bir şekilde, görüntü gürültülü bir Gauss gürültüsüne ve dalgalanma darbelerine eşit şekilde bağlıysa, dalgalanmaların geçme olasılığı daha yüksektir. Bu sukupnіst'a birleşik gürültü denir.

Görüntü tarama kusurları

Ayrıca görüntülerde çatlak, yıpranma, morarma gibi üçüncü şahıs etkileri görülebilir. Qi eserleri tek tip bir yapıya sahip değildir, formlarının belirlenmesi ve rasterleştirme matematiksel analiz için önemlidir. Bu tür kusurlarla mücadele, ancak bu robotlarda pis bir koku görülebilen görüntünün manuel olarak işlenmesi sayesinde mümkündür.

Gürültü giderme algoritmaları

Görüntülerden parazit kullanmak için çok sayıda algoritma vardır ve bunlar yalnızca özel işleme programları tarafından değil, aynı zamanda fotoğraf ve video kameralar tarafından da engellenebilir. Evrensel bir filtreleme algoritmasının olmaması şaşırtıcı değil, görüntü işlemenin osilatörleri her zaman ihmal edilebilir efektleri kullanma aşaması ile gürültüye benzer özelliklere sahip olabilecek diğer ayrıntıları kaydetme aşaması arasında seçim yapmak için gerekli hale geliyor. Ayrıca, bir gürültü türüyle kolayca başa çıkabilen bir algoritma, yalnızca başka bir geçiş türüyle görüntü yakalayabilir.

Görüntülerdeki gürültüyü bastırmak için en popüler algoritmaların destesine bir göz atalım.

Piksellerin doğrusal ortalaması

En basit fikir, gürültüyü uzak tutmak - geniş kenar mahallelerin yakınındaki piksellerin değerlerini ortalamaktır. Dağınık gürültü pikselden piksele bağımsız olarak değişir, toplandığında harici piksellerin gürültüsü bire bir telafi eder. Cilt üzerine bindirilmiş bir deri görüntü pikseli gibi doğrudan sorulur. Merkezi pikselin değeri, pencere alanında olduğu gibi, ondan gelen tüm alt piksellerin analizinin iyileştirilmesinden hesaplanır. Açıkçası, vikno'yu ne kadar çok alırsanız, sonuçta ortalama değer o kadar fazla olacak, bu da genişleyecek olan güçlü bir etkiye yol açacaktır.

Özlü piksellerin analizinin en basit varyantında, aritmetik ortalama değer bilinmektedir. Görüntülenmekte olan aynı alanla örtüşmeyen piksel sayısını değiştirmek için (örneğin, açık renkli bir arka plan üzerinde koyu bir çerçeve), belirli bir sayısal eşik girebilir ve bu başarılardan yalnızca birkaçını sayarken koruyabilirsiniz. bu tür merkezi piksel türlerinin sayısı eşiği aşmaz. Sınır değeri ne kadar büyük olursa, ortalama o kadar güçlü olur. Gözden geçirilen varyant, analiz edilen alanın merkezine düşüşten ani cilt pikselinin en önemli katsayıları tanıtılarak basitleştirilebilir.

Bu yöntem, video akışının ana çerçeveleri için ortalama dış görünüm pikseli olan saat alanı için de ayarlanabilir (dış görünüm pikselinin pikseller için ortalaması alınır, ana çerçeveler için aynı konumun ortalaması alınır).

Bu algoritma daha da basittir, ancak iyi bir sonuç vermez, bazen görüntü detaylarında güçlü bir azalmaya yol açar.

Gauss filtresi

İlke, önceki yönteme benzer olabilir ve bu nedenle, filtreleri yumuşatmaya dayanır. Bununla birlikte, orta düzeyde olan doğrusal bir filtrenin yardımıyla gürültü azaltma işlemi oldukça kısa olabilir: Kesilen pikselin tüm hakemleri, yeni piksele olan mesafe ne olursa olsun sonuç üzerinde aynı etkiyi verir. Gauss filtresi, merkezi pikselin ve gerçek çemberde intihara eğilimli olan pikselin o kadar kendi kendini ortalamasını alır ki, yalnızca Gauss işlevini belirleyen aynı yasayı izler.

de parametresi ölçüm aşamasını ayarlar ve A parametresi normalleştirmeyi sağlar. Sonuç, Gauss alt bölümünün ikinci zirvesi olacak olan en yüksek değere sahip bölgenin merkezi pikseline sahip olacaktır. Unsurlara karar vermenin önemi, merkeze olan uzaklık arttıkça dünyaya daha az dökülecektir.

Atanan formüle dayalı matris filtresine Gauss denir; ki bu yogo biberiyesinden daha fazladır, ardından daha güçlü biberiye (sabit y ile). Danimarka filtresinin parçaları ayrılabilir, aşağıdakilere bakarak hayal edebilirsiniz:

Yöntemi büyük filtre boyutlarıyla önemli bir hızlandırmaya getirmek için boğazın sıralar ve adımlar halinde art arda gerçekleştirilebileceği açıktır.

2Dcleaner algoritması

Görüntünün cilt pikselini, gerçek bir yarıçapla çevrili bölgede alınan alt piksellerin ortalama değerleri ile değiştirir. Kimin için, yarıçapı t'den küçük olan, değerleri merkezi pikselde dikkate alınan noktalar, günün gününde ayarlanan değerin (eşik) gerisinde az ya da çok . Zavdyaki tsomu eşit şekilde istila edilmiş alanlar güçlenir, nesneler arasında keskin bir şekilde alçalır. Bu, görüntüdeki düşük gürültüyü azaltırken aynı zamanda küçük ayrıntılardan tasarruf etmenizi sağlar.

medyan filtreleme

Doğrusal algoritmalar, geçişin Gauss doğası bastırıldığında daha da etkilidir, eğer asli pikseller isteniyorsa ve değerde belirli bir dalgalanma olabilir, proteo, bölgenin ortalama değer özelliğinin aralıklarında kaybolur; yalan kokusu. Ancak bir saatliğine başka geçişler yaratan görüntülerle anne sağa getirilir. Böyle bir değişimin poposu, vipadkovo parlaklığının rastgele dağılmış noktalarının görüntülerinde kendini gösteren dürtü gürültüsüdür. Bu yönde ortalama alma, dış görünümü çekirdek pikseller üzerinde böyle bir noktaya "yayar" ve bu da görüntünün parlaklığında bir artışa yol açar.

Darbe gürültüsünü bastırmanın standart yolu medyan filtrelemedir. Bu doğrusal olmayan görüntü işleme yöntemi, keskin wiki'ler kullanmanıza izin verir, ancak doğrusal algoritmaların görünümünde, dışarıda bırakılan, monoton piksel dizisini değiştirmeden dışarıda bırakır. Zavdyaki, nesnelerin konturlarını ve farklı parlaklıktaki alanlar arasındaki farkı oluşturmadan binaların filtrelenmesinin medyanına zavdyaki, ilintisiz değişiklikleri ve küçük boyutlu ayrıntıları etkili bir şekilde göz ardı ederken.

Filtreleme ilkesi: Eşleştirilmemiş bir pencerede ayarlanır, sırayla görüntünün dış pikseli üst üste bindirilir. Ortadaki de dahil olmak üzere incelenen alanda harcanan tüm piksellerin ortası medyan değerle karıştırılır, sonuç olarak alanın merkezi pikseli beklenir. Medyanın altında, ortadaki öğe, bölge içinde yer alan sıralanmış piksel değerleri dizisine göre sıralanır. Orta pikselin tabanını sabitlemek için pencerenin eşleştirilmemiş genişliği kendisi tarafından seçilir.

Görüntüdeki beyaz gauss gürültüsünü bastırmak için bir medyan filtresi eklemek mümkündür. Bununla birlikte, ek medyan filtrelemenin arkasındaki gürültünün boğulması, en yüksek görev durumundaki verimliliğin doğrusal filtreleme durumuna göre daha düşük olduğunu göstermektedir.

Medyan filtreleme, güçlü gürültü bastırıcı filtrelerin küçük bir miktarını korumaz - gürültünün bastırılma seviyesini azaltmak için maskenin boyutunun artması, görüntünün netliğinin azalması ve konturların artması gözlemlendi. Однак існує можливість звести негативні ефекти до мінімуму, застосовуючи медіанну фільтрацію з динамічним розміром маски (адитивна медіанна фільтрація) Її принцип залишається тим самим, тільки розмір ковзаючого вікна фільтрації може змінюватися залежно від яскравості сусідніх пікселів.

Görüntü keskinliğini geliştirin

Pratikte görüntüdeki gürültüyü bastırmaya yönelik tüm algoritmalar, belirli bir miktara kadar gürültü üretir, bunun sonucunda ince ayrıntılar bozulur, görüntüyü yakalamak daha zor hale gelir. Genellikle olumsuz etkiyi telafi eder ve izinsiz girişler, kontur kontrastı ve renk geçişleri sunar, filtre oluşturur, görüntünün keskinliğini artırır. Keskinlik birikebilir ve diğer faktörlere bağlı olarak - merceğin kalitesi, galip gelen diyafram, çoğu dijital kameranın matrisinde bulunan hare önleyici filtrenin türü, farklı dünyada görüntü genişletilir. Ayrıca, boyutlarını değiştirdikten sonra görüntünün keskinliğini artırmak genellikle gereklidir, böylece bilgilerin bir kısmı ve bununla birlikte konturların netliği kaçınılmaz olarak kullanılır.

Nerazke maskeleme, görüntünün açıklığı için görüntünün tonları arasındaki geçişi daha güçlü hale getirmenizi, keskinliği artırma illüzyonu ile görsel algınızı iyileştirmenizi sağlayan bir hiledir. Gerçekte, netlik aynı seviyeye dayanmaktadır, prensipte görüntünün ayrıntılarını görmek imkansız olsa da, farklı netlikteki grafikler arasındaki kontrastı görüntünün net olarak alındığı noktaya kadar iyileştirmek imkansızdır.

Malyunok 5.1 - "Konturun keskinliği" kavramının gösterimi

Görüntünün keskinliği, konturların ayarladığı alanlar arasındaki parlaklık farkının (W) değerine ve farktaki değişimin (H) keskinliğine bağlıdır.

Priyom nerizkogo maskeli buv ilk zastosovaniya sche obrobki plіvkovih fotoğrafları. Görüntünün dijital işlenmesine eklendiğinde, yöntem orijinaline kıyasla çok azdır: görüntü "bulanık bir maske" olarak görülür - yeniden boyutlandırılır ve kopya ters çevrilir. Torbanın altında yeni bir görüntü oluşturulur, böylece orijinalin hafif ana hatları daha az öç alınabilir. Koyu konturlar, sonucun basitçe tersine çevrilmesiyle giderilebilir.

Dış görüntüden daha da görünür, koyu konturlar ve ışık ekleyin, bu da ciltte parlaklık farkı için daha fazla kontrast anlamına gelir.

Orijinali "keskin olmayan maske" yöntemiyle uzlaştırmak için, örneğin Gauss filtresi gibi gürültü önleyici filtrelerden herhangi birini değiştirebilirsiniz.

Malyunok 5.2 - Olağanüstü maskelemenin durdurulmasının sonucu

Görüntünün işlenmesi için katlama işlemi genellikle ertelenir. Keskinlikteki keskin artış, rozmittya için kazandı, parlaklıkta artış, ince bir şekilde aydınlanıyor.

Bir görüntü yığınına, alt piksellerin değerleri sıfırlandığında, onu atlatacak olan belirli bir pikselin yeni değerini hesaplama işlemi denir. Vahşi anlamda, bu terim, görüntünün cilt kısmının üzerinde vikonuetsya olduğu için bir deaco deyu anlamına gelir.

Boğazın ana unsuru, boğazın maskesidir - tüm matris (yeterli boyutta ve yanların görünümünde). Genellikle böyle bir maskeye filtre, çekirdek, ki-pencere şablonu denir. Matrisin elemanlarının değerlerine genellikle katsayılar denir.

Çoğu zaman, bir grup zaferin çekirdeği gibi, bir kare matris oluşur.

Boğazın çalışmasıyla görüntünün işlenmesi sıradaki sıradadır: Matrisin merkezi öğesi olan "çapa" başlıkları, görüntünün cilt pikseli üzerine art arda bindirilir. İncelenen pikselin yeni değeri, asli piksellerin değerlerinin toplamı ile maske maskesinin katsayılarının çarpımı olarak hesaplanır.

Otrimany etkisi gırtlağın vibrasyonlu çekirdeğinde yatmaktadır.

Kontrastı ilerleten filtrenin çekirdeği, (0, 0) noktasında 1'den büyük bir değere sahiptir ve tüm değerlerin büyük bir toplamı 1'den fazladır. matrisler tarafından verilen çekirdekler:

Kontrast iyileştirme etkisine, filtrenin bitişik piksellerin yoğunlukları arasındaki farkı artırması ve birbirlerinin yoğunluklarını görmesi ile ulaşılır. Etki, çekirdeğin merkezi üyesinin değeri ne kadar büyük olursa o kadar güçlü olacaktır.

Boğaz bazında doğrusal kontrastla geliştirilmiş filtreleme, görüntünün konturları boyunca görünür renk halelerine yol açabilir.

Perakende aydınlatma için tazminat

Görüntüyü aydınlatma sorunları, çoğunlukla viconların çerçevesinde geçirilen saatten sorumlu tutulur, diğer düzensiz lambaların güneşi hafiftir.

Böyle bir duruma “fazla ışık” denir ve öyle bir duruma yol açar ki, nesnelerin detaylarının ve renklerinin parlak payandalı aydınlatması, parlak nesnelerin üzerine yaprak bitleri üzerinde yayılır, harap olur, önemli bir şekilde anılır hale gelir.

Işık eksikliği durumu genellikle bu şekilde ortaya çıkar. Bunun nedeni, aydınlatmanın zayıf olduğu karanlık odalarda sorun olabileceği gibi, video ekipmanının hassasiyet aralığının azalması olabilir.

Tek Ölçekli Retinex Algoritması

Deak üzerindeki cilt pikselinin parlaklığını arttırma yolu ile görüntüyü görmeye çalışırken, değer sabitlenir, dilyankanın ışığının arkası daha da aydınlatılabilir.

Bu gibi durumlarda, köyün ışıklarını daha küçük ve daha karanlık hale getirerek görüntüdeki aydınlatmayı iyileştirmek mümkün olacak şekilde, renklerde "makul" bir düzeltme yapmak gerekir.

Göz alıcıları oluşturma ilkelerine dayanan Tek Ölçekli Retinex algoritmasından memnunuz. Ana meta-algoritma, görüntüyü, bu detayın netliği için takdir edilen bileşenlere bölmektir. Sahnenin aydınlatmasını kapsayan görüntüde sorunlar olduğu için, aydınlatmadan sorumlu bileşeni ortadan kaldırarak onu daha eksiksiz bir görüntüye dönüştürebilir ve böylece parlaklığını önemli ölçüde artırabiliriz.

Görüntünün yüksek frekanslı bir sinyal (yansıma - R) ve düşük frekanslı bir sinyal (aydınlık - I) olarak görülüp görülemeyeceği.

S (x, y) = ben (x, y) * R (x, y) (5.6)


Şekil 5.3 - Retinex algoritması için görüntü gönderme.

Ek düşük frekanslı filtreleme ile daha yakın görüntü aydınlatması çekilebilir - aksi takdirde, örneğin bir Gauss filtresiyle görüntüyü yakınlaştırmak görünüşte kolaydır.

de G - Gauss filtresi

Sinyalin logaritmasının ölçeklenmesi frekansı ve logaritmik fonksiyonun gücünü değiştirmez (logaritma, çarpanların logaritmalarının toplamına eşittir), sinyallerin çalışması altındaki görev, görev kadar yapılabilir. sinyallerin toplamı.

Ondan kurtulmak istiyorsanız, uygun genlik ölçeğine çevirmek için kaldırılan sinyalden üstel sinyali alın. Kaldırılan yüksek frekans bileşeni, yeni bir aydınlatma modeli görevi gören parlaklaştırılmış ve parlaklaştırılmış bir dış görüntü ile birleştirilebilir.

Aydınlatma etkisinden geri çekilme çok güçlü olabilir (karanlık alanlar ışık kadar parlak hale gelir). Efekti değiştirmek için, görüntüyü dış orantılara uyacak şekilde değiştirebilirsiniz.

Gamma düzeltmesi

Genellikle gama düzeltmesi olarak kabul edilir - farklı ek binalarda görüntülenen renklerin boyutlarının telafisi, böylece görüntü farklı monitörlerde görüntülendiğinde aynı görünür. Durağan olan statik işlevin doğrusal olmayan görünümü nedeniyle, gama düzeltme ayrıca görüntünün soluk bölümlerinin kontrastını parlak ayrıntılar parlamadan ve görüntünün nesneleri arasındaki bulanıklığı kaybetmeden artırmanıza olanak tanır.

TV kanalındaki analog görünümdeki ve ayrıca daha geniş grafik biçimlerinin çoğunda dijital görünümdeki şeffaflık hakkındaki bilgiler doğrusal olmayan bir ölçekte alınır. Monitör ekranındaki bir pikselin parlaklığı orantılı olarak ayarlanabilir

de I - ekrandaki bir pikselin parlaklığı (aksi takdirde, depo renklerinin parlaklığı, kırmızı, yeşil ve mavi okremo),

V - rengin 0'dan 1'e sayısal değeri ve

d - gama düzeltmesinin göstergesi.

g 1'den küçükse, iletimin özelliği şişecek ve ortaya çıkan görüntü parlak, daha düşük olacaktır. g 1'den büyükse, iletimin karakteristiği artacak ve ortaya çıkan görüntü karanlık, daha düşük olacaktır.

Varsayılan olarak g parametresi, iletimin doğrusal özelliklerini ve gama düzeltmesini yansıtan 1'e eşittir.

Resmin dış hatlarını görüntüleme

Kontur analizi, görsel olarak çarpıcı ana hatları temsil eden grafik nesneleri tanımlamak, tanımak, eşleştirmek ve aramak için kullanılabilir. Değişken kontur parçaları, işlemlerin algoritmik karmaşıklığının sayısını önemli ölçüde azaltmaya izin veren nesnenin iç noktalarını içerir.

Şekil 5.4 - r parametresi şeklinde aşağıdaki statik fonksiyon tipinin değiştirilmesi

Nesne Anahattı - Bu, görüntüde nesneyi arka plana göre çerçeveleyecek bir eğri olarak görünen noktaların bir listesidir. En önemlisi, kontur, rengin parlak rengine göre saç kesimleriyle korunur.

Sadelik için, görüntüde kontur ararken, yogo ikilileştirmeyi gerçekleştirebilirsiniz.

Sobel'in filtresi, parlaklıklarına göre nesneler arasındaki sınırları görür. Depo renginin kırıkları korunmaz, görseller ön tarafa bakar ancak griye çevrilir.

Sobel filtresi, parlaklık gradyanının en yakın değerini sayarak cilt pikseline kadar sırayla ayarlanır. Görüntünün cilt noktası için gradyan (parlaklık işlevi), bileşenleri görüntünün yatay ve dikey olarak kademeli parlaklığı olan iki boyutlu bir vektördür.

Görüntünün cilt noktası, parlaklıktaki değişimin büyüklüğünü gösterdiğinden, parlaklıkta en büyük artışa sahip bir yön derecelendirme vektörüne sahiptir. Bu veriler, mevcut nesnenin kordonu üzerinde bakılan bir noktayı değiştirme olasılığı ve bu kordonun yönü hakkında spekülasyon yapmamızı sağlar.

O. Sobel operatörünün sabit parlaklık alanı noktasındaki çalışmasının sonucu sıfır vektörü olacak ve farklı parlaklıktaki alanlar arasında kalan noktalar artan kenarda kordonu kıran bir vektör olacaktır. parlaklık.

Görüntünün skin noktasındaki benzerlerinin yaklaşık değerlerinin hesaplanması için 3×3 boyutunda matristen vicorist paketinin Sobel filtresi.

Sobel matris katsayıları:

Gradyanın toplam değeri, aşağıdaki formüle göre yaklaşık olarak hesaplanır:

|G| = | gx | + | kız |

Kenny'de kordon dedektörü

Kenny robotu, bilgisayarın şafağında (1986) gerçekleştirilmesine rağmen, Kenny dosi kordon dedektörü en iyi dedektörlerden biridir. Adımları içeren zengin bir algoritmaya sahip Kenney yöntemi:

1. Gürültü ve ayrıntı için görüntü temizleme.

2. Gürültü ve ayrıntı için görüntü temizleme.

3. Örneğin Sobel operatörüne göre görüntü gradyanlarını arayın.

4. Azami olmayanların istisnası. Yalnızca yerel maksimumlar mezhі olarak görünür.

5. Eşik filtreleme. Aradaki potansiyeller eşiklerle tanımlanır.

6. Trasuvannya konturları (Kenarları konturda birleştirin)

Görüntüdeki en az miktardaki gürültü, konturların bütünlüğünü bozabileceğinden, bir tür gürültü azaltma yöntemi olsun, aramaya başlamadan önce görüntünün filtrelenmesi önerilir. Robotun yüksek esnekliği ve uygulamanın basitliği nedeniyle, Gauss filtresi çoğu zaman galip gelir. Görüntüdeki kordonlar farklı yönlerde olabilir, bu nedenle Kenny vikoristovu chotiri'nin algoritması yatay, dikey ve çapraz kordonların geliştirilmesi için filtreler. Operatör tarafından kordonların algılanmasının hızlandırılması (örneğin, Sobel operatörü tarafından), ilk yatay çizgi (Gу) ve dikey çizgi (Gx) için değer görünür. Bu eğimden kordona doğrudan bir kesim yapabilirsiniz:

Kordonun hemen önündeki kesim, dikey, yatay ve iki köşegeni (örneğin, 0, 45, 90 ve 135 derece) temsil eden üç kesimden birine yuvarlanır. Bu pikseller arasında, bu pikseller, gradyan vektörünün düz çizgisinde gradyanın yerel maksimumuna ulaşır. Değer doğrudan 45°'nin katı olabilir. Maksimum olmayan kenarlar boğulduktan sonra daha hassas ve ince hale gelir.

Basamaklı yolda, dış görünüm pikseli için eşik filtreleme, görüntülerin arasına getirilenlerle belirlenir. Eşik ne kadar yüksek olursa, konturlar o kadar homojen olur, zayıf kenarlar o kadar göz ardı edilebilir. Öte yandan, eşik değiştirildiğinde, algoritma gürültüye daha duyarlı hale gelir. Vidіlennya Cordonov Kenni Vikoristovo falttrack'ın iki eşiği: Pikksel Vishche Verkhnooi - Vin'in geçerliliğinin Yakshcho'su, maksimum değerleme (kordon girilir), Yakshcho Nizhge - Piksel, bir sonraki aşamada kapsamlı bölmeler).

Görüntü işlemenin geri kalan aşaması, aynı konturda dört kenarın bağlanmasına yakındır. Orta değerin ön hilalinde alınan pikseller ya yok sayılacak (zaten görünen kenarlardan pis koku aynı yere yapışmadığı için) ya da aynı kontura gelecek.

segmentasyon

Fotoğraf ve video ekipmanından alınan görüntülerin çoğu rasterdir, bu nedenle doğrusal bir ızgara gibi renkli noktalardan oluşurlar. Prote insanlar, mevcut ışığı bir nokta matrisi olarak değil, bütün nesnelerin bir koleksiyonu olarak algılarlar. Binanın insan beyni, görüntünün aynı alanda, aynı seviyede, net bir şekilde nesnelere bölünmesiyle farklı ayrıntılara bölünmüştür. Bu işleme segmentasyon denir ve görüntülerin bilgisayar analizi ve görüntülerin tanınması gibi en önemli görevler için programlı olarak uygulanabilir. Segmentasyon, analizin ilk aşamalarında vikonuetsya'dır ve tutarlılığına ve doğruluğuna netlik ve vikonnannya eklenebilir.

Segmentasyon yöntemleri iki sınıfa ayrılabilir: otomatik - korist ile etkileşim gerektirmeyen ve etkileşimli - koristuvacha'yı aracı olmadan çalışma sürecine sokan.

İlk kez, vikoristovuetsya olmayan bölgelerin gücü hakkında a priori bilgi yok, ancak zihnin eylemleri görüntünün üzerine bindiriliyor (örneğin, tüm bölgeler renk ve doku için aynı olabilir) . Segmentasyon probleminin böyle bir formülasyonu ile, nesnelerin görüntüleri hakkında a priori bilgi galip gelmediğinden, o zaman evrensel ve zastosovnі'yi gruplandırma yöntemleri bu tür görüntüler olmak.

Belirli bir görevde yöntemin gücünün kaba bir değerlendirmesi için, iyi bölümlemeden sorumlu olan güçlerin sayısını not edin:

§ bölgelerin tekdüzeliği (renk ve doku tekdüzeliği);

§ susіdnіh bölgelerinin farklılığı;

§ bölgenin kordonuna pürüzsüzlük;

§ orta bölgelerde az sayıda başka "dirok";

Eşik segmentasyonu

Eşik işleme, orta büyüklükte olduğu düşünülen aynı araziler etrafında görüntü işlemeye odaklanan en basit yöntemdir. Bununla birlikte, görüntü eşit olmayan bir şekilde aydınlatılsa da, nesnelerin bir kısmı, sınır bölümlemesini etkisiz hale getiren bozulma tarafından etkisiz hale getirilebilir.

Görüntüde yalnızca iki tür benzer çizim varsa, en basit ve en sık durgun eşik bölümleme türü ikili bölümlemedir.

Dış görüntünün cilt noktasının dış görüntüdeki herhangi bir dönüşümünde, kuralı izleyin:

burada x0, tek bir işleme parametresidir, eşiği sıralar. Rivnі vyhіdnoї yaskravostі y0 і y1, daha yeterli olabilir, kokuların etiketlerin işlevlerini kazanma olasılığı daha düşüktür, bunun için kartın düzeninin değiştirildiği yardım - її noktasının K1 sınıflarına tanıtılması veya K2 açıktır. Onaylanan ilaç görsel uygulama için hazırlanmışsa, çoğu zaman anlamı siyah beyaza eşittir. İkiden fazla sınıf varsa, o zaman eşik işlemede, farklı sınıflar arasındaki farkı tek tür yapacak bir eşik ailesi belirlenir.

Eşik bölütleme, üst üste binmeyen, tekdüze bir yapıya sahip olan ve arka plandan net bir şekilde görülen az sayıda nesnenin görüntülerini görüntülemek için iyidir. Bu nedenle, görüntünün daha büyük derecede heterojenliği için, segment sayısı ve yogo katlama ve segmentasyon türü etkisiz hale gelir.

Segmentasyon grafik bölmeye dayalıdır

Grafik teorisi yöntemleri, görüntü bölütlemede en aktif olarak geliştirilen yöntemlerden biridir.

Grubun yöntemleri fikri çok çılgınca. Görüntü, köşeleri görüntünün noktalarında olan, iyi bilinen bir grafik olarak temsil edilir. Vaga kaburga grafiği, sensi yakınındaki noktalarda vіdbivaє podіbnіst (deyakoyu metriği için vіdstan mіzh noktaları). Görüntünün diseksiyonu, grafiğin diseksiyonları ile modellenmiştir.

Kaldırılan bölümlemenin kalitesini ortaya çıkaracak olan dağılımın "vartost" işlevselliğini tanıtmak için grafik teorisi yöntemlerini arayın. Böylece, bir görüntüyü aynı alanda düzenleme görevi, grafikteki minimum değişkenliğin bir dökümünü aramak için bir optimizasyon görevine alınır. Böyle bir pidkhid, keruvattaki bölümlerin renk ve dokusunun tekdüzeliğine ve ayrıca bölümlerin şekline, boyutlarına, kordonların ince bir şekilde katlanmasına izin verir.

Minimum varyansı aramak için farklı yöntemler kullanılır: açgözlü algoritmalar (cilt çıkıntısında böyle bir kenar seçilir, bu nedenle varyansın toplam değişkenliği minimumdur), dinamik programlama yöntemleri (garantili, dış görünümde en uygun seçimi biz seçeriz) rib, algoritma optimaldir), Dijkstry, vb.

İnterpolasyon

Bilgisayar grafiklerinde, enterpolasyon yöntemi genellikle görüntünün ölçeğini değiştirme sürecinde zastosovuetsya. Görüntünün nokta sayısını değiştiren enterpolasyon, artırırken görüntü pikselleşmesini gizlemeye veya değiştirirken önemli ayrıntıları dahil etmeye yardımcı olur.

Görüntünün pikselleri arasındaki enterpolasyon işleminde, ek noktalar eklenir, bunların aktarılan tonu ve rengi, arazi alanları hakkındaki gerçek verilerin analizine dayanan özel bir algoritma kullanılarak hesaplanır. Yazık, çünkü enterpolasyon daha az yakınsa, enterpolasyon verilirse görüntü kaçınılmaz olarak dış görünüm süresi olarak kullanılacaktır.

En yakın komşu yöntemiyle enterpolasyon

Bu algoritma enterpolasyonun en basit türüdür, sadece görüntü pikselinin yüzeyini gerekli ölçeğe ölçeklendirir. İşlemin en az saatini alacak, ancak onu en iyi sonuçlara getirmek için.

Biliniyna enterpolasyonu

Bu tür enterpolasyon, iki boyutlu bir ağın farklı cilt koordinatlarında gerçekleştirilir. Görüntü bir yüzeye benziyor, renk üçüncü dünya. Renkli bir görüntü olarak enterpolasyon yalnızca üç renk için gerçekleştirilir. Yeni görüntünün dıştan görünmeyen noktası için, çift doğrusal enterpolasyon en önemli piksellerin karesine bakar. Kazananların değerlerinin interpolasyonu önemli olduğundan, bu chotyroh piksellerinin ortalaması alınır. Sonuç olarak, görüntüler, en yakın suside yönteminin çalışmasının sonucundan önemli ölçüde daha pürüzsüz görünür.

Biliniyna enterpolasyonu, ölçekleme faktörlerinin büyük değerleri ile iyi çalışır, bu nedenle bunu yaptığınızda keskin ara görüntüler büyük ölçüde genişler.

Bіkubіchna іnterpolаtsіya, 4x4 navkolіshnіh pіkselіv - toplamda 16 diziye bakan bir kroşe fіlіnіynu. Bіkubіchna іnterpolatsija, önemli ölçüde razkіshi izobrazhennya, iki yöntemin önünde nizh ve belki de çıkışta spіvvіdshennyam saat işleme ve parlaklık için en uygunudur. Nedense, birçok görüntü düzenleme programı (Adobe Photoshop dahil), yazıcı sürücüleri ve kamera enterpolasyonu için standart hale geldi.

Yakınlaştırılan görüntüler önemli ölçüde daha az keskin hale gelebilir. Keskinliği daha hızlı bir şekilde muareye daha ustalıkla kaydeden ve ardından daha yumuşak bir sonuç vermek için hareli sesi kapatan enterpolasyon algoritmaları. Ne yazık ki, ölçeklendirme sırasında böyle bir uzlaşma kaybedilemez.

Cim ile başa çıkmanın en iyi yollarından biri, bulanıklık maskesini ölçeklendirdikten sonra, keskinliği artırırken orijinaline geri getirmek için yakınlaştırmaktır.

5.2 Alt sistemler gibi algoritma seçiminin temellendirilmesi

Geliştirilmekte olan yazılım paketinin ana faydası, sayım kümesindeki ilk işleme sırasında video akışındaki sıkışmanın en aza indirilmesidir. Ek olarak, zjomka herhangi bir zihin tarafından bilinebilir, bu da çeşitli olumsuz etkileri etkisiz hale getirmek için çok sayıda basit filtrenin kısa sürede uygulanması gerektiği anlamına gelir. Ek olarak, videoda görünen çok sayıda olumsuz faktörü kısa bir süre için hesaba katmak ve bunları etkisiz hale getirmek için basit filtreler uygulamak gerekiyordu. Yetkililerin ihtiyaçlarını karşılayan algoritmalar kolay erişilebilir, iyi optimize edilmiş, yüksek öncelikli ve aynı zamanda uygulama kolaylığına sahip. OpenCV kitaplığının işlevleri çok güçlü olabilir, bu nedenle video akışını işlemek için filtreleri uygulamak için belirli yöntemler seçerken, bu kitaplığa dahil edilmiş gibi göründüğü sürece öncelik algoritmalara verilir.

Mezuniyet yeterlilik çalışmasının teorik kısmında ele alınan bu algoritmalar, pratikte özellikleriyle eşleşebilmesi için bir test formunda uygulanmıştır. Zokrema'ya göre, video akışının çerçevesini işleme hızı ile elde edilen sonucun kalitesi arasında bir uzlaşmaya öncelik verildi.

Numaralandırma kümesinde video akışını işlemek için filtrelerin uygulanmasının bir sonucu olarak, aşağıdaki algoritmalar seçildi:

1. “Ek beyaz” gürültüyü gidermek için Gauss algoritması kullanıldı. Şarapların gürültü sönümlemesinde en büyük genleşme yöntemi olarak, optimizasyonlar açısından da iyi ve işin güvenilirliğini artırmak mümkün gibi görünüyor.

2. “Ek beyaz” gürültüyü gidermek için Gauss algoritması kullanıldı. Gürültü azaltma yönteminin en büyük uzantısı olarak, şaraplar daha da iyi optimize edilmiştir ve görünüşe göre işin yüksek hızı

3. “İmpuls” gürültüsünün uzaklığı için medyan filtreleme seçilmiştir. Danimarka yöntemi de iyi optimize edilmiştir, ayrıca, özellikle "kuvvet ve biber" tipi dürtü gürültüsü ve gürültüsünün kullanımı içindir.

4. Görüntünün keskinliğini artırmak için, bir çuval seçildi, böylece bulanık maskeleme için zengin bir şekilde çalışıyor ve hemen hoş sonuçlar veriyor.

5. OpenCV kitaplığı, renk düzeltme algoritmalarına misilleme yapmaz - bu, Tek Ölçekli Retinex algoritmasının en çok uzantısını ve iyi belgelemesini uygulayarak elde edildi. Danimarka yöntemi oldukça verimli olabilir, ancak aynı zamanda işin hızını artırmak için optimizasyon gerektirir.

6. Konturları görme yöntemi olarak Kenny algoritması geliştirilmiştir, şarapların ölçeklendirmeleri en iyi sonucu verir, alt Sobel filtresi.

7. Piramidal segmentasyon algoritması, OpenCV kitaplığındaki gösterimler oldukça doğrudur, bu, grafikler üzerinde segmentasyon algoritmasının önceki analizinin aksine.

8. enterpolasyon - bikübik enterpolasyon yöntemi, işin esnekliği ile sonucun doğruluğu arasındaki en makul uzlaşma olarak kullanılır.

Muzaffer yazılım araçlarının bu yapılandırmasını yükledi.

Kazanan sayım kümesi üzerine GNU Linux (Ubuntu) sistemi kuruldu.

İşletim sistemi kurulduktan sonra, görüntü dosyalarının okunmasını, ekranda boyamayı, robotu videodan sadece desteklemek için bazı kitaplıklar kurmak gerekir.

CMake'i Yükleme

Proje, CMake yardımıyla katlanır (sürüm 2.6 veya üstü gereklidir). її'yi şu komutla kurabilirsiniz:

apt-get kurulum cmake

Aşağıdaki kitaplıklara da ihtiyacınız olabilir:

build-essential libjpeg62-dev libtiff4-dev libjasper-dev libopenexr-dev libtbb-dev libeigen2-dev libfaac-dev libopencore-amrnb-dev libopencore-amrwb-dev libtheora-dev libvor

ffmpeg'i yükleme

Opencv'nin video dosyalarını doğru bir şekilde işleyebilmesi için ffmpeg kütüphanesini kurmanız gerekmektedir. Saldırgan komutlarla dövüşün:

1) Kütüphane çıkış kodlarının yakalanması

wget http://ffmpeg.org/releases/ffmpeg-0.7-rc1.tar.gz

2) Arşivi çıkış kodlarıyla açmak

tar-xvzf ffmpeg-0.7-rc1.tar.gz

3) Kitaplığı değiştirme

yapılandır --enable-gpl --enable-version3 --enable-nonfree --enable-postproc

enable-libfaac --enable-libopencore-amrnb --enable-libopencore-amrwb

Enable-libtheora --enable-libvorbis --enable-libxvid --enable-x11grab

Enable-swscale --enable-shared

4) Kütüphanenin saklanması ve kurulumu

GTK yüklü

OpenCV vicon'larını görüntülemek için GTK+ 2.x kitaplığı veya başlık dosyaları (libgtk2.0-dev) kurulur.

apt-get kurulum libgtk2.0-dev

Opencv'i Kurmak

İlgili tüm kütüphaneleri kurduktan sonra aşağıdaki komutlar ile opencv2.2 kurulumu tamamlanır:

1) OpenCV kütüphanesinin çıkış kodlarını yakalamak

http://downloads.sourceforge.net/project/opencvlibrary/opencv-unix/2.2/OpenCV-2.2.0.tar.bz2

2) Arşivi çıkış kodlarıyla açmak

tar -xvf OpenCV-2.2.0.tar.bz2

3) CMake yardımıyla bir Makefile oluşturmak.

4) OpenCV kütüphanesini katlama ve kurma

5) Bu nedenle, kütüphanelere giden yolu kaydetmeniz gerekebilir.

dışa aktar LD_LIBRARY_PATH=/usr/local/lib:$LD_LIBRARY_PATH

Bozuk bir yazılım paketini kurma ve derleme

Açıklayıcı nota eklenen orijinal kod programlarının diskten kopyalanması gerekmektedir. Aynı klasörde, build_all.sh toplu iş dosyasını kopyalamanız ve ardından yoga çalıştırmanız gerekir. Sistemde gcc derleyici kurulu ise seçim otomatik olacaktır.

Görüntünün işlenmesinin özü, sahnenin verilen görsel görüntüsünden nesnelerin tanınmasına izin veren noktaya kadar alınır.

SVT'de Kіntsevoy görüntü işleme yöntemi є tanımadan önce sahnedeki nesnelerin hazırlanması, t. görüntülerinin sınıfların deyaky zazdalegіd görevlerine tanıtılması. Bilgi dönüştürme prosedürlerinin sunumundaki farklılıklardan bağımsız olarak, STZ işlemenin üç ana aşamasını görebilir:

1) ön görüntü işleme;

2) segmentasyon;

3) açıklama.

Ön işleme, kendi içinde, iki temel aşama vardır: görüntüye şekil verme ve yogo kodlama (kabartma). Belirli bir tesis için adımların sırasını belirlemek kolay değildir.

Ön resim çerçevesi

Görüntüyü STZ'de ileri işlemeye yönelik tüm yöntemler, açık alanlara ve frekanslara bölünmüştür. Doğrudan görüntünün pikselleri üzerinde çalışan kapsamlı yöntemler ve prosedürler. Görüntünün bir özelliği olarak, vikorizm ortaya çıkar. Y(x, y). Fur'є'nin ek dönüşümü için görüntüleri karmaşık bir düzlemle eşleştirmek için frekans yöntemleri.

Frontal işleme prosedürlerine baktığımızda etrafımız daha ferah yöntemlerle çevrili olacak ve görsellere baktığımızda onları hatırlayacağız.

İlk aşamada ön işleme yapılır. görüntü şekillendirme Görüntünün oluşumu, matrisi ve konturu oluşturan pikseller gibi bir dizi ayrık öğenin belleğine yerleştirilen video işlemciden görüntünün ara olmayan bir şekilde çıkarılması prosedürü olarak adlandırılır.

STZ'de, görüntüyü oluşturma aşamasında, aydınlatmayı ayarlayarak ve görüntüyü filtreleyerek parlaklık eşiğini seçin.

filtrasyon banyosu görüntü, ön işlemenin en önemsiz ve katlama aşamasıdır. Vipadku filtrasyonunun aşağıdaki ana görevleri vardır:

· Zgladzhuvannya (prinіchennya yüksek frekanslı vardiya tipi "snіg");

· Kontrast geliştirme;

· Kontur görüşü.

Yumuşatma prosedürü, parlaklık eşiği seçiminden hemen sonra uygulanır. Її zmіst polgaє y şarkı kuralından sonra ortalama parlaklık fonksiyonunun değeri Y(X, y) görüntünün analiz edilen parçasının ortası.

"Snіg" tipinde yüksek frekanslı bir anahtar kullanmak için düşük frekanslı bir filtre kullanın. Nedolikom düşük frekanslı filtrelemeє Görüntünün kontrast geliştirmesi.

segmentasyon



Görüntünün ileriye doğru işlenmesinin bir sonucu olarak, nesnelerin kontur görünümlerinden biri veya daha fazlası kaldırılabilir. Bu konturları alt bölümlere ayırma ve onları şarkı söyleyen nesnelerle kıvırma prosedürüne denir. segmentasyon.

Önsel olarak, görüntünün nesnelerin serpiştirilmesinin yerini alacağı açıktır, görüntünün kodlanması aşamasından önce konturlar görüldükten sonra bölütleme işlemi gerçekleştirilir.

Segmentasyon algoritmaları, kural olarak, kontur ve benzeri alanlardaki çeşitlilik temeline dayanır. İlk kez, belirlenen kurala göre program baypası tarafından geliştirilen bir kontur var. Devre kapalı görünüyorsa, nesnenin içeride olması önemlidir. Başka bir şekilde, görüntünün spіlnі gücüne sahip olabilecek alanları belirtilir (örneğin, aynı piksel netliği). Bu tür alanlar bilindiğinde ya arka plana ya da nesneye yönelik bir inceleme yapılır.

görüntü kodlama

Uzay yöntemlerini kullanarak benzer görüntüleri işleyen sistemler için iki ana kodlama yöntemi vardır:

· Düzine dizi kodlama yöntemiyle net bir görüntünün kodlanması;

· Görüntünün konturunun Freeman kodu ile kodlanması.

Her iki modda da kodlama sırasında görüntüyü karakterize eden verilerin zorunluluğunda önemli bir değişiklik olur. Kodlamanın etkinliği, görüntü sıkıştırma derecesine bağlıdır.

Kodlama yöntemiyle kodlamanın özü düzine dizisi, RLE algoritmasının yardımı için uygulandı; Bu durumda cilt serisi, en yüksek değerler ve en uzun seri (piksel sayısı) ile karakterize edilir.

Görüntünün konturunun ortası olmadan kodlamak için genellikle mızrağı bloke etmek gerekir serbest adam kodu(Şekil 6.22, B). Bu şekilde, ikili noktadan başlayarak nesnenin konturu, 45'in katı olan bir modül kesme modülü ile ayrık değerleri kabul eden bir dizi vektör tarafından belirlenir. 2, böylece vektörün aksamı dikey veya yatay konumda 45 ve 1 olur. Eğrinin bir noktasından başka bir noktaya geçiş sırasında vektörün yönünün değiştirilmesi, modellenmekte olan eğrideki değişimin doğasını gösterir.



Görüntü açıklaması

pid Tanım nesnenin karakteristik parametrelerinin tanımını anlamak - işaret(ayrımcılar), bize yardımcı olmak için gerekli vizyon, olay yeri.

Fiziksel varlıkları için işaretler, küresel ve yerel olanlara bölünmüştür. küresel işaret Görüntü, bir nesnenin herhangi bir görüntüsü için hesaplanabilen bir işarettir.

yerel işaretler daha fazla vikoristovuyut; kokular, görüntünün tam açıklamasında, yoganın bir bölümünden daha azını karakterize eder. Onlardan önce, iki kontur çizgisi arasında, sadece nesnenin görüntüsünde hangi parametrelerin açıldığını görebilirsiniz.

görüntü tanıma

Tanıma bir nesnenin belirli bir görüntüsünün işaretinin bir şarkı sınıfına atandığı süreç denir.

Tanıma, görsel görüntüyü analiz etme işlevini uygular.

Zihinsel olarak, tüm tanıma yöntemleri iki gruba ayrılabilir: teorik ve yapısal. En geniş teorik yöntemler yelpazesi ve övgü teorisinin galip ilkelerinin tanınması çözümü.

Nesnenin işaretinin gerçek değerini belirlemek imkansızdır, değerin kırıkları cilt morbiditesinde farklılık gösterir. Bu nedenle, tanıma görevi şu şekilde ayarlanmalıdır: nesnenin belirli bir sınıfa ait olma olasılığını belirleyin.

STZ'de görüntü tanımanın en doğrudan yollarından biri, karakter tanıma için algoritmaların geliştirilmesiyle ilgilidir. Tanıma (doğrulama) algoritması, kayıt algoritmasına yakındır. Akış görüntüsünden bakıldığında, işaretler, bileşenleri veri tabanında bulunan tüm vektörlerin karşılık gelen bileşenlerine eşit olan vektör işaretiyle birleştirilir.

1

Bu makalede, Sobel operatörünün yardımı için görüntülerdeki kordonların görüntülenmesini sağlayan bulanık mantık ve sinir ağlarına dayalı akıllı mobil robotlar tarafından görüntülerin işlenmesi için algoritmalar geliştirilmiştir. Görüntünün işlenmesinin özü, sahnenin verilen görsel görüntüsünden nesnelerin tanınmasına izin veren noktaya kadar alınır. Tanınmadan önce görüntünün ilk hazırlığı saatinde ana sorunlar ve bunların tamamlanma yolları incelenir. Ek bulanık mantık için ileri işleme algoritması ve görüntü ikilileştirme süreci ayrıntılı olarak analiz edilir. Sobel operatörünün yardımıyla bir görüntüdeki kordonları görmenin bulanık işlenmesi için bir algoritma önerildi.

görüntü işleme

Bulanık mantık

akıllı sistem

nesnelerin tanınması

1. Vesnin O.M., Veto A.V., Tsaryov V.A. Uyarlanabilir optoelektronik teknik bilgi sistemlerinin geliştirilmesinden önce / / Endüstride otomasyon, 2009. - No. 11. - S. 48-52.

2. Grishin V.A. İnsansız hava araçlarının yönetimi için teknik gözetim sistemleri // Sensörler ve sistemler, No. 2, 2009. - C. 46-52.

3. Klevalin V.A., Polivanov A.Yu. Endüstriyel robotların teknik bilgi sistemlerinde dijital tanıma yöntemleri// Mekatronik, otomasyon, yönetim, 2008 No. 5. - S. 56-56.

4. Mikhailov S.V., Romanov V.V., Zaikin D.A. Malzemelerin işlenmesi sürecinin teşhisi için teknik gözlem sistemi// Bilgisayar ve bilgi teknolojileri bülteni, 2007 Sayı 3. - S. 12-19.

5. Syomin M.S. Ek teknik bilgi sistemleriyle uygulamalı görevlerin çözümüne genel bakış// http://www.videoscan.ru/page/718#13.

Bu otomatik görüntü işleme, parça zekası alanındaki en önemli direktiflerden biridir ve robotik komplekslerin gelişimini, görüntü tanımanın gelişimini aktarır. Örüntü tanıma için en etkili araçlardan biri bulanık mantık ve parçalı sinir ağlarına dayalı bir sistemdir. Teknik bilgi sistemi (STZ), herhangi bir kod göstergesine ve tanımlamanın güvenilirliğine ihtiyaç duymadan, aynı görevi farklı şekillerde çözmek için bir dizi yönteme ve algoritmaya ihtiyaç duyar.

STZ mobil robotik komplekslerindeki (MRC) hibrit görüntü işleme algoritmasının özü, verilen görsel görüntüyü nesneleri tanıma problemini çözmenizi sağlayan bir sahneye dönüştürür.

STZ'de Yardımcı Bir Bulanık Sistem İçin Bir Görüntünün İleriye Doğru İşlenmesi Algoritması

Görüntü işlemeden önce bulanık işleme, anlama, görünüm, görüntü işleme, segmentler ve bulanık çarpanlar olan kişisel olmayan çeşitli bulanık yaklaşımlardır. Görüntüleri tanıma sürecinde, görüntünün ileri bulanık işleme süreci büyük önem taşır, aynı parçaların sinir bariyerinin girişine gelmelerini sağlayan bir veri deposu olarak bulunabilir. Bölme görevi çerçevesinde, ileri bulanık işlemenin algoritması, görünüşte ilerleyen bir dizi adımla temsil edilebilir (Şekil 1): bir web kamerasının yardımıyla görüntü yakalama; görüntünün kaldırılan renkli görüntüsünün gri renk tonlamalarında dönüştürülmesi; bulanık görüntü işleme.

Mal. 1. İleri bulanık görüntü işleme için algoritma

Bu sıralamada ön fuzzy giydirmenin ilk vuruşu görüntünün renkliden griye dönüşmesidir. Görüntünün renklerinin mavi renk üzerine dönüşümü bu şekilde yapılır. Tüm renk paleti, üstleri farklı renklere karşılık gelen bir küp görünümünde sunulur. Sıra ölçeği, siyah ve beyaz zirveleri geçen küpün köşegenine yayılmıştır.

Gri noktadaki görüntünün dış görünüm noktası için dönüşümü için kırmızı, yeşil ve mavi ambar renginin yoğunluğu görülür ve ardından aşağıdaki formüle göre rengin dönüşümü oluşturulur:

de - renk için yeni değer, - kırmızı depo renginin yoğunluğu, - yeşil depo renginin yoğunluğu ve - mavi depo renginin yoğunluğu. Gri ortam 0 ve 1'i görselleştirmek için dış görünüm algoritmasının kullanımı. Açıklığı belirleme yolunda, galip gelenin ortalaması en büyük ve en önemsiz iki renk arasında alınır: . Ortalama puan yöntemi, üç rengin de ortalama değerine sahiptir: . Temsili tasvir yönteminde, insanların kabulünden sorumlu olan üç rengin de ortalama değerinin önemi önemlidir. Bu nedenle, insan gözünün kırıkları yeşil renge en sempatik olanıdır, yoga vaga en önemlisi olarak kabul edilir:. Görüntü kalitesinin görüntülenme yöntemi, görüntü işleme yazılımı tarafından sağlanır. İşlevin uygulanması Vіn « rgb2gray" MATLAB ortamında bulunur ve genellikle bilgisayar bilimi için kullanılır. İleri bulanık işleme sürecinde, ek bir parlaklık atama yöntemi için görüntüyü renkliden (RGB) gri renge dönüştürme işlemi. Ayrıca, görüntü griden siyah beyaza değişir (Şek. 2).

Mal. 2. görüntüyü renkliden griye dönüştürme işlemi

Ön işleme saatinde görüntünün ikili hale getirilmesi

Görüntünün Metoyu ön bulanık işlenmesi, görüntünün kalıplanması ve daha fazla küçültülmesi, yoga ikilileştirme ve kodlama (zocrema, otrimannya kontur dosyalama). Görüntü ikilileştirme, görüntü ikilisinde, tobto'da bir rengin (farklı - gri) tonlamalarından oluşan görüntü dönüştürme işlemidir. bir dış görünüm pikselinin yalnızca iki renge sahip olabileceği görüntü (bizim durumumuzda siyah ve beyaz renklere sahiptir). Böyle bir dönüşüm sonucunda, bir pikselin rengi zihinsel olarak sıfıra veya bire eşit kabul edilir, her pikselin sıfır değerlerine sahip olması (bu durumda, beyaz rengin piksel sayısı) arka plan olarak adlandırılır ve değerleri bire (siyah renk) eşit olan piksellere ön plan denir. Böyle bir dönüşümün sonucu olarak atılan ikili bir görüntü olsa da, aynı alanlardaki görüntü gürültüsü ve ayrıca kayıp nedeniyle nesneler üzerinde genişleme ve bulanıklık görünümü ile karakterize edilen orijinal ile hizalanmış olarak oluşturulur. nesne yapısının bütünlüğü.

Nesnenin bütünlüğünün kaybı ve nesnenin nasıl ve ne zaman keşfedildiği, ci dotik nesnesinin aydınlatmasındaki büyük düzensizlik (nesnelerin üst üste binmesi) nedeniyle önemsiz nedenlerle suçlanır. Özellikle işçilik durumunda katlama, kaplamanın kendisidir (bu bir bükülmedir - küçük bir kaplama gibi), çünkü Bir taraftan çok sayıda nesnenin görüntüsü tek bir nesne gibi yorumlanabiliyorken, diğer taraftan nesnenin geometrik bütünlüğünü revize eden algoritmalar, bindirme alanlarındaki bölgeleri temsil ederek farklı şekilleniyor. arka plan. İşlemenin katlama doğası, nesnelerin üst üste binmesini yorumlama görevinin teorik çözümünün doğasına yakındır ve bilgilerin bir kısmı kaybolmuştur. Algoritmaların pratikte uygulanmasında, doğru bir çözüm olarak, belirlenen seçeneklerden biri kabul edilir - geçiş, akış nesnesinin devamı olarak kabul edilir veya kaplama alanı arka planda dikkate alınır.

Eşik işleme, rengi veya görüntüyü siyah beyaz bir görüntüye dönüştürür. Eşik dönüşümleri uygulanan bölütleme görevlerinde merkezi bir yer tutar, beyin görüntüleri sezgisel olarak anlaşılır güçler ve uygulama kolaylığı ile sağlanır. Görüntüdeki cilt pikseli için izleme yoğunluğunun değeri, beyaz rengi yansıtan eşik değerinden daha yüksektir. Fiyat ayarlanan eşiğin altındaysa, siyah olarak ayarlanır. Belirlenen eşik 0 ile 255 arasında olacaktır.

Bu saatte, çok sayıda ikilileştirme yöntemi vardır. Raster görüntülerin bu dönüşümünün özü, akış pikselinin netliğinin belirli sınır değerleri ile analizine dayanır: akış pikselinin netliği sınır değeri tobto'dan daha ağır bastığı için. , o zaman ikili görüntüdeki pikselin rengi beyaz olur, aksi takdirde renk siyah olur. Eşik yüzeyi, genişliği dış görüntünün osmіrnosti'sine benzer olan bir matristir.

İkilileştirme sürecinde, tüm yöntemler, bir sınır yüzeyi oluşturma ilkesine göre iki gruba ayrılır - ikilileştirmenin küresel ve yerel olarak işlenmesi yöntemi. p align="justify"> Global ikilileştirme işleme yöntemlerinde, eşik yüzeyi, eşik parlaklığının sabit değerleri ile düzdür, yani. Eşik değeri, tüm görüntünün histogramlarının analizine bağlı olarak hesaplanır ve görüntülenen görüntünün tüm pikselleri için aynıdır. Genel olarak, eşik işleme küçük olabilir - görüntü eşit olmayan bir şekilde aydınlatılmış olsa bile, daha fazla aydınlatılan alanlar genellikle ön plan olarak sınıflandırılır. İkilileştirmeyi işlemenin yerel yöntemlerinde, eşik değeri, noktanın komşuluğunun yakınında bulunan alanın deyah işaretinden dış görünüm noktası tarafından değiştirilir. Bu tür bir dönüşümün eksikliği, görüntünün dış görünüm noktasının eşik değerlerinin aşılması nedeniyle robotik algoritmaların düşük hızıdır.

Belirlenen görevi gerçekleştirmek için bir yöntem olarak, hızlı bir şekilde Bernsen yöntemini kullanıyoruz. Yöntem, dönüştürülen pikselin kırmızılığının, keskinleştirilmiş yogoda hesaplanan yerel ortalamaların değerleri ile eşitlenmesini ayarlama fikrine dayanmaktadır. Görüntünün pikselleri, noktalarda merkezler bulunan pencerelerde ortalama parlaklık değerleri ile yoğunluklarının eşitlenme çizgileri boyunca işlenir (Şekil 3).

Mal. 3. Görüntü piksel dönüştürme

Görüntü Bölütleme Arasında Görmek İçin Bulanık İşleme Algoritması

Görüntü siyah beyaza çevrildikten sonra Sobel operatörünün yardımıyla bir gradyan görüntü çıkacak ve bulanık görüntü işlemenin (FDI) girişine gidecektir (Şekil 4).

Bir görüntünün bulanık işlenmesi üç ana aşamadan oluşur: görüntü aşamalandırma, aitlik değerleri üzerinde bulanık görme sistemi ve görüntü durulaştırma. Resmin ana okunamazlığı orta çemberdedir (okunamazlık sistemi). Veri görüntülerinin basit bir eşit aşamalandırmadan aktarılmasından sonra, bulanık görüntüleme sistemi mülkiyet değerine atanır. Bulanıklaştırma - veri görüntülerinin kodlanması ve bulanıklaştırma - görüntülerin bulanık yöntemlerle işlenmesine izin veren sonuçların kodunun çözülmesi.

Resim - rozmіr іz sіrimi eşittir ve görüntünün gücünün bir nedeni olarak cilt pikseline ait olma değerini gösteren (örneğin, netlik, pürüzsüzlük vb.).

(1)

de - bulanık çarpmalar açısından bir piksele ait olma. Nemin önemli değeri, spesifik olanlar şeklinde düşmek, özellikle zastosuvannya ve temel bilgi şeklinde olabilir.

Giriş sistemi için sistemin çıktısı aşağıdaki formülle verilir:

(2)

Mal. 4. Kordon görüşünün bulanık görüntü işlemesi için algoritma

Görüntülerin tanınması için zastosuvannya sinir ağları

Çoklu top algılayıcı, girdi topunu oluşturan bir dizi girdi düğümünden, bir veya daha fazla sayıda nöron topundan ve bir çıktı topundan oluşan bir nöron ağı parçasıdır (Şekil 6). Bu tür ağlarda, giriş bilyesine gönderilen sinyal, ardı ardına doğrudan bir hat halinde toptan topa iletilir. Bu tür INS, çeşitli farklı zavdan, zokrema zavdannya rozpoznavannya görüntülerinde başarılı bir şekilde zastosovuєtsya'dır.

Pardonun skrotal lateral uzantısının nöronu, bir dizi nöron topundan oluşur, ayrıca, ön topun deri nöronu, ayak topunun deri nöronu ile bağlantılıdır. Bu tür ağlarda, deri topun top sayısı ve eleman sayısı belirlendikten sonra, affı en aza indirmek için ağdaki vag ve eşik değerlerinin böyle bir sıralamada hesaplanması gerekir. tahmin Farklı öğrenme algoritmalarının yardımı için zavdannya vyrishuetsya. Bu algoritmaların özü, ilk verilere bir satır eklenmesine dayanmaktadır. Gerçekleşen ölçünün affı, tüm girdi verilerini çalıştırmanın ve ölçünün çıktısındaki değeri tamsayı değerlerle fiilen alıp götürmenin bir yoludur. Ardından, perakende ticaretin parlatılması, merezhi'nin ciddi affını karakterize ettiği için, benim afların işlevi olarak adlandırdığım ciddi olarak özetlenir. Ve daha sıklıkla, afların bir fonksiyonu olarak, kare afların toplamı alınır.

Zengin top sinir ağları geliştirmek için en geniş kapsamlı algoritmalardan biri, çok yönlü af algoritmasıdır. Bu algoritmada, af gradyan vektörü hesaplanır. O zaman değeri bir gün ileriye doğru itelim (bize en bariz inişte dümdüz göstereceğiniz zaman), affın değeri daha da az olacaktır. Adım adım böyle bir son eylem, affın en aza indirilmesine yol açtı. Buradaki hata, sanki dışarı çıkacaklarmış gibi değerler atamanın zorluğunda yatmaktadır. Ekin boyutu gözle görülür derecede büyükse, onu en görünür inişe getirirsiniz, ancak "yeniden şekillendirmek" mümkündür.

Bir noktaya veya yanlış yönde bir noktaya ihtiyacım olacak, böylece üstte katlanmış formu bitirebilirim. Örneğin bir anda, sanki yüzey dik yokuşları olan dar bir yarmış gibi, algoritma daha uygun bir şekilde çıkıntılı olacak, bir yokuştan diğerine kayacaktır. Kırpmanın boyutu küçük olsa bile, doğrudan en uygun değere getirirseniz, yineleme sayısını önemli ölçüde artırabilirsiniz. Mümkün olan en iyi sonucu elde etmek için, eğrinin boyutu, belirli bir sürekli-tatlı eğitim ile becerinin soğukluğuyla orantılı olarak alınır. Vybіr tsієї konstantiny zdіysnyuєtsya eksperimentalnym yolu ve belirli bir görevin zihnine düşüyor.

Aşağıdaki tanımı tanıtalım. Ekli topa girdi katsayılarınızın matrisi anlamlıdır ve iliştirilmiş topa ekleri ekleyen katsayılarınızın matrisi . İndeksler için aşağıdaki atama kabul edilebilir: girişler sadece indeks ile, topa bağlı elemanlar - indeks ile ve çıkışlar - indeks ile numaralandırılır. Bağlantıya giriş sayısı iyi, ekli toptaki nöron sayısı-, çıkış topundaki nöron sayısı-. Merezha seçmeyi öğrensin. Ardından, bir bagato-top algılayıcısı geliştirmek için algoritma şöyle görünecektir:

Krok 1. Ölçünün başlatılması. Verilen katsayılara, örneğin (-0.3, 0.3) aralığından küçük dalgalanma değerleri verilir; eğitimin doğruluğunun parametresi, eğitimin hız parametresi (kural olarak, eğitim sürecinde değiştirilebilir), izin verilen maksimum yineleme sayısı belirlenir.

Krok 2. Çıkış sinyalinin hesaplanması. Dizinin girişinde ilk seçime ait görüntülerden biri verilir ve nöron dizisindeki tüm nöronların çıkış değerleri belirlenir.

Krok 3. Nalashtuvannya sinoptik vag. Aşağıdaki formülleri kullanarak sinir ağının dış topu için vag değişimini genişletin:

de . Aşağıdaki formülleri kullanarak ekli top için vag değişikliğini çözün: , de

Krok 4. Kroki 2-3, tüm başlangıç ​​vektörleri tarafından tekrarlanır. Eğitim, pardon fonksiyonunun değerini aşmayan dış görünüm ilk görüntülerine ulaştıktan sonra veya izin verilen maksimum yineleme sayısından sonra tamamlanır.

Timsah 2'de, ilk diziden vektörlerin vypadkovy düzeninde bir giriş sunma olasılığı daha yüksektir.

Çite giriş çıkış sayısı, ses, yöneticinin zihni tarafından belirlenir ve takılan topun boyutu deneysel olarak bilinir. Girdi sayısının% 30-50'si olmak için içindeki nöron sayısını arayın. Ekli topta çok fazla nöron, hafızanın binayı tükenme noktasına kadar boşa harcadığı noktaya getirmek için (ilk titreşimin hafıza elemanını yeni bitirdi ve tanıma yöneticisi için kabul edilemez olan benzer kalıplara tepki vermiyor) ). Ekli toptaki nöronların sayısı çok küçük olsa da, çizgiler öğrenmenin zihninde görünmüyor.

Visnovok

Tanınmadan önce görüntünün ilk hazırlığı saatinde ana sorunlar ve bunların tamamlanma yolları incelenir. Ek bulanık mantık için ileri işleme algoritması ve görüntü ikilileştirme süreci ayrıntılı olarak analiz edilir. Sobel operatörünün yardımıyla bir görüntüdeki kordonları görmenin bulanık işlenmesi için bir algoritma önerildi.

İnceleyenler:

Gagarina L.G., Teknik Bilimler Doktoru, Profesör, Ulusal Bilim Öncesi Üniversitesi "MIET" "Hesaplama Sistemlerinin Bilişim ve Programlama Güvenliği" Bölüm Başkanı, Moskova.

Portnov E.M., Teknik Bilimler Doktoru, "Bilgisayar Sistemlerinin Bilişim ve Yazılım Güvenliği" Bölümü Profesörü, Ulusal Ön Çalışma Üniversitesi "MIET" Bilimsel ve Araştırma Laboratuvarı "Yönetim Bilişim Sistemleri" Başkanı, Moskova.

bibliyografik istek

Aung Ch.H., Tant Z.P., Fedorov A.R., Fedorov P.A. AKILLI MOBİL ROBOTLAR TARAFINDAN BULANIK MANTIK VE SİNİR LİSTELERİNE DAYALI GÖRÜNTÜ İŞLEME ALGORİTMALARININ GELİŞTİRİLMESİ // Modern Bilim ve Eğitim Sorunları. - 2014. - 6 numara;
URL: http://science-education.ru/ru/article/view?id=15579 (giriş tarihi: 01.02.2020). "Academy of Natural History" dergilerinde görülen dergilere saygı duyarız.