13. Bilgisayarla Görme¶
Tıbbi teşhis, kendi kendini yöneten araçlar, kameralı izleme veya akıllı filtreler olsun, bilgisayarla görme alanındaki birçok uygulama mevcut ve gelecekteki yaşamlarımızla yakından ilişkilidir. Son yıllarda derin öğrenme, bilgisayarla görme sistemlerinin performansını artırmak için dönüştürücü güç olmuştur. En gelişmiş bilgisayarla görme uygulamalarının derin öğrenmeden neredeyse ayrılmaz olduğu söylenebilir. Bu bölüm bilgisayarla görme alanı üzerinde duracak ve yakın zamanda akademide ve endüstride etkili olan yöntemleri ve uygulamaları inceleyecektir.
Section 6 ve Section 7 içinde, bilgisayarla görmede yaygın olarak kullanılan çeşitli evrişimli sinir ağlarını inceledik ve bunları basit imge sınıflandırma görevlerine uyguladık. Bu bölümün başında, model genelleştirmesini geliştirebilecek iki yöntemi, yani imge artırımı ve ince ayarlama, tanımlayacağız ve bunları imge sınıflandırmasına uygulayacağız. Derin sinir ağları imgeleri birden çok katmanda etkili bir şekilde temsil edebildiğinden, bu tür katmanlı gösterimler, nesne tespiti, anlamsal bölümleme ve stil aktarımı gibi çeşitli bilgisayarla görme görevlerinde başarıyla kullanılmıştır. Bilgisayarla görmede katmanlı temsillerden yararlanmanın temel fikrini takiben, nesne tespiti için önemli bileşenler ve teknikler ile başlayacağız. Ardından, imgelerin anlamsal bölümlemesi için tamamen evrişimli ağları nasıl kullanılacağını göstereceğiz. Sonra bu kitabın kapağı gibi imgeler oluşturmak için stil aktarım tekniklerinin nasıl kullanılacağını açıklayacağız. Sonunda, bu bölümün materyallerini ve önceki birkaç bölümü iki bilindik bilgisayarla görme kıyaslama veri kümesine uygulayarak sonlandırıyoruz.
- 13.1. İmge Artırması
- 13.2. İnce Ayar
- 13.3. Nesne Algılama ve Kuşatan Kutular
- 13.4. Çapa Kutuları
- 13.5. Çoklu Ölçekli Nesne Algılama
- 13.6. Nesne Algılama Veri Kümesi
- 13.7. Tek Atışta Çoklu Kutu Algılama
- 13.8. Bölge tabanlı CNN’ler (R-CNN’ler)
- 13.9. Anlamsal Bölümleme ve Veri Kümesi
- 13.10. Devrik Evrişim
- 13.11. Tam Evrişimli Ağlar
- 13.12. Sinir Stil Transferi
- 13.13. Kaggle’da İmge Sınıflandırması (CIFAR-10)
- 13.13.1. Veri Kümesini Elde Etme ve Düzenleme
- 13.13.2. İmge Artırma
- 13.13.3. Veri Kümesini Okuma
- 13.13.4. Modeli Tanımlama
- 13.13.5. Eğitim Fonksiyonunu Tanımlama
- 13.13.6. Modeli Eğitme ve Geçerleme
- 13.13.7. Test Kümesini Sınıflandırma ve Kaggle’da Sonuçları Teslim Etme
- 13.13.8. Özet
- 13.13.9. Alıştırmalar
- 13.14. Kaggle Üzerinde Köpek Cinsi Tanımlama (ImageNet Köpekler)
- 13.14.1. Veri Kümesini Elde Etme ve Düzenleme
- 13.14.2. İmge Artırma
- 13.14.3. Veri Kümesi Okuma
- 13.14.4. Önceden Eğitilmiş Modelleri İnce Ayarlama
- 13.14.5. Eğitim Fonksiyonunu Tanımlama
- 13.14.6. Modeli Eğitme ve Geçerleme
- 13.14.7. Test Kümesini Sınıflandırma ve Kaggle’da Sonuçları Teslim Etme
- 13.14.8. Özet
- 13.14.9. Alıştırmalar