.. _sec_kaggle_cifar10: Kaggle'da İmge Sınıflandırması (CIFAR-10) ========================================= Şimdiye kadar, doğrudan tensör formatında imge veri kümelerini elde etmek için derin öğrenme çerçevelerinin üst düzey API'lerini kullanıyoruz. Ancak, özel imge veri kümeleri genellikle imge dosyaları halinde gelir. Bu bölümde, ham imge dosyalarından başlayacağız ve düzenleyeceğiz, okuyacağız, ardından bunları adım adım tensör formatına dönüştüreceğiz. Bilgisayarla görmede önemli bir veri kümesi olan :numref:`sec_image_augmentation` içinde CIFAR-10 veri kümesi ile deney yaptık. Bu bölümde, CIFAR-10 imge sınıflandırmasının Kaggle yarışmasını uygulamak için önceki bölümlerde öğrendiğimiz bilgileri uygulayacağız. Yarışmanın web adresi https://www.kaggle.com/c/cifar-10 :numref:`fig_kaggle_cifar10` yarışmanın web sayfasındaki bilgileri gösterir. Sonuçları göndermek için bir Kaggle hesabına kayıt olmanız gerekir. .. _fig_kaggle_cifar10: .. figure:: ../img/kaggle-cifar10.png :width: 600px CIFAR-10 imge sınıflandırma yarışması web sayfası bilgileri. Yarışma veri kümesi "Data" ("Veri") sekmesine tıklanarak elde edilebilir. .. raw:: html

.. raw:: html

.. raw:: latex \diilbookstyleinputcell .. code:: python import collections import math import os import shutil import pandas as pd from d2l import mxnet as d2l from mxnet import gluon, init, npx from mxnet.gluon import nn npx.set_np() .. raw:: html

.. raw:: html

.. raw:: latex \diilbookstyleinputcell .. code:: python import collections import math import os import shutil import pandas as pd import torch import torchvision from torch import nn from d2l import torch as d2l .. raw:: html

.. raw:: html

Veri Kümesini Elde Etme ve Düzenleme ------------------------------------ Yarışma veri kümesi, sırasıyla 50000 ve 300000 imge içeren bir eğitim kümesi ve bir test kümesine ayrılmıştır. Test kümesinde, değerlendirme için 10000 imge kullanılacak, kalan 290000 imgeler değerlendirilmeyecek: Bunlar sadece test kümesinin *manuel* etiketli sonuçlarıyla hile yapmayı zorlaştırmak için dahil edilmiştir. Bu veri kümesindeki imgeler, yüksekliği ve genişliği 32 piksel olan png renkli (RGB kanalları) imge dosyalarıdır. İmgeler, uçaklar, arabalar, kuşlar, kediler, geyik, köpekler, kurbağalar, atlar, tekneler ve kamyonlar olmak üzere toplam 10 kategoriyi kapsar. :numref:`fig_kaggle_cifar10` şeklinin sol üst köşesi veri kümesindeki uçakların, arabaların ve kuşların bazı imgelerini gösterir. Veri Kümesini İndirme ~~~~~~~~~~~~~~~~~~~~~ Kaggle'a girdi yaptıktan sonra :numref:`fig_kaggle_cifar10` içinde gösterilen CIFAR-10 imge sınıflandırma yarışması web sayfasındaki “Veri” ("Data") sekmesine tıklayabilir ve “Tümünü İndir” ("Download All") butonuna tıklayarak veri kümesini indirebiliriz. İndirilen dosyayı ``../data``'da açtıktan ve içinde ``train.7z`` ve ``test.7z``'yı açtıktan sonra, tüm veri kümesini aşağıdaki yollarda bulacaksınız: - ``../data/cifar-10/train/[1-50000].png`` - ``../data/cifar-10/test/[1-300000].png`` - ``../data/cifar-10/trainLabels.csv`` - ``../data/cifar-10/sampleSubmission.csv`` ``train`` ve ``test`` dizinlerinin sırasıyla eğitim ve test imgelerini içerdiği, ``trainLabels.csv`` eğitim imgeleri için etiketler sağlar ve ``sample_submission.csv`` örnek bir gönderim dosyasıdır. Başlamayı kolaylaştırmak için ilk 1000 eğitim imgesi ve 5 rastgele test imgesi içeren veri kümesinin küçük ölçekli bir örneğini sağlıyoruz. Kaggle yarışmasının tam veri kümesini kullanmak için aşağıdaki ``demo`` değişkenini ``False`` olarak ayarlamanız gerekir. .. raw:: html