14. Doğal Dil İşleme: Ön Eğitim¶
İnsanların iletişim kurması gerekir. İnsan durumunun bu temel ihtiyacı dışında, günlük olarak çok miktarda yazılı metin oluşturulmuştur. Sosyal medyadaki, sohbet uygulamalarındaki, e-postalardaki, ürün incelemelerindeki, haber makalelerindeki, araştırma kağıtlarındaki ve kitaplardaki zengin metinler göz önüne alındığında, yardım sunmak veya insan dillerine dayalı kararlar vermek için bilgisayarların onları anlamasını sağlamak hayati hale gelir.
Doğal dil işleme doğal dilleri kullanarak bilgisayarlar ve insanlar arasındaki etkileşimleri inceler. Uygulamada, Section 8.3 içindeki dil modelleri ve Section 9.5 içindeki makine çevirisi modelleri gibi metin (insan doğal dili) verilerini işlemek ve analiz etmek için doğal dil işleme tekniklerinin kullanılması çok yaygındır.
Metni anlamak için, temsillerini öğrenerek başlayabiliriz. Büyük metin kaynaklarındaki mevcut metin dizileri yararlanarak, öz gözetimli öğrenme, metnin bazı gizli kısımlarını çevreleyen metnin başka bir kısmını kullanarak tahmin etmek gibi, metin temsillerini önceden eğitmek için yaygın olarak kullanılmıştır. Bu şekilde modeller, pahalı etiketleme çabaları olmadan kitle metin verilerinden gözetim yoluyla öğrenirler!
Bu bölümde göreceğimiz gibi, her kelimeyi veya alt kelimeyi bireysel bir belirteç olarak ele alırken, her belirtecin temsili, word2vec, GloVe veya alt kelime gömme modellerini büyük metin kaynakları üzerinde kullanılarak önceden eğitilebilir. Ön eğitim sonrasında, her belirteçin temsili bir vektör olabilir, ancak bağlam ne olursa olsun aynı kalır. Örneğin, “banka” vektör temsili “biraz para yatırmak için bankaya git” ve “oturmak için banka git” de aynıdır. Böylece, daha birçok yeni ön eğitim modeli, aynı belirteçin temsilini farklı bağlamlara uyarlar. Bunların arasında, dönüştürücü (transformer) kodlayıcısına dayanan çok daha derin bir öz gözetimli model olan BERT vardır. Bu bölümde, Fig. 14.1 figüründe vurgulandığı gibi, metin için bu tür temsillerin nasıl ön eğitileceğine odaklanacağız.
Fig. 14.1 Önceden eğitilmiş metin temsilleri, farklı akışaşağı doğal dil işleme uygulamaları için çeşitli derin öğrenme mimarilerine beslenebilir. Bu bölüm, akışyukarı metin temsili ön eğitimine odaklanmaktadır.¶
Büyük resmin görünmesi için, Fig. 14.1 önceden eğitilmiş metin temsillerinin farklı akışaşağı doğal dil işleme uygulamaları için çeşitli derin öğrenme mimarilerine beslenebileceğini göstermektedir. Onları Section 15 içinde ele alacağız.
- 14.1. Sözcük Gömme (word2vec)
- 14.2. Yaklaşık Eğitim
- 14.3. Sözcük Gömme Ön Eğitimi İçin Veri Kümesi
- 14.4. word2vec Ön Eğitimi
- 14.5. Küresel Vektörler ile Sözcük Gömme (GloVe)
- 14.6. Alt Sözcük Gömme
- 14.7. Sözcük Benzerliği ve Benzeşim
- 14.8. Dönüştürücülerden Çift Yönlü Kodlayıcı Temsiller (BERT)
- 14.9. BERT Ön Eğitimi için Veri Kümesi
- 14.10. BERT Ön Eğitimi