Aşağıdaki makale size yardımcı olacaktır:Sinir Ağlarını Kullanarak Word Sense Belirsizliği Giderme
Word Sense Belirsizliği Giderme, Google’ın Sayfadaki Bir Kelimenin Anlamını Anlamasına Yardımcı Olur
2016 yılında bir yazı yazmıştım. Google, Aramayı İyileştirmek İçin Bağlam Vektörlerini Patentliyor. Hakkında yazdığım patent bize, bir kelimenin birden fazla anlamı olduğunda, Google’ın o sayfadaki kelimenin anlamını daha iyi anlamaya çalışmak için sayfadaki diğer terimlere bakabileceğini söylüyor. Context Vectors patenti, bir kelimenin taşıyabileceği farklı anlamlara ilişkin aşağıdaki örneği sağlamıştır:
Context Vector patentinden aldığım çıkarım, birden fazla anlamı olan bir kelimenin anlamı hakkında bir bilgi bankası makalesi bulmak ve bu bilgi bankası makalesinden o kelimeyi bağlama oturtabilecek kelimeler bulmaktı.
Örneğin bir atla, hayvanla ilgili bir sayfada “toynaklar” ve “saman” ve “otlak” gibi kelimeler olsa daha iyi anlaşılırdı. Bunlar eşanlamlı değildir ve anlamsal olarak ilişkili kelimeler değildir. Bunlar, “at” kelimesinin olduğu bir sayfada birlikte bulunma eğiliminde olan ve o sayfaya bağlam sağlayan, bunun bir hayvanla ilgili olduğunu belirten kelimelerdir. atış.
Farklı kelimeler için pek çok anlam bulabileceğiniz yerlerden biri de Princeton sitesidir. kelime ağı.
Geçen yılın Kasım ayının sonunda Google’a, yaklaşık dört yıl önce yazdığım Bağlam Vektörleri Patentini hatırlatan bir patent verildi. Bu daha yeni patent, kelime anlamında anlam ayrımı ile ilgilidir.
Bize, Google’ın kelime anlamı belirsizliğini gidermek için sinir ağlarını kullanıyor olabileceğini söylüyor. Bu 2016 patenti, bir kelimenin gelebileceği bilgi alanını tanımlamak için alan listesi terimlerinden bahsetti ve kelime anlamı belirsizliğini gidermek için kullanabilir.
Bu patent bize, aşağıdakiler için kullanılabilecek bir sistemi tanımladığını söyler:
Bağlam vektörleri patentlerinde olduğu gibi terimlere “etki alanı listesi terimleri” olarak atıfta bulunmak yerine, bir arama motorunun sözcük anlamlarını anlamasına yardımcı olmak için kullanılabilecek bağlam sözcüklerini ifade eder:
Patent bize, içinde açıklanan kelime anlamı anlam ayrımı sürecini kullanmanın avantajlarının neler olduğunu anlatıyor:
Bu nedenle, bir sayfa size bunun “Balık avlamak” hakkında olduğunu söylediğinde, bu bir müzik aletinden ziyade “balık tutmak” bağlam sözcüğüne dayanan bir balık türü hakkındadır.
Bu patent şu adreste bulunabilir:
Sinir ağlarını kullanarak kelime duyularını belirleme
Mucitler: Dayu Yuan, Ryan P. Doherty, Colin Hearne Evans, Julian David Christian Richardson ve Eric E. Altendorf
Vekil: Google LLC
ABD Patenti: 10.460.229
Verildi: 29 Ekim 2019
Dosyalandı: 20 Mart 2017
Soyut
Patentin mucitlerinden biri olan Colin Evans, Google’da Kıdemli Yazılım Mühendisi olarak yaptığı çalışmaları anlatıyor:
Patentle ilgili diğer mucitlerin profillerinden çok fazla bilgiye sahip değiliz. Ancak, bu patentin mucitlerinin yazarlar kısmında listelendiği, bu patentle ilgili gibi görünen bir Google tanıtım yazısı var:
Nöral Modellerle Yarı Denetimli Word Sense Anlam Ayırımı
Makalenin Özeti, ne hakkında olduğuna dair ayrıntılar sağlar:
Makaleden alınan aşağıdaki tablo, “hisse senedi” kelimesinin farklı anlamlarını gösteren bağlam terimlerinin nasıl tanımlanabileceğini göstermektedir.
Patent aynı konsepti şu şekilde açıklıyor:
Bir kelimenin anlamı belirlendikten sonra, bu süreçle daha iyi anlaşılan bir kelime, bir arama motoru tarafından başka şekillerde kullanılabilir. Patent bize bazı örneklerin aşağıdakileri gerçekleştirmeyi içerebileceğini söylüyor:
- duygu analizi
- Soru cevaplama
- Özetleme
- Başka bir doğal dil işleme görevi
Word Sense Sayısal Gösterimler
Makalenin bize söylediği gibi, bu süreç bir sözcük anlam belirsizliği giderme meselesidir. Patent, kelimeyi ve bir bağlam kelimesini içeren metinsel bir pasajda anlam kelimesini anlamak için kelime anlamı sayısal temsil sürecinin nasıl kullanıldığını bize anlatarak bunu bizim için bağlama oturtur:
Patent, Google Brain ekibinden, bu patentin arkasındaki süreçte yer alan kelime vektörleri hakkında bir makaleye işaret ediyor:
Bu kelime temsil süreci kelimeler bağlamında kullanılır:
Sayısal Temsilleri Kullanarak Word Sense Oluşturma
Patent, “belirli bir kelimenin belirli bir kelime anlamı için bir kelime anlamı sayısal gösterimi oluşturmak için” süreç hakkında daha fazla ayrıntı sağlar.
Bir kelime anlamı anlam ayrımı sistemi bu işlemi gerçekleştirir.
Her biri belirli bir kelimeyi ve bir veya daha fazla ilgili bağlam kelimesini içeren çok sayıda örnek metin dizisinin elde edilmesiyle başlar.
Patent, bu bağlam sözcükleri tarafından anlaşılan sözcük anlamlarının, bu test dizilerinde kullanılan sözcük anlamının tanımlanmasına nasıl yardımcı olabileceğini ayrıntılarıyla açıklar.
Bu Word Senses Yaklaşımından Alınabilecekler
Doğal olarak yazmak, Google’ın birden fazla kelime anlamı olabilecek bir kelimenin seçilmesiyle kullanılan kelime anlamını anlayabilmesi için optimize etmenin en iyi yolu gibi görünüyor. Levrek avlamak hakkında yazıyorsanız, yazdıklarınızdaki sözcük seçimleriniz, bas telli bir müzik aletiyle bir şarkı icra etmek hakkında yazabileceğinizden çok farklı olacaktır.
Birden fazla anlamı olabilecek bir kelime hakkında yazarken, o kelimenin anlamını tanımlamaya yardımcı olan bağlam terimlerini kullandığınızdan emin olun.
Bill Slawski hakkında
26 yılı aşkın SEO deneyimi ve Hukuk Doktoru Derecesi ile Bill Slawski, Google’ın SEO ile ilgili patentleri konusunda en önde gelen uzmandır. Patent Keşfi, SEO hakkında yeni bilgiler bulmanın en hızlı ve en ayrıntılı yollarından biridir. Bill, önde gelen bir arama motoru optimizasyonu blogu olan SEO by the Sea’nin Editörüdür ve burada 1.300’den fazla gönderinin yazarıdır. Bill’in deneyimi, Fortune 500 markalarını ve dünyanın en büyük web sitelerinden bazılarını içerir. Bill, Moz, Search Engine Land ve Search Engine Journal için katkıda bulunan bir yazardır. 2014-2021’de arama motoru algoritmaları, evrensel ve harmanlanmış arama, aramada kişiselleştirme, arama ve sosyal ve yinelenen içerik sorunları, yapılandırılmış veri ve şema gibi konularda sektör lideri uluslararası konferanslarda konuşma yaptı.