Aşağıdaki makale size yardımcı olacaktır:Google, Sesteki Anlamsal Varlıkları Tanımlamaya Yardımcı Oluyor
Otomatik Yardımcı Her Zaman Semantik Varlıkları Dinler
Google’ın aramadaki, patentlerdeki veya belgelerdeki ve hatta tweet’lerdeki varlıklar hakkında yayın yapmasına dikkat ediyorum.
Yeni bir patent başvurusu, android telefonu olan birçok kişinin aşina olabileceği, ancak Google’dan bu konuda resmi bir şey görmemiş olabileceği bir şeyi kapsıyor.
Bazen başkalarıyla SEO hakkında konuştuğum podcast’lerde ve video konferanslardayım ve bu konuşmalar genellikle Google’dan bahseder. Bazen bu sözler, soruları yanıtlamak ve yanıtlamak için bir telefonu tetikler.
Ayrıca son zamanlarda Android 10 işletim sistemini kullanan yeni bir android telefon aldım ve bu, TV’de veya radyoda veya bilgisayarımda arka planda çalan şarkıları tanımlıyor ve şarkının kimden olduğunu ve adını belirleyecek. şarkı.
Bu şarkı kimliğini görmek ilginç ve faydalı. Ama aynı zamanda “Bu telefon her zaman her şeyi mi dinliyor?” gibi soruları da gündeme getiriyor. (Spoiler: “Her Zaman Açıktır.”)
Seste Anlamsal Varlıkları Tanımlama
Biriyle telefon görüşmesi yaptığınızı veya bir TV Yayınını veya bir radyo istasyonunu veya bir podcast’i dinlediğinizi ve bir kişiden veya bir yerden veya bir kitaptan veya bir filmden bahsettiğinizi hayal edin. Ve telefonunuz bu sözü duyar ve not eder, böylece bahsedilen kişi veya yer veya şey hakkında daha fazla bilgiye erişebilirsiniz.
Bu yeni patent başvurusunun amacı, duyabileceğiniz seste bahsedilen Anlamsal Varlıkları belirlemek ve size bu varlıklar hakkında ek bilgi sağlamak.
Patent başvurusu bize şunları söyleyerek başlar:
Daha ayrıntılı olarak, bir kullanıcı tarafından duyulan ses sinyallerindeki anlamsal varlıkları tanımlamak, bu anlamsal varlıkları kullanıcıya göstermek ve kullanıcıya bu anlamlar hakkında ek bilgi sağlamak için makine öğrenimini kullanan bir yaklaşım kullanacağını söylüyor. varlıklar. Bu varlıklar, ses sinyallerinde konuşan insanlardan daha fazlasıdır.
Google, telefonlarımızda farklı kaynaklardan birçok farklı türde ses dinlediğimizi biliyor (en azından ben dinliyorum).
Ve insanlar da birbirleriyle iletişim kurmak için telefonları kullanıyor.
Tercüme hizmeti sağlamak için telefonlarını bile kullanabilirler.
Bu patent, çözmesi amaçlanan sorunu bize şunları söyleyerek tanımlar:
Bu nedenle Google, duyduklarımız hakkında daha fazla bilgi sağlayarak bize yardımcı olabilmesi için konuşmalarımızı ve dinlediklerimizi dinlemeyi amaçlamaktadır.
Ve bu, duyabileceği ses sinyallerindeki anlamsal varlıkları tanımlayabilmekle başlıyor gibi görünüyor. Başka bir deyişle, bu ses sinyallerinde belirtilen varlıklar.
Bu patent başvurusu şu adreste bulunabilir:
Ses Sinyallerindeki Semantik Varlıkların Tespiti ve Bilgi Sağlanmasına Yönelik Sistemler ve Yöntemler
Yayın Numarası WO2020027771
Mucitler: Tim WantlandVe Brandon Barbello
Yayın Tarihi 6 Şubat 2020
Başvuranlar: Google LLC
Soyut
Seste Semantik Varlıklar Hakkında İşitme
Patentte açıklanan süreç, “bir kullanıcının çeşitli ses sinyallerinden duyduğu anlamsal varlıkları tanımlamasını” sağlamak için “her zaman açık çalışma modunda” olduğunu söyleyerek başlar, örneğin:
- Bilgi işlem cihazında oynatılan medya dosyaları
- Yüz yüze konuşmalar veya kullanıcının kendi ortamında kulak misafiri olduğu diğer sesler
- telefon görüşmeleri
- Vesaire.
Bu konuşmalar, kimin dinlendiğinden daha fazla olabilir, ancak bahsedilen anlamsal varlıklar hakkında da olabilir. Patentin bize söylediği gibi, bu yaklaşım seste bahsedilen anlamsal varlıklar hakkında (insanlar, yerler ve nesnelerle ilgili) tamamlayıcı bilgiler sağlayabilir:
- Akıllı telefonunda bir podcast dinleyen bir kişi, podcast’te tartışılan belirli bir yazar hakkında daha fazla bilgi edinmek isteyebilir.
- Yabancı dil konuşan bir tur rehberiyle sohbet eden bir kişi, tur rehberi tarafından tartışılan belirli bir turistik cazibe merkezi hakkında daha fazla bilgi edinmekle ilgilenebilir.
- Bir arkadaşıyla telefonda görüşen bir kişi, arkadaşının önerdiği bir restoranın menüsünde neler olduğunu merak edebilir.
Semantik Varlıklar Hakkında Ek Bilgi Verme
Bir cihaz, kullanıcı tarafından duyulan bir ses sinyalindeki semantik varlıkları (örneğin, insanlar, yerler, konumlar, vb.) tanımlamanın yanı sıra, bir bilgi işlem cihazında görüntülenen bir kullanıcı arabirimi ile bu anlamsal varlıkları kullanıcıya gösterebilir.
Bu kullanıcı, seçilen semantik varlık hakkındaki ek bilgilere erişmek için kullanıcı arayüzünü kullanarak söz konusu anlamsal varlığı da seçebilir.
Bu Ses sürecinde Makine Öğrenimi
Patent bize, bir veya daha fazla semantik varlığı belirlemek için bir ses sinyalini analiz etmek üzere bilgi işlem cihazında saklanan makine tarafından öğrenilmiş bir modeli kullanabileceğini söylüyor.
Bir örnek, konuşmayı içeren ses sinyallerindeki çeşitli insanları, yerleri, şeyleri, tarihleri/zamanları, olayları veya diğer semantik varlıkları tanımak üzere eğitilmiş, makine tarafından öğrenilen bir konuşma tanıma modelinin kullanılmasıdır.
Bu patent, bu işlemin “arka planda” yapılabileceğini söylediğinde, bir bilgi işlem aygıtındaki bir ses sinyalinin analizinin, bilgisayar aygıtında gerçekleştirilen başka bir görevle aynı anda veya bilgi işlem aygıtı çalışırken yapılabileceğini kasteder. atıl durumdadır.
Akıllı telefonunda film izleyen bir kişi, filmi izlerken filmden gelen sesi analiz ettirebilir.
Bu film sırasında belirli kişiler veya yerler veya şeyler gibi anlamsal varlıklardan bahsedilirse, cihaz bu anlamsal varlıkları cihazın ekranında “anlamsal varlıkların göstergesi olan metin, simgeler, resimler vb.” kullanarak görüntüleyebilir.
Kullanıcı daha sonra bu varlıklardan birini seçebilir ve bilgi işlem cihazı, seçilen bir semantik varlık hakkında ek ek bilgi sağlayabilir.
Ek bilgi seçenekleri şunları içerebilir:
- Veritabanı girişleri (örneğin, webref girişleri, Wikipedia girişleri, vb.)
- Arama motoru sonuçları (örneğin, Google arama sonuçları vb.)
- Uygulama etkileşim seçenekleri (örn. restoran inceleme uygulamaları, rezervasyon uygulamaları, etkinlik bileti satın alma uygulamaları vb.)
Ses Sinyalleri Birçok Uygulamada Duyulabilir
Ses sinyalleri aşağıdakiler gibi uygulamalar aracılığıyla çalınabilir:
- internet tarayıcısı
- Müzik çalar
- film oynatıcı
- Telefon görüşmesi
- Konuşmadan metne dikte
Şarkıları Tanımlama ve Onlar Hakkında Daha Fazla Bilgi Verme
Bu patentin arkasındaki süreç, şarkıları tanımak için eğitilmiş bir şarkı tanıma semantik varlık tanımlayıcı modeli içerir (“Now Playing” bildirimi için aşağıdaki resme bakın.)
Beatles’ın “Yardım” Şarkısı ile ilgili ekranın alt kısmındaki bildirime ve otomatik asistanın tanımlanan semantik varlık hakkında daha fazla bilgiye sahip olup olmadığını görmenizi sağlayan arayüze ek olarak, Google’ın şu anda çalınan bir geçmişi de vardır:
Var Şimdi oynuyor Google’ın duyurduğu ve bu patentte açıklananlarla ilgili görünen Android’deki uygulama. Bu “çalınan şarkılar” makine öğrenimi modeli, diğer sesteki Semantik varlıkları tanımlayan başka bir makine öğrenimi modeline ve Semantik varlıklardan bahsetmek için çeviriler sırasında dinleyen başka bir modele ek olarak sunulur. Semantic Entities Identification’ın diğer bölümleri henüz açıklanmadı.
Bu Semantik Varlıkları Dinleme Sürecinin Ek Özellikleri
Akıllı telefon gibi bu işlemi kullanan bir Cihaz “her zaman açık” modunda olacaktır.
Bir cihazın kullanıcısı, tanımlanan varlıklarla dinleme iznini iptal edebilir veya değiştirebilir.
Kişisel olarak, tanımlanabilir bilgiler bu süreç kapsamında korunabilir.
Bu sistem, bir yabancı dildeki çeşitli semantik varlıkları tanımak ve/veya çevirmek için eğitilecektir.
Bu işlem, bir telefonun bir telefon görüşmesinde meşgul olduğu zamanlarda gerçekleşebilir.
Varlıklar, bir cihaz kilitli veya bekleme modundayken görüntülenecek şekilde ayarlanabilir.
Ses sırasında tanımlanan bir Semantik Varlık bir panoya eklenebilir ve kullanıcının incelemesi için görüntülenebilir.
Bir Semantik Varlık, “canlı döşemede” bir simge olarak görüntülenebilir ve bu varlıkların hareketli bir listesi görüntülenebilir.
Akıllı telefon gibi bir bilgi işlem aygıtı gibi ilişkili bir çevresel aygıt, akıllı hoparlör gibi bir ses aygıtı için anlamsal varlık bilgilerini görüntüleyebilir.
Semantik varlıklar, akıllı hoparlör gibi bir ses cihazında duyurulabilir.
Belirlenen Semantik Varlıklar günlüğe kaydedilebilir ve bunlara daha sonra erişilebilir.
Bir podcast’te bahsedilen bir Kitap, yazarın web sitesine bir bağlantı ve kitabı satın alma seçeneği, yakındaki bir kütüphaneye yol tarifi gibi ek bilgiler içerebilir.
Bir podcast’te bahsedilen bir Film, filmin fragmanına bir bağlantı, bir sinema bileti satın alma seçeneği, yakındaki bir sinemadaki seansları görme yeteneği, o sinemaya giden yol tariflerini içerebilir.
Çalışan diğer uygulamaların arka planındaki sesin analizi, anlamsal varlıkların bir cihazdaki diğer görevleri kesintiye uğratmadan tanımlanabileceği ve sunulabileceği anlamına gelir.
paketler
Bu patentte açıklanan şarkı tanımlama makine öğrenimi modeli halihazırda çalışıyor ve duyabileceğiniz şarkılar hakkında ek bilgiler bulmanın bir yolunu sunuyor. Ses ve çeviri sırasında semantik varlıkları dinleyen makine öğrenimi modelleri henüz uygulanmış gibi görünmüyor. Bu hala bir patent başvurusudur ve bu patentin tüm yönlerinin uygulanması biraz zaman alabilir.
Sesli olarak bahsedilen kişi veya yerlerin veya şeylerin şu anda şarkılarda olduğu gibi anılmasının ve konuşmalarda, telefon görüşmelerinde, radyoda bahsedilip bahsedilmemesine bakılmaksızın bu anlamsal varlıklar hakkında daha fazla bilgi görme şansı bulmanın yararlı olduğunu görüyorum. veya TV istasyonlarında veya telefondaki uygulamalarda.
Bill Slawski hakkında
26 yılı aşkın SEO deneyimi ve Hukuk Doktoru Derecesi ile Bill Slawski, Google’ın SEO ile ilgili patentleri konusunda en önde gelen uzmandır. Patent Keşfi, SEO hakkında yeni bilgiler bulmanın en hızlı ve en ayrıntılı yollarından biridir. Bill, önde gelen bir arama motoru optimizasyonu blogu olan SEO by the Sea’nin Editörüdür ve burada 1.300’den fazla gönderinin yazarıdır. Bill’in deneyimi, Fortune 500 markalarını ve dünyanın en büyük web sitelerinden bazılarını içerir. Bill, Moz, Search Engine Land ve Search Engine Journal için katkıda bulunan bir yazardır. 2014-2021’de arama motoru algoritmaları, evrensel ve harmanlanmış arama, aramada kişiselleştirme, arama ve sosyal ve yinelenen içerik sorunları, yapılandırılmış veri ve şema gibi konularda sektör lideri uluslararası konferanslarda konuşma yaptı.