12 Ocak 2024 |

SEO için Doğal Dil İşleme

Doğal dil işleme için bir çok kullanım alanı duymuşsunuzdur. Bir çoğunun başarılı gerçeklemelerine de şahit olmuş olabilirsiniz. Artiwise da bir çok farklı ve yaygın alanda doğal dil işlemeyi kullanarak büyük ölçekli kurumlar için faydalı modeller ortaua koydu. Ancak bugün değineceğimiz konuda daha önce çok fazla örneğini görmemiş olmanız hatta uyarlama fikirleri ile karşılaşmamış olmanız normal. Zaten amaç da farklı alanlarda yapay zekanın kullanımını ortaya koymak ve bunu dünya ile paylaşmak değil mi aslolan.

Bugün anlatacak olduğumuz kullanım hikayesi, WEB üzerinde içerik sağlayıcı ya da yayıncı olan kişi ve kurumların yakından ilgisini çekecek olan arama motoru optimizasyonu olacak. Günümüzde medya sektörü tamamiyle dijitale göçüşün çalışmalarını tamamlamak üzereyken, yeni geçilen bu mecranın farklı dinamiklerine adaptasyon da olmazsa olmaz bir ihtiyaç olarak ortaya çıkmaktadır. Peki, yayıncılar açısından en önemli farklılık nedir diye sorarsak. Tabiki de cevap ölçümlenme olacaktır. Çünkü basılı yayıncıların ölçüm sistemi satış sayıları ile ölçümlenebilirken, dijitalde bu ölçümlerin yerini ziyaret sayıları almaktadır. Bu bahsedilen sayıları arttırabilmenin en önemli yolu da arama motorlarında görünür olmaktan geçiyor. Bu sebeple arama motorları tarafından taranabilir olmak, benzer içerik sağlayıcıların önünde yer alabilmek soluksuz ve sürekli bir yarışı yanında getirmektedir. Durum böyleyken arama motolarının hangi içeriği niçin önde gösterdiği ile ilgili çeşitli rivayetler ortada gezse de, aslolan içeriğin kalitesi ve organizsayonu olarak ortaya çıkmaktadır. Bu gibi kriterleri kandırmak (hack) geçici çözümler olsa da uzun vadede ana kriter hep içerik kalitesi olmaktadır. İçeriğin iyi organize edilmesi ve kaliteli oluşturulması da içerik haırlayıcıların sorumluluğundadır. Tüm bu bilgileri bir araya getirdiğimizde problemin de çözümün de bu kadar net olduğu bir konuyu niçin konuşuyoruz gibi bir konu aklınıza gelebilir. Burada eksik bir parametreden bahsetmemiz gerekir, medya kuruluşları içerikleri kaliteli çıkmanın yanında hızlı çıkmak gibi bir hedefe de sahitirler. Bu da çok büyük bir operasynel yük ihtiva etmektedir.

İşte bu noktada, yapay zeka çözümleri insanların yeni bir problemini çözmek için konumandırılabilir. Nasıl mı? İçerik oluşturucu ya da yayıncıları içeriği hazırlarken, metnin içindeki önemli kısımları etiketleyebilir ve bunlarla ilgili indeks sayfaları oluşturabilirlerse, hem bilgilerini çok iyi organize etmiş hem de sitelerinde insanların daha fazla vakit geçirmelerini sağlayabilirler. Dolaylı olarak, bilgi mimarileri doğal dildeki verileri barındırdığı için insanlara çok daha uygun içerikleri önerebilir hale gelirler, böylece çok daha iyi kişiselleştirilmiş bir okuma deneyimi yaşatma imkanına sahip olacaktırlar. Gördüğünüz gibi, uçtan uca tüm başarı kriterlerine dokunan bir tasarımdan bahsediyoruz.

Fikir olarak çözümden bahsettikten sonra şimdi gelelim bu çözümün pratik uyarlamasına. Temel olarak neler kullanılmalı

  • Morfolojik çözümleyici
  • Morfolojik belirsizlik giderici
  • İsimlendirilmiş varlık tespiti

Bu araçları ne için ve nasıl kullanacağız:

Tekil bir veride içerikten onu en çok temsil edecek etiketleri üretebilmek için, kelimelerin anlamsal en küçük hallerinin (kök veya gövde) seçilmesi ve bu halleri ile saydırılması ayrı bir önem arzetmektedir. Bu sebeple Türkçe gibi morfolojik zenginliği yüksek bir dilde içeriklerde doğru bilgi çaıkrımını yapabilmek için morfolojik çözümleyici ve morfolojik belirsizlik giderici kullanılarak analiz edilmesi ve dönüştürülmesi gerekmektedir. Böylece metnin içindeki kelime ve kelime gruplarının nicelik olarak ne oranda ağırlıkta olduğu da tam manaıyla ortaya çıkabilecektir.

Bununla beraber, hepimiz biliyoruz ki metinlerin içinde en çok bilgi taşıyan bölümler, isimlendirilmiş varlık adını verdiğimiz özel isimlerdir. Bunların tipleri ile birlikte tespitinin yapılabilmesi için de doğal dil işleme araçlarından isimlendirilmiş varlık tespit ediciye ihtiyaç vardır. Böylece metnin içinde bağlama bakılarak kişi, kurum, organizasyon, etkinlik, yer (lokasyon) gibi varlıklar otomatik çıkarılabilecek ve etiketlerde kullanılabilecektir.

İsimlendirilmiş Varlık Tespiti

Bu iki çözümün beraber kullanılması ile birlikte oluşturulmuş olan veri içerisinde geçen kelime ve öbekler ile otomatik etiketelenebilmiş olacak, ortak etiketler için site yönetimi ortak enkes sayfaları oluşturabilecektir. İçerdiği etiketlere bakılarak içerik-içerik benzerliği hesaplanarak, okuyucuya en iyi bir sonraki makale önerilebilecek ve okuyucunun daha fazla sayfayı ziyaret etmesi sağlanacaktır.

Görüldüğü gibi doğal dil işleme yöntemlerinin farklı kurguları ile farklı senaryolarda iyileştirme verimlilik sağlanması mümkün olmaktadır. Bu ve buna benzer daha nice kullanım senaryolarını görmek, ya da size özel senaryolarda doğal dil işleme ve makine öğrenmesi teknolojilerinin kurgulanabilmesi için Artiwise Analytics aracını deneyimleyin. Daha fazla bilgi almak Artiwise ekibinden bilgi almayı ihmal etmeyin.

İlginizi Çekebilecek Diğer Postlar

29 Mayıs 2024 |

Her gün yaklaşık 2,5 kentilyon bayt değerinde veri üretiliyor. Şirketlerin büyük bir çoğunluğu, ellerindeki bu toplu ve yapılandırılmamış verileri etkili...

20 Mayıs 2024 |

Günümüzün dijital çağında, şirketler için en değerli varlık haline gelen şey nedir diye sorsak, muhtemelen veri cevabını alırız. Veri, şirketlerin...

7 Mayıs 2024 |

Doğal Dil İşleme (NLP) Teknolojisine Detaylı Bir Bakış NLP (Natural Language Processing), Türkçe ismiyle Doğal Dil İşleme (DDİ), günümüzde bir...