Duplicate content, internet ortamında yer alan bir iceriğin birden farklı URL'de bulunmasından kaynaklanan bir sorundur. SEO performansını olumsuz etkileyen bu durum, karşımıza iki farklı şekilde cıkmaktadır.

1) External duplicate content: Herhangi bir iceriğin birkac farklı internet sitesinde yer alması, external duplicate content olarak adlandırılır. Yaptığınız aramalarda bu terim karşımıza site-dışı cift icerik, yinelenen icerik, kopya icerik olarak da cıkmaktadır.

2) Internal duplicate content: Siteniz icerisinde yer alan bir iceriğin tamamının ya da bir kısmının birden fazla sayfanızda bulunması internal duplicate content (site-ici cift icerik, yinelenen icerik, tekrar eden icerik) problemini doğurmaktadır.

Sitenizin iyi bir performans gostermesini ve arama sonuclarında iyi pozisyonlarda listelenmesini istiyorsanız iceriğinize onem vermelisiniz. Başkalarının uretmiş olduğu icerikleri sitenizde yayımlamak, sizi hicbir zaman iyi yerlere getirmeyecektir. Ozellikle e-ticaret sitelerinde sıkca karşılaştığımız, urun acıklamalarında ureticinin kendi internet sitesinde paylaşmış olduğu urun ozellerinin tamamının kopyala-yapıştır yapılarak yayımlanması, arama motoru sonuclarındaki performansınızı olumsuz etkileyecektir.

Kullanıcıya aradığı bilgiyi verin

Arama motorları botları, web'de yer alan her iceriği tarama ve veritabanına kaydetmek uzere programlanmıştır. Sahip olduğu algoritma sayesinde kullanıcılara yapılan sorguya en yakın sonucu sunabilmektedir. Bunu yaparken ziyaretcilere ilk 10 sırada aynı iceriği gostermek yerine, farklı secenekleri gostermeyi tercih eder. Bu yuzden rakiplerinizden farklı ve yapılan sorguya en uygun iceriğe sahip olmaya ozen gostermelisiniz.

Internal duplicate content bazen internet sitesi sahiplerinin kolaya kacmasından, bazen de yazılımsal hatalardan kaynaklanmaktadır. Kotu hazırlanan bir internet sitesi hic beklemediğiniz internal duplicate content problemlerini beraberinde getirebilir.

Etiket sayfalarındaki hatalar:
İnternet siteniz icerisinde yer alan yuzlerce blog yazısını veya urunu kullanıcılara ve arama motorlarına en iyi şekilde sunmanın yolu kategorilere ayırmaktır. Doğru kullanıldığında fayda gorebileceğiniz bu sistem, manipule edilmek istendiğinde ise hic beklemediğiniz sonuclara yol acabilir.

Etiket sistemi, iceriklerinizi kategorilendirmenizi kolaylaştıran bir secenek olarak karşımıza cıkmaktadır.

Hepimizin bildiği bir haber sitesinde yer alan etiketlere goz atalım: alanadi.com/iphone-6-satisa-sunuldu

Haberin altında yer alan etiketlerin, kullanıcılardan cok arama motorları icin oluşturulmuş olduğunu bir bakışta anlayabiliyoruz. Bu işlem aranma hacmi en yuksek anahtar kelimeler kullanarak, daha fazla organik trafik elde etmek amacıyla oluşturulmuştur. Uygulanan bu yanlış etiket sistemi, internet sitelerinin performansını olumsuz etkilemekte ve anahtar kelimelerde rakiplerine gore cok daha alt sıralarda yer almasına neden olmaktadır.

Ornekte yer alan haber sitesinde, yaratılan her etiket sayfasının (orn:alanadi.com/etiket/iphone-6-cikti-mi) yalnızca URL ve Title'ın farklı olması, etiket sayfası ile asıl sayfa arasında %95'in uzerinde benzerlik oranına yol acmaktadır. Onumuzdeki Panda guncellemesinde arama motorlarını manipule etmeye yonelik oluşturulan etiket sayfalarına sahip haber siteleri dahil olmak uzere tum sitelerin organik kanalda buyuk yara alacağını ve trafiklerinin buyuk olcude yok olacağına inanıyorum.

Tip: 150 sayfaya kadar ucretsiz analiz yapan Siteliner aracını kullanarak siteniz icerisindeki yinelenen icerik yoğunluğunu olcebilirsiniz. Sitenizin tamamı icin bu analizi yapmak istiyorsanız Siteliner Premium hesap satın almanız gerekiyor.

Kategori sayfalarındaki yinelenen iceriklerin onune nasıl gecilir?
Oncelikle, yukarıda ornekte olduğu gibi onlarca etiket sayfası oluşturmak yerine, doğru kategorizasyonu yapabilmek icin doğru kelime gruplarını belirlemeniz gerekiyor. iPhone 6'nın satışa cıktığını belirten haberde kullanılabilecek etiketler; iPhone (iphone haberleri), iPhone 6 (iPhone 6 habereri), Apple (Apple haberleri), teknoloji (teknoloji haberleri).

iPhone ile ilgili yayımlanan her haberde bu etiketleri kullanarak oluşturacağınız sayfalarda birden fazla haber goruntuleneceği icin ilgili aramalarda listelenmenizi kolaylaştıracaktır. Aksi halde yalnızca bu habere ozel oluşturulan etiket sayfasında yalnızca 1 haber listelenecek ve icerik yonunden oldukca zayıf (thin content) sayfalara sahip olmanız kacınılmaz olacaktır.

Ozel bir Title ve URL dışında kalan kısımların tamamının site icerisinde yinelenmesi (haber başlıkları ve kısa acıklamalar) organik kanalda başarı gostermeniz icin yeterli olmayabilir. En fazla trafik beklediğiniz bu sayfalarda kullanıcılara fayda sağlayacak, icerik yonunden zenginleştirecek icerik alanlarının oluşturulması gerekmektedir. Boylece sayfanızın ozgunluk oranını optimum seviyeye cekebilirsiniz.

WWW ve Non-WWW Sorunu:
Sitenize hem www'lu hem de www'suz versiyondan ulaşılabiliyor olması, duplicate sayfaların bulunduğu anlamına gelmektedir.

Tum iceriklerinizin iki farklı URL ’den erişilebiliyor olması duplicate page content, duplicate title ve duplicate description gibi problemleri de beraberinde getirmektedir. www ve non-www sorununun onune gecebilmek icin dilediğiniz formu Google Webmaster Tools uzerinden secebilir ve kullanabilirsiniz.

Cozum:
Ziyaretcilerinizin ve diğer arama motorlarının bu durumu net bir şekilde anlayabilmesi icin, tum URL'lerinizin tercih ettiğiniz forma 301 yonlendirmesi ile yonlendirilmesi gerekmektedir.

Orn: www.domain.com -> 301 redirection to domain.com

www.domain.com/iphone-6-satisa-sunuldu -> 301 redirection to domain.com/iphone-6-satisa-sunuldu

HTTP ve HTTPS Sorunu:
Google, 2015 Ağustos ayında yapmış olduğu bildiride, guvenliğin kendileri icin onceliklendirilmiş bir konu olduğunu ve HTTPS guvenli bağlantısının bir ranking faktoru olacağını belirtmişti. Şimdilik global aramaların yalnızca %1'ini etkileyen bu kararın verilmesinde 2 onemli başlığın yer aldığını belirtmek isteriz:

Sitenizin ve ziyaretcilerinizin gizliliğini korumak.

Sıralamalarda kaliteli iceriğin cok daha fazla etkisinin olduğunun altını cizen Google, guvenlik konusuna onumuzdeki donemlerde daha fazla onem vereceğini de belirtmektedir.

HTTP'den HTTPS protokolune gecişlerde dikkat edilmesi gereken bir diğer konu duplicate sayfaların oluşmaması icin yonlendirmelerin doğru bir şekilde yapılması gerektiğidir.

Cozum:
Yapılan yonlendirme HTTP versiyondan HTTPS versiyona 301 yonlendirmesi ile yapılmalıdır.

Not: Yapılan yanlış yonlendirmeler, organik trafiğinizi olumsuz etkileyebilir. Bu yuzden SEO performansınız yuksek ise guvenliği sağlamak adına yalnızca odeme ve kullanıcı bilgileri istenilen sayfalarda HTTPS protokolunu tercih edin.

Slash Sorunu:
URL'lerin sonunda slash olmalı mı, yoksa olmamalı mı konusu bircoğumuzun aklını karıştıran konulardan biri.

domain.com/en/ (dizin olduğunu belirtmektedir)

domain.com/ornek-yazi (dosya olduğunu belirtmektedir)

Google, Webmaster blog'unda yaptığı acıklamada slash'lı veya slash'sız formun sorun ya da dezavantaj yaratmadığını belirtmektedir ancak yine de cift icerik problemini onlemek icin iceriğe yalnızca bir URL'den ulaşılabiliyor olmak gerekmektedir. Wordpress gibi hazır icerik yonetimi sistemlerinde bu ozellik default olarak gelmektedir. İnternet sitenizin yazılımı sizin tarafından yazılmış ise, her iki URL'in status code'larını kontrol etmekte fayda var

Not: Kontrolleriniz sonucunda, aynı icerik her iki versiyonda da ulaşılıyor ise (200 kodunu veriyorsa) tum sayfalarda aynı problemin olması muhtemeldir.

Cozum:
- Belirlediğiniz versiyona, diğer versiyondan 301 yonlendirmesi yapılmalıdır.

Not: Bu case ’de canonical uygulamak doğru bir cozum yolu değildir. Link juice bu yontemle aktarılacak olsa da iki farklı URL ’e kullanıcılar tarafından ulaşılabiliyor olması karışıklığa sebep olacaktır.

Parametreler:
Sitenizin sosyal medya tanıtımları, mail kampanyaları, affilate programları ve site ici filtrelemede karşımıza cıkan parametreler, cift sayfa problemine yol acan bir diğer konudur. Aynı iceriğin farklı URL'lerde bulunması kopya icerik sorununu doğurmaktadır.

domain.com/iphone-6-satisa-sunuldu

domain.com/iphone-6-satisa-sunuldu?utm_source=twitter

domain.com/iphone-6-satisa-sunuldu?a_aid=123456

domain.com/iphone-6-satisa-sunuldu?fiyat=artan

Cozum:
Birbirine oldukca benzer sayfalarda cift sayfa problemini onlemek icin canonical etiketi kullanılır. Tum parametre sayfalarında asıl sayfaya uygulanacak canonical tag'i bu problemi cozecektir.

Ornek:

domain.com/iphone-6-satisa-sunuldu?utm_source=twitter sayfasının head bolumune eklenecek kodu bu problemin ustesinden gelmemizi sağlayacaktır.

Buyuk - Kucuk Harf Sorunu:
URL'lerde hem buyuk harf hem de kucuk harfli versiyonun bulunması, cift sayfa problemine yol acan bir başka durumdur. Arama motorları bu iki sayfayı ayrı olarak değerlendirdiğinde, ikisinde de aynı iceriğin bulunduğunu gorecektir.

Orn: domain.com/iPhone-6-Satisa-Sunuldu

domain.com/iphone-6-satisa-sunuldu

Cozum:
URL'lerinizin tamamında kucuk harf kullanmaya ozen gosterin. Hem buyuk harf hem de kucuk harfin bulunduğunu tespit ettiğinizde, sayfa değerinin tek bir sayfada toplanması icin 301 yonlendirmesi yaparak cift sayfa problemini ortadan kaldırabilirsiniz. Fakat test aşamasındaki internet sitenizde bu problemi tespit ettiyseniz, bu tur farklı sayfaların oluşmaması icin onlem almak yerinde olacaktır.

Arama Sayfaları:
Site icerisinde bulunan arama kutucuğu, kullanıcıların hızlı bir şekilde istediği urun ya da kategoriye ulaşmasını sağlar. Kullanıcı deneyimi bakımından oldukca onemli arama sayfaları (orn:domain.com/search/?query=cep-telefonu) ile diğer statik sayfalar (domain.com/kategori/cep-telefonu) arasında buyuk bir benzerlik olacağından ve arama sayfası icin ozelleştirilmiş bir icerik alanı olmadığından arama sayfaları botlara kapatılmalıdır.

Cozum:
Arama sayfalarına eklenecek meta noindex, nofollow etiketi botların bu sayfalara ulaşmasını engelleyecektir.

Sonuc:
İnternet sitenizde duplicate content problemine yol acan sayfaları tespit edebilmek icin Google ’ın ucretsiz Webmaster Tools aracını kullanabilirsiniz. Search Appearance bolumunde > HTML Improvements kısmından site icinde cift iceriğin kullanıldığı sayfaların bir kısmına ulaşabilirsiniz.

Yukarıda bahsettiğim problemlerin tamamını rapor halinde gorebilmek icin Moz ’un Crawl Test aracını ya da Deepcrawl ’un Website Crawler aracını kullanabilirsiniz.

Site dışı duplicate problemlerinin tespitinde ise Copyscape aracı tum web ’i tarayarak, iceriklerinizin hangi internet sitelerinde kullanıldığını tespit etmenize yardımcı olacaktır.

Merak ettiğiniz konuları yorum kısmından paylaşabilirsiniz


kaynak https://zeo.org/tr/blog/duplicate-co...cozum-yollari/