Oturduğumuz bir kafede, katıldığımız etkinliklerde ya da en basitinden havalı video edit ’lerinde duyduğumuz şarkılar hoşumuza gittiğinde telefonumuzu acıp Shazam ’a giriyoruz ve Shazam da saniyeler icinde o şarkıyı bize verebiliyor.
Bunu ozellikle de kafe ve etkinlik gibi arka plan seslerinin yoğun olduğu ortamlarda yapabilmesi ise durup; “nasıl saniyeler icinde şarkıyı buluyor” diye duşunduruyor. Elbette şarkıyı bulduktan sonra, sıradaki şarkıyı Shazam ’lama ihtiyacı duyana kadar uygulamanın yuzune bakmadığımız icin arka planda donenlere pek de dikkat etmiyoruz. Fakat işin o kısmı daha etkileyici.
Oncelikle kısaca Shazam ’dan bahsedelim. 2022 ’de ayda 225 milyonu aşkın kullanıcıya ulaşmış olan uygulamamız oldukca basit bir mantığa sahip. Uygulamayı actığınızda yapmanız gereken tek şey buyuk logoya bir kere dokunmak. Bunun ardından Shazam, mikrofonunuzu kullanarak muziği dinliyor ve ne olduğunu adeta bir kara buyu gibi saniyeler icinde buluyor.
Tabii biz yine de Orta Cağ geleneklerinden uzaklaşıp Shazam ’a kara buyu dememeyi tercih edelim. İşte arkasındaki mantık: Shazam ’a muziği dinlettiğinizde uygulamada o muziğin ses dalgaları, bilgisayarın işleyebileceği verilere donuşmuş oluyor. Bu sayede her şarkı icin eşsiz bir dalga oluştuğundan, bir parmak izi oluşturulmuş oluyor. Bu işlem bir basitleştirme temelinde ilerliyor. Sesin yukseldiği, inceldiği veya kalınlaştığı yerleri tumuyle dahil etmek yerine bu olayların ses dalgalarındaki tepe noktaları dikkate alınıyor. Zaten işlemin saniyeler surmesini sağlayan da bu basitlik.
Temel mantığı anladıktan sonra pratik orneğe gecelim. Diyelim ki kafede otururken calan şarkı hoşunuza gitti ve şarkıyı Shazam ’ladınız. Logo ’ya bastığınız an Shazam, sesi kaydederek bir spektrogram oluşturuyor. Mikrofona gelen tum seslerin belirli bir zaman (Shazam icin maks. 20 saniye) aralığında kaydedildiği bu spektogram ’da daha sonradan, az once bahsettiğimiz tepe noktaları oluşturuluyor ve ustte gorduğunuz karmaşa basitleşmiş oluyor.
Son aşamada ise artık veriye donuşmuş olan bu tepe noktaları, birbiriyle eşleştirilerek Shazam ’ın devasa kutuphanesinde diğer veri ciftleriyle karşılaştırılıyor. Eğer yeterince cift eşleşirse de Shazam, şarkıyı bulduğunu soyleyerek şarkı ismini ve sanatcıyı verebiliyor. Elbette bu uzun uzun anlattığımız surec, bilgisayar tarafından geliştirildiğinden saniyeler icinde bitebiliyor.
Bu acıdan baktığımızda Shazam algoritması, bizim nefes alıp vermemiz kadar basit ve aynı şekilde detaylı.
Kaynaklar: Toptal, Wall Street Journal Webtekno'yu Threads'de takip et, haberleri kacırma