Selam. Konuyu uzatmadan başlayacağım oncelikle bize lazım olan şeyler.
Dipnot: Sitenin guvenilirliği hakkımda bilgim yoktur fakat yapacak olanların yeni hesap acıp oyle yapmalarını oneririm.

Colab linki: Google Colaboratory

Gerekenler:

5-10 dakika arasında temiz ses orneği (isterseniz daha fazla yapabilirsiniz). WAV olarak kaydetmeyi unutmayın (icinde O, J, I, c gibi harfleri bulunduran cumleleri kurmanız daha iyi olacaktır)

Bir şarkının vokalini bircok siteden veya program ile ayırabilirsiniz.

Adım 1
Attığım linkteki colabı acın ve ilk hucreyi başlatın indirmeler bittikten sonra public URL: "burada bir link olur" o linke tıklayarak giriş yapıyoruz.




Adım 2: GUI kısmına giriş
Linke tıkladıktan sonra karşımıza şoyle bir ekran geliyor ve kırmızı kutucukla işaretlediğim "train" kısmına geciyoruz.




Colab ekranına geri donup -evc- klasorunun icine "dataset" isminde bir klasor acıp icine ses kaydımızı atıyoruz kaydı attıktan sonra train kısmına donuyoruz.

Adım 3: Modeli trainlemek
Train kısmında ilk olarak "process the dataset" butonuna basıyoruz ve işlem bittiğinde onun altındaki kutucukta endpreprocess yazıcaktır ( işlem bittiğinde 3. satırda endpreprocess yazmalıdır eğer daha uzunsa hata gelmiştir)




Yeşil yer endpreprocess in yazacağı yerdir.
Endpreprocessden sonra 2. buton yani "pitch Extraction'a basıcağız onun altındaki boşlukta all-feature-done yazısını gorduğumuzde 2. işlemde bitmiş demektir.
Geldik trainlemenin son kısımlarına 3. buton "train model"butonuna basmadan once onun ustundeki epoch kısmını 200'e cekiyoruz (200 genelde en iyi sonucu verir fazla yaparsanız bozulabilir)
Train modele bastığınızda Colab'e geri donun ve epoch işlemlerinin başladığını goreceksiniz belirlediğiniz epoch'a gore uzun surer bittiğinde colabde şoyle bir yazı yazar.




Bu da tamamlandığına gore 4. buton yani "train ındex" butonuna basabiliriz bu cok kısa surecektir bittiğinde şunun gibi bir yazı cıkar.




İsteğe bağlı kısım: eğer siz modelinizi kaydetmek istiyorsanız 5. butona yani "download model" butonuna tıkladıktan sonra.




Buna benzer 2 dosya cıkar bu iki dosyayı sağdan "download" tuşuna basıp indiriyoruz ve yeniden kullanmak istiyorsak bu iki dosyayı ZIP haline getirip Google Drive'a yukluyoruz ve linki kopyalıyoruz.
Ardından GUI ekranından "download model" sekmesine geliyoruz.




En baştaki yere ZIP dosyasının Drive linki 2. kısma koymak istediğiniz isim sonra download tuşuna basıyoruz ve modellerimize gelmiş olacak.

Final
Colab'e donup -evc- klasorunun icindeki "audios" klasorunun icine istediğiniz şarkının vokalini atıyoruz ve GUI ekranına geri donuyoruz.
GUI'daki "ınference" sekmesine gelip "choose your model" yazısının sağındaki "Refresh" butonuna tıklıyoruz yenileme bittikten sonra "choose your modeli" yazısının biraz sağındaki centiğe tıklayıp oradan sizin ismini belirlediğiniz modelin "modelinismi. Pth" olan halini seciyorsunuz.




Ardından "choose your Audio" yazısının sağındaki Refresh butonuna tıklıyoruz ardından gorseldeki centiğe tıklayıp.




Audios klasorune attığımız şarkının vokalini seciyoruz.
Son olarak sağ ustten converte tıklamadan once bir bilgi vereyim eğer kadın senini erkeğe cevirecekseniz convertin solunda kalan 0'ı -12 yapın eğer erkek sesini kadına cevirecekseniz 12 yapın veya erkek sesini erkeğe kadın sesini kadın sesine cevirecekseniz 0 yapın.
Dediğim gibi sağ ustteki "convert" butonuna tıklıyoruz ve bekliyoruz.




İşlem bittiğinde Convert'in altında sesimizin oluştuğunu goreceğiz onu sağ uc noktaya tıklayıp indirebilirsiniz.




Evet bitti sorunlarınızı yazabilirsiniz cok kotu anlatmış olabilirim kusura bakmayın.

Başlıkta rcv olarak cıkmış ama RVC olacak


Dosya Ekleri ses.png 32,1 KB · Goruntuleme: 230


1689194352987.png 57 KB · Goruntuleme: 173


ses.png 32,1 KB · Goruntuleme: 325