PENERAPAN METODE MEL FREQUENCY CEPSTRAL COEFFICIENT DAN LEARNING VECTOR QUANTIZATION UNTUK OPTIMASI KASUS PENGENALAN SUARA
Loading...
Date
2019
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Program Studi Teknik Informatika S1 Fakultas Teknik Universitas Widyatama
Abstract
Speaker verification adalah proses verifikasi seorang pembicara, dimana
sebelumnya telah diketahui identitas pembicara tersebut berdasarkan data yang
telah di inputkan. Untuk dapat melakukan speaker verification, data suara akan
melalui proses ekstraksi ciri suara untuk mendapatkan informasi yang terkandung
di dalam data suara. Pada penelitian sebelumnya, metode Mel Frequency Cepstral
Coefficients (MFCC) mempunyai tingkat keakuratan tertinggi dengan tingkat
pengenalan 85,3% dan waktu ekstraksi ciri tercepat dibandingkan dengan metode
ekstraksi ciri yang lainnya, sehingga metode MFCC adalah metode yang baik untuk
ekstraksi fitur dalam pengenalan suara. Sebagai klasifikator digunakan jaringan
syaraf tiruan Learning Vector Quantization (LVQ). LVQ adalah suatu metode
untuk melakukan pembelajaran atau pelatihan pada lapisan kompetitif yang
terawasi.
Sebelum data suara diproses, terlebih dahulu data suara diekstraksi menggunakan
metode MFCC. Hasil dari ekstraksi fitur menggunakan metode MFCC digunakan
untuk proses pencocokan, dimana proses pencocokan ini akan membandingkan
hasil ekstraksi fitur dari data uji dengan hasil ekstraksi fitur dari data latih yang
terdapat pada database. Data hasil ekstraksi ciri diklasifikasi menggunakan LVQ.
LVQ melakukan pembelajaran terhadap vektor dari hasil filter MFCC. Proses
pencocokan suara dapat dilakukan dengan pengukuran jarak terdekat menggunakan
euclidean distance untuk mengetahui seberapa besar kemiripan suara dari data uji
dengan data pattern yang ada di basis pengetahuan di database.
Untuk pengujian akurasi digunakan 150 data latih dan 50 data uji yang berasal dari
4 orang narasumber. Hasil pengujian akurasi menunjukkan bahwa penerapan
metode MFCC dan LVQ dapat diterapkan untuk pengenalan suara. Hasil pengujian
mendapatkan tingkat persentase rata-rata akurasi sebesar 88.89% dengan
menggunakan frame size sebesar 512 dan nilai parameter pada pembelajaran LVQ
menggunakan learning rate(α=0,05), penurunan learning rate(dec α=0,1) dan
maksimum epoch=1000.
Description
Keywords
speaker recognition, suara, MFCC, learning vector quantization, euclidean distance, pencocokan suara., speaker recognition, sound, MFCC, learning vector quantization, euclidean distance, sound matching.