PEMANFAATAN CLUSTERING DALAM PENCARIAN KEMIRIPAN DOKUMEN PAPER CONFERENCE

No Thumbnail Available
Date
2013-11-28
Journal Title
Journal ISSN
Volume Title
Publisher
Konferensi Nasional Informatika,Sekolah Teknik Elektro dan Informatika ITB
Abstract
Banyaknya penyimpanan informasi di Internet . . . . sangat membantu para penulis dalam menghasilkan karya tulis ilmiah. Penulisan karya ilmiah ini biasa dimanfaatkan kalangan akademik dalam kegiatan paper conference atau sebagai tugas kuliah bagi mahasiswa. Hal ini membuat pemeriksa kesulitan dalam memeriksa keunikan karya tulis yang dihasilkan. Pencarian kemiripan dokumen menjadi salah satu solusi yang dapat digunakan. Sehubungan dengan ha1 tersebut, proses clustering dalam text mining dapat dimanfaatkan untuk pencarian kemiripan dokumen agar lebih efektif. Pada penelitian ini, dibuktikan dua buah hipotesis dalam pencarian kemiripan dokumen dan menghasilkan solusi pemanfaatan pencarian kemiripan dokumen-dokumen berbahasa Indonesia. Selain itu, akan dibuktikan pula hasil K-Means clustering dengan pemilihan feature terhadap isi dokumen berdasarkan judul, abstrak, pendahuluan, penutup, dan daftar pustaka, dapat lebih baik dibandingkan dengan hasil clustering biasa. Prototipe aplikasi pun dibangun untuk membuktikan hipotesis tersebut Hasil pengujian pada penelitian ini menunjukkan bahwa pemilihan feature untuk clustering menghasilkan/akurasi yang paling tinggi, yaitu mencapai nilai 0.96. Selain itu, dibuktikan pula gap perhitungan waktu pencarian yang cukup besar antara pencarian terhadap dokumen ter-cluster dengan dokumen tanpa cluster.
Description
Keywords
kemiripan dokumen, K-Means clustering, text mining
Citation