PEMANFAATAN CLUSTERING DALAM PENCARIAN KEMIRIPAN DOKUMEN PAPER CONFERENCE
No Thumbnail Available
Date
2013-11-28
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Konferensi Nasional Informatika,Sekolah Teknik Elektro dan Informatika ITB
Abstract
Banyaknya penyimpanan informasi di Internet . . . .
sangat membantu para penulis dalam menghasilkan karya tulis
ilmiah. Penulisan karya ilmiah ini biasa dimanfaatkan kalangan
akademik dalam kegiatan paper conference atau sebagai tugas
kuliah bagi mahasiswa. Hal ini membuat pemeriksa kesulitan
dalam memeriksa keunikan karya tulis yang dihasilkan.
Pencarian kemiripan dokumen menjadi salah satu solusi yang
dapat digunakan. Sehubungan dengan ha1 tersebut, proses
clustering dalam text mining dapat dimanfaatkan untuk
pencarian kemiripan dokumen agar lebih efektif.
Pada penelitian ini, dibuktikan dua buah hipotesis dalam
pencarian kemiripan dokumen dan menghasilkan solusi
pemanfaatan pencarian kemiripan dokumen-dokumen berbahasa
Indonesia. Selain itu, akan dibuktikan pula hasil K-Means
clustering dengan pemilihan feature terhadap isi dokumen
berdasarkan judul, abstrak, pendahuluan, penutup, dan daftar
pustaka, dapat lebih baik dibandingkan dengan hasil clustering
biasa. Prototipe aplikasi pun dibangun untuk membuktikan
hipotesis tersebut
Hasil pengujian pada penelitian ini menunjukkan bahwa
pemilihan feature untuk clustering menghasilkan/akurasi yang
paling tinggi, yaitu mencapai nilai 0.96. Selain itu, dibuktikan pula
gap perhitungan waktu pencarian yang cukup besar antara
pencarian terhadap dokumen ter-cluster dengan dokumen tanpa
cluster.
Description
Keywords
kemiripan dokumen, K-Means clustering, text mining