SISTEM PENDETEKSI PLAGIARISME PADA DOKUMEN DUAL BAHASA (INDONESIA – INGGRIS) BERBASIS FUZZY IR
No Thumbnail Available
Date
2018
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Universitas Widyatama
Abstract
Pendeteksian Plagiarisme dapat dilakukan dengan berbagai macam metode. Seiring dengan berjalannya waktu, berbagai macam metode yang digunakan untuk melakukan pendeteksian plagiarisme telah dikembangkan. Metode Fuzzy Information Retrieval (IR) salah satu metode yang dapat digunakan untuk melakukan pendeteksian plagiarisme. Metode ini memiliki kelebihan dalam hal mendeteksi plagiarisme copy-paste maupun paraphase. Tantangan yang dihadapi dalam penerapan metode ini adalah menentukan nilai threshold optimal yang ada pada rule sehingga dapat mengidentifikasi ada atau tidaknya tindakan plagiarisme dengan akurat. Oleh karena itu pada penelitian ini digunakan beberapa kombinasi nilai threshold agar dapat ditentukan kombinasi nilai threshold seperti apa yang dapat dengan tepat mengindentifikasi tindakan plagiarisme pada dokumen Bahasa Indonesia atau Bahasa Inggris. Dari 10 pengujian yang telah dilakukan, untuk jenis plagiarisme copy paste nilai precision dan recall yang didapat tidak terpengaruh oleh nilai threshold yang diberikan, sedangkan untuk jenis plagiarisme active – passive ketika diberikan nilai permission lebih dari 0.775 dan variance lebih dari 0.225 mengalami penurunan pada precision dan recall. Pada pengujian jenis plagiarisme perubahan kata ke dalam sinonim mengalami penurunan nilai permission dan recall jika diberikan threshold permission lebih dari 0.825 dan variance lebih 0.175. Sementara, pada pegujian jenis plagiarisme dalam bentuk translate mendapatkan nilai precision dan recall yang baik hanya ketika diberikan nilai threshold permission 0.525 dan variance 0.475. Selain itu semakin besar nilai untuk threshold permission, atau semakin kecil nilai untuk threshold variance maka sistem akan semakin sulit untuk mendeteksi kalimat plagiat yang mengubah banyak struktur kalimat seperti text manipulation dan idea adoption. Hal ini disebabkan karena toleransi dari sistem terhadap perubahan struktur kalimat yang semakin berkurang.
Description
Keywords
Plagiarism, Plagiarism Detection, Fuzzy IR, Permission Threshold, Variance Threshold, Plagiarisme, Pendeteksian Plagiarisme