IMPLEMENTASI PENGECEKAN PLAGIARISME PROPOSAL TUGAS AKHIR MAHASISWA TEKNIK INFORMATIKA UPN VETERAN YOGYAKARTA

Awang Hendrianto Pratomo, Andiko Putro Suryotomo

Abstract


Abstract
The thesis proposal submission system currently used by the Department of Informatics Engineering at UPN "Veteran" Yogyakarta is still using conventional manual methods, so difficulties are encountered in checking the document's similarity for the student's final project proposal. The Winnowing algorithm can be used to do similarity checking in text-based documents. The Winnowing algorithm works by retrieving text data from the thesis proposal, then carrying out several steps such as preprocessing by finding the smallest hash value of each document used as a comparison to determine the similarity value between documents. The results showed that the smaller n-gram size would get a larger percentage similarity value (76% and 89%). This happens because a smaller n-gram size will result in smaller truncated strings, increasing the probability of finding the same string of characters. The bigger n-gram size will result in more characters than the smaller n-gram size, which causes fewer character strings to be found thus lowering the similarity value (down to 57% and 68%).
Keywords: thesis proposal, plagiarism, Winnowing algorithm, hash value, n-gram


Abstrak
Sistem informasi skripsi yang saat ini digunakan oleh program studi Teknik Informatika UPN “Veteran” Yogyakarta masih menggunakan cara konvensional, sehingga ditemui kesulitan dalam proses pemeriksaan kemiripan dokumen yang ada dalam proposal tugas akhir mahasiswa. Pemeriksaan kemiripan dokumen dapat dilakukan dengan menggunakan algoritme Winnowing. Algoritme Winnowing bekerja dengan cara mengembil data teks dari proposal, kemudian dilakukan beberapa tahapan seperti preprocessing kemudian dilakukan dengan mencari nilai hash terkecil dari setiap dokumen yang digunakan sebagai pembanding untuk menentukan nilai kemiripan dokumen tersebut. Hasil penelitian diketahui bahwa pemilihan n-gram yang semakin kecil akan memperoleh nilai persentase kemiripan yang besar (76% dan 89%). Hal ini terjadi karena pada n-gram yang lebih sedikit, string yang dipotong lebih kecil sehingga kemungkinan untuk ditemukannya rangkaian karakter yang sama semakin besar. Semakin besarnya n-gram, maka mengandung karakter yang lebih banyak dibandingkan dengan n-gram yang lebih kecil sehingga menyebabkan rangkaian karakter yang ditemukan semakin berkurang sehingga menurunkan nilai similaritas (hingga 57% dan 68%).
Kata kunci: proposal skripsi, plagiarisme, algoritme Winnowing, nilai hash, n-gram


Keywords


thesis proposal; plagiarism; Winnowing algorithm; hash value; n-gram

Full Text:

PDF

References


Aulia, R. (2008). Analisis Algoritme Knuth Morris Pratt dan Algoritme Boyer Moore dalam Proses Pencarian String. Bandung: ITB.

Djafar, I. M. (2015). Deteksi Kemiripan Dokumen Teks Menggunakan Algoritme Manber. Deteksi Kemiripan Dokumen Teks Menggunakan Algoritme Manber.

Firdaus, H. B. (2008). Deteksi Plagiat Dokumen Menggunakan Algoritme Rabin-Karp. Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika, Institut Teknologi Bandung (ITB). Bandung. Diambil dari http://informatika.stei.itb.ac.id/~rinaldi.munir/Stmik/2007-2008/Makalah2008/MakalahIF2251-2008-076.pdf

Goenawan, W., Augustinus, R., & Sembiring, K. (2005). Penerapan Algoritme Edit Distance Pada Pendeteksian Praktik Plagiat. Bandung: Institut Teknologi Bandung.

Hidayani, N., Sari, J. N., & Suhatman, R. (2012). Perancangan dan Implementasi Metode Brute Force untuk Pencarian String pada Website PCR. Jurnal Aksara Komputer Terapan, 1(2).

Istiana, P., Purwoko, & Perpustakaan UGM. (2014, Januari 26). Panduan Anti Plagiarism. Diambil 31 Januari 2018, dari http://lib.ugm.ac.id/data/panduan_plagiarisme.pdf

Josi, A., & Abdillah, L. A. (2014). Penerapan teknik web scraping pada mesin pencari artikel ilmiah. arXiv preprint arXiv:1410.5777. Rahma, Mivthahul. (2015). Cara-Cara Konversi Sistem Informasi. Bogor: Institut Pertanian Bogor.

Kurniawati, A., & Wicaksana, I. W. S. (2008). PERBANDINGAN PENDEKATAN DETEKSI PLAGIARISM DOKUMEN DALAM BAHASA INGGRIS. Proceeding, Seminar Ilmiah Nasional Komputer dan Sistem Intelijen (KOMMIT 2008). Diambil dari http://repository.gunadarma.ac.id/977/

Mulyanto, A. (2010). ANALISIS EDIT DISTANCE MENGGUNAKAN ALGORITME DYNAMIC PROGRAMMING, Vol 5, No 2. Diambil dari http://repository.ung.ac.id/get/simlit_res/1/281/Analisis-Edit-Distance-Menggunakan-Algoritme-Dynamic-Programming.pdf

Munir, R. (2004). Algoritme Brute Force Bagian 2–Algoritme Brute Force (Lanjutan). ppt. ITB, Bandung.

Pramana, Y., & Munggana, W. (2016). Implementasi Web Scrapping pada Website Eduesia. Com untuk Pengukur Kesenjangan Jumlah Mahasiswa Perguruan Tinggi di Indonesia. ULTIMA INFOSYS, 6(2), 130–135.

Purwitasari, D., Kusmawan, P. Y., & Yuhana, U. L. (2011). Deteksi Keberadaan Kalimat Sama Sebagai Indikasi Penjiplakan Dengan Algoritme Hashing Berbasis N-Gram. Jurnal Ilmiah KURSOR, 6(1), 37–44. Diambil dari http://old.its.ac.id/personal/files/pub/4745-diana-cs-kursor_Diana.pdf

Saragih, M. A. (2013). Implementasi Algoritme Brute Force dalam Pencocokan Teks Font Italic untuk Kata Berbahasa Inggris pada Dokumen Microsoft Office Word. Pelita Informatika: Informasi dan Informatika, 4(3).

Fadelillah, M., Subroto, I. M. I., & Kurniadi, D. (2017). Sistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard’s Coefficient. TRANSISTOR Elektro dan Informatika, 2(1), 1–14.

Schleimer, S., Wilkerson, D. S., & Aiken, A. (2003). Winnowing: local algorithms for document fingerprinting. Dalam Proceedings of the 2003 ACM SIGMOD international conference on Management of data (hlm. 76–85). ACM. Diambil dari http://theory.stanford.edu/~aiken/publications/papers/sigmod03.pdf

Jumardi, R., Nugroho, E., & Hidayah, I. (2015). Analisis Kesuksesan Implementasi Sistem Informasi Skripsi pada Program Studi Teknik Informatika Universitas Pembangunan Nasional “Veteran” Yogyakarta. Dalam Seminar Nasional Aplikasi Teknologi Informasi (SNATI) (Vol. 1).

Soelistyo, H. (2011). Plagiarisme: pelanggaran hak cipta dan etika. Penerbit Kanisius. Diambil dari https://books.google.co.id/books?id=xhwptwAACAAJ

Palupi, Y. E., & Suroso, B. D. I. A. I. (2014). Pengembangan Sistem Informasi.

Triawati, C. (2009). Metode Pembobotan Statistical Concept Based untuk Klastering dan Kategorisasi Dokumen Berbahasa Indonesia. Institut Teknologi Telkom, Bandung.

Turland, M. (2010). Php, Architect’s Guide to Web Scraping. Marco Tabini & Associates, Inc.

Zuliarso, E., & Mustofa, K. (2009). Crawling Web berdasarkan Ontology. Dinamik-Jurnal Teknologi Informasi, 14(2).


Refbacks

  • There are currently no refbacks.