Fuzzy String Matching for Semi-Automatication of Words with Jaro Winkler Distance Algorithm on Microsoft Word Documents

Hasna Nur Hanani, Herlina Jayadianti, Heru Cahya Rustamaji

Abstract


Tujuan: mengukur pengaruh keberadaan fuzzy string matching pada pemiringan kata asing secara semi-otomatisasi dengan jaro winkler distance terhadap jumlah kata, waktu dan akurasi.
Perancangan/metode/pendekatan: menguji ketepatan dan waktu pemrosesan pemiringan kata asing dengan jaro winkler dan menguji ketepatan dan waktu pemrosesan pemiringan kata asing dengan tambahan fuzzy string matching.
Hasil: Akurasi semi-otomatisasi kata pada uji data satu menghasilkan nilai 83,73% untuk pemiringan dengan algoritma jaro winkler distance dan 84,33% untuk pemiringan kata dengan fuzzy string matching sedangkan semi-otomatisasi kata pada uji data dua dengan algoritma jaro winkler adalah 98,77%, sedangkan dengan penambahan fuzzy string matching akurasinya menjadi 99,11%. Pengukuran waktu pemrosesan menunjukkan bahwa dengan penambahan fuzzy string matching cenderung lebih cepat. Jumlah kata yang dimiringkan dengan fuzzy string matching lebih banyak dibanding pemiringan kata dengan jaro winkler distance pada kondisi dimana jumlah kata asing pada database sama.
Keaslian/ state of the art: Penelitian ini, bermula dari pendeteksian kata asing pada dokume. Apabila kata aing yang merupakan kata dalam bahasa Inggris ditemukan, maka pada pngujian pertama kata tersebut akan diukur dengan algoritma Jaro Winkler distance. Jaro Winkler digunakan untuk mengukur persamaan kata antara kata asing yang ditemukan pada dokumen dengan kata asing pada database. Jika hasil dari jaro winkler distance adalah 1 maka kata akan dicetak miring. Pada pengujian kedua kata asing yang telah diukur dengan jaro winkler akan memiliki nilai persamaan kata yang akan diolah oleh fuzzy string matching. Fuzzy string matching akan memberikan toleransi nilai kepada hasil nilai persamaan kata. Hasil nilai fuzzy string matching akan menentuka kata asing tersebut akan dicetak miring atau tidak.


Keywords


matching;semi-automation;fuzzy string matching; jaro winkler distance; foreign word

Full Text:

PDF

References


Sugiyo, “Pengaruh Motivasi Belajar dan Penguasaan Kosakata Terhadap Kemampuan Menulis Narasi Siswa Kelas VIII SMP Mater Dei Pamulang Kota Tangerang Selatan”, in Jurnal Sasindo Unpam. 3(2). 72-86, 2019, http://eprints.unpam.ac.id/id/eprint/1549 [3] Friendly, “Perbaikan Metode Jaro–Winkler Distance untuk Approximate String Search Menggunakan Data Terindeks Aplikasi Multi User” in Jurnal Teknovasi, Vol.04, No.2, 2017, 59-69. ISSN:2540-8389

Putri, D.Z., Puspitaningrum, D. and Setiawan. Y, “Konversi Citra Kartu Nama Ke Teks Menggunakan Teknik OCR dan Jaro-Winkler Distance” in Jurnal TEKNOINFO, Vol. 12, No.1, 2018, 1-6. ISSN 1693-0010

Prasetyo, A., Baihaqi, W. M.and Had. I. S., “Algoritma Jaro-Winkler Distance: Fitur Autocorrect Dan Spelling Suggestion Pada Penulisan Naskah Bahasa Indonesia Di Bms Tv”, in Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK), Vol. 5, No. 4, September 2018, hlm. 435-444. p-ISSN: 2355-7699. DOI: 10.25126/jtiik.201854780.

Taufik, I. Aishia,I.D. and Jumadi.J, “Implementasi Fuzzy Search Untuk Pendeteksi Kata Asing Pada Dokumen Microsoft Word.” in Jurnal Teknik Informatika. 10(1). 1-8, 2017, doi:10.15408/jti.v10i1.6804

Mulyatun, S., Utama, H. and Mustopa A, “Pendekatan Natural language pada Aplikasi Cahtbot sebagai Alat Bantu Customer Service”, in JOISM : Jurnal Of Information System Management Vol. 3, No. 1. e-ISSN : 2715-3088, 2021.

Sihotang, M. T., Jaya, I., Hizriadi, A., and Hardi S. M, “Answering Islamic Questions with a Chatbot using Fuzzy String-Matching Algorithm” in .Journal of Physics: Conference Series, 2020 012007. doi:10.1088/1742-6596/1566/1/012007

Frando, J., Ruslianto, I. and Hidayati, R, “Penerapan Jaro Winkler Distance dalam Aplikasi Pengoreksi Kesalahan Penulisan Bahasa Indonesia Berbasis Web” in Jurnal Komputer dan Aplikasi. 7(3). 44-53, 2019.

Pinajeng, I, K, T, P., Sukarsa, I, M. and Putra, I, M, S, “Perbaikan Kata pada Sistem Chatbot dengan Metode Jaro Winkler” in JITTER- Jurnal Ilmiah Teknologi dan Komputer Vol. 1, No. 2, 2020.

Tinaliah and Elizabeth, T, “Perbandingan Hasil Deteksi Plagiarisme Dokumen dengan Metode Jaro-Winkler Distance dan Metode Latent Semantic Analysis” in Jurnal Teknologi dan Sistem Komputer 6(1):7, 2018, DOI:10.14710/jtsiskom.6.1.2018.7-12.

Kusumadewi, S., Hartati, S., Harjoko, A., Wardoyo, R “Fuzzy Multi-Atribute Decesion Makin (Fuzzy MADM). Yogyakarta : Graha Ilmu, 2006.

Gunawan and Kirman, “Implementasi Algoritma Turbo Boyer Moore untuk Pencarian Data pada Transaksi Keuangan Duta Ponecell Sawah Lebar”, in Jurnal Media Infotama Vol.15 No. 1, 2019.

Anisah, S., Yulianto, T. and Faisol, F, “Perbandingan Fuzzy Sugeno dan Fuzzy Mamdani Pada Analisis Minat Masyarakat Terhadap Produk Air Minum Dalam Kemasan Lokal dan Nasional di Madura”, in Zeta - Math Journal, 6(1), 29-37, 2021, https://doi.org/10.31102/zeta.2021.6.1.29-37

Khatami, S, “Comparison and Improvement of Basic String Metrics for Surname Matching”, in Life Science Journal. X(5). pp.128-32, 2013 [16] Oxford. (2020). Oxford Reference[online]. Available : https://www.oxfordreference.com/view/10.1093/oi/authority.20110803104449628.


Refbacks

  • There are currently no refbacks.