DATA MINING DENGAN TEKNIK CLUSTERING DALAM PENGKLASIFIKASIAN DATA MAHASISWA STUDI KASUS PREDIKSI LAMA STUDI MAHASISWA UNIVERSITAS BINA NUSANTARA

Lindawati Lindawati

Abstract


Penggunaan teknik Data Mining (DM) clustering berbeda dengan teknik-teknik DM yang lainnya, seperti association rule mining dan classification yang memerlukan tahapan training dan evaluasi. Teknik ini menggunakan metode unsupervised learning yang berarti DM tidak perlu melakukan training terlebih dahulu tapi bisa langsung menggunakannya untuk pengelompokan. Teknik ini masih jarang digunakan dibanding dengan teknik-teknik DM yang lain. Oleh karena itu, artikel ini berfokus pada pengembangan aplikasi DM dengan teknik clustering pada penelitian untuk mengklasifikasikan data prediksi lama studi masiswa di Universitas Bina Nusantara dengan menggunakan algoritma Self Organizing Maps dan pengujian keakuratan aplikasi DM dengan teknik clustering. Tahapan yang dilakukan dibagi menjadi tahapan analisa, perancangan, pengembangan dan pangujian aplikasi DM. Pada tahapan analisa dilakukan beberapa percobaan dalam mengklasifikasikan prediksi lama studi mahasiswa berdasarkan delapan atribut yang digunakan, yaitu: rata-rata Indeks Prestasi Kumulatif (rIpk), simpangan rata-rata Indeks Prestasi Kumulatif (srIpk), rata-rata jumlah SKS per Semester (rSksem), rata-rata jumlah SKS yang tidak lulus per semester (rSksemTL), jumlah SKS Kumulatif (skKum), jumlah SKS yang akan diambil pada semester keempat (sksYad),  jumlah SKS yang wajib diambil (sksMin) dan hak SKS yang dapat diambil pada semester lima dst (hakSks). Hasil dari tahapan analisa ini digunakan sebagai acuan pada tahapan perancangan dan pengembangan aplikasi DM. Selanjutnya dilakukan pengujian terhadap aplikasi DM yang telah dibuat untuk mengetahui keakuratan pengklasifikasian dari aplikasi DM tersebut. Evaluasi dilakukan melalui beberapa variasi pengujian dengan menggunakan paramter-parameter jumlah data, jumlah iterasi, learning rate, radius, neighbourhood function dan urutan data. Dari pengujian-pengujian yang dilakukan dapat diketahui bahwa rata-rata kesalahan hasil klasifikasi prediksi lama studi yang diperoleh relatif kecil, kurang dari atau maksimal 5%.


References


Fausett, Laurene. (1994). Fundamentals of Neural Networks : Architectures, Algorithms, and Applications. Prentice Hall, New Jersey.

J. Gehrke, R. Ramakrishnan, V. Ganti (1998). “Rainforest: A framework for fast decision tree construction of large datasets”. International Conf. Very Large Data Bases (VLDB).

J. Han, J. Pei, Y. Yin (2000). “Mining frequent patterns without candidate generation”. ACM-SIGMOD International Conf. Management of Data (SIGMOD’00).

J. Han , M. Kamber (2001). Data Mining : Concepts and Techniques. Morgan Kaufmann.

Suparno, Haryono. Lindawati. Wijaya, Rusmin. Martana, Henry (2005). Penerapan Algoritma Self-Organizing Maps Dalam Pengklasifikasian Data Mahasiswa : Studi Kasus Prediksi Lama Studi Mahasiswa Universitas Bina Nusantara. LTB Jurusan Teknik Informatika Universitas Bina Nusantara, Edisi Desember 2005. Universitas Bina Nusantara, Jakarta.

U. Fayyad, Piatetsky-Shapiro, Smyth, and Uthurusamy (1996). Advances in Knowledge Discovery and Data Mining, MIT Press.


Refbacks

  • There are currently no refbacks.