Teknik Klasterisasi/Clustering Dan Aplikasinya Pada Data Mining
Saturday, November 2, 2019
Edit
Pada pembahasan kali ini akan membahas perihal salah satu teknik dalam data mining. Kita tahu bahwa ada banyak teknik yang sanggup dipakai dalam data mining yang meliputi: Classification/Predictive, Clustering/Descriptive, AssociationRule Discovery/Descriptive, SequentialPattern Discovery/Descriptive, Regression/Predictive, dan DeviationDetection/Predictive. Teknik yang akan kita bahas kali ini ialah perihal teknik klasterisasi atau clustering.
Teknik Klasterisasi (clustering) pada Data Mining
Mempartisi data-set menjadi beberapa sub-set atau kelompok sedemikian rupa sehingga elemen-elemen dari suatu kelompok tertentu mempunyai set properti yang dishare bersama, dg tingkat similaritas yang tinggi dalam satu kelompok dan tingkat similaritas antar kelompok yang rendah.Disebut juga dengan ‘unsupervised learning’.
Baca Juga: Teknik Regresi (Regression/Predictive) pada Data Mining
Jika diberikan sejumlah titik data yang masing-masing mempunyai sejumlah atribut, dan dengan memakai satu ukuran similaritas, sanggup ditemukan klaster-klaster sedemikian sampai :
Ukuran similaritas yang digunakan
Baca Juga: Teknik Klasifikasi(Classification/Predictive) pada Data mining
Aplikasi dari klasterisasi diantaranya ialah :
1. Market Segmentation:
Tujuan: Membagi pasar kedalam sub-set pelanggan yang berbeda, dim-ana suatu sub-set mungkin sanggup dipilih sebagai sasaran pasar yang dicapai dengan satu kombinasi pemasaran yang berbeda.
Pendekatan:
2. Document Clustering:
Tujuan: Untuk mendapat kelompok dokumen yang mempunyai kesamaan berdasarkan pernyataan atau kata-kata penting yang muncul dalam dokumen tersebut.
Pendekatan:
Pencapaian: Information Retrieval sanggup dimanfaatkan untuk menghubungkan suatu dokumen gres atau mencari term ke dokumen-dokumen yang diklaster.
Teknik Klasterisasi (clustering) pada Data Mining
Mempartisi data-set menjadi beberapa sub-set atau kelompok sedemikian rupa sehingga elemen-elemen dari suatu kelompok tertentu mempunyai set properti yang dishare bersama, dg tingkat similaritas yang tinggi dalam satu kelompok dan tingkat similaritas antar kelompok yang rendah.Disebut juga dengan ‘unsupervised learning’.
Baca Juga: Teknik Regresi (Regression/Predictive) pada Data Mining
Jika diberikan sejumlah titik data yang masing-masing mempunyai sejumlah atribut, dan dengan memakai satu ukuran similaritas, sanggup ditemukan klaster-klaster sedemikian sampai :
- Titik-titik data dalam satu klaster mempunyai similaritas yang lebih besar.
- Titik-titik data dalam klaster yang berbeda mempunyai similaritas yang kecil.
Ukuran similaritas yang digunakan
- Euclidean Distance jikalau atributnya kontinyu.
- Permasalahan lain — ukuran tertentu .
Baca Juga: Teknik Klasifikasi(Classification/Predictive) pada Data mining
Aplikasi dari klasterisasi diantaranya ialah :
1. Market Segmentation:
Tujuan: Membagi pasar kedalam sub-set pelanggan yang berbeda, dim-ana suatu sub-set mungkin sanggup dipilih sebagai sasaran pasar yang dicapai dengan satu kombinasi pemasaran yang berbeda.
Pendekatan:
- Kumpulkan atribut dari pelanggan yang berbeda ber‘dasarkan pada gosip kawasan tinggal dap gaya hidup.
- Tentukan klaster dari pelanggan-pelanggan yang sama.
- Hitung kualitas klaster dengan mengobservasi contoh daya beli pelanggan pada klaster yang samaversus dari klaster yang berbeda.
2. Document Clustering:
Tujuan: Untuk mendapat kelompok dokumen yang mempunyai kesamaan berdasarkan pernyataan atau kata-kata penting yang muncul dalam dokumen tersebut.
Pendekatan:
- Untuk mengenali kata-kata yang sering muncul dalam tiap dokumen. Dari suatu pengukuran similaritas yang didasarkan pada frekuensi term yang berbeda.
- Gunakan pengukuran ini untuk membentuk klaster-klaster
Pencapaian: Information Retrieval sanggup dimanfaatkan untuk menghubungkan suatu dokumen gres atau mencari term ke dokumen-dokumen yang diklaster.