Teknik Klasterisasi/Clustering Dan Aplikasinya Pada Data Mining

Pada pembahasan kali ini akan membahas wacana salah satu teknik dalam data mining. Kita tahu bahwa ada banyak teknik yang sanggup dipakai dalam data mining yang meliputi: Classification/Predictive, Clustering/Descriptive, AssociationRule Discovery/Descriptive, SequentialPattern Discovery/Descriptive, Regression/Predictive, dan DeviationDetection/Predictive. Teknik yang akan kita bahas kali ini yaitu wacana teknik klasterisasi atau clustering.


Teknik Klasterisasi (clustering) pada Data Mining

Mempartisi data-set menjadi beberapa sub-set atau kelompok sedemikian rupa sehingga elemen-elemen dari suatu kelompok tertentu mempunyai set properti yang dishare bersama, dg tingkat similaritas yang tinggi dalam satu kelompok dan tingkat similaritas antar kelompok yang rendah.Disebut juga dengan ‘unsupervised learning’.

Baca Juga: Teknik Regresi (Regression/Predictive) pada Data Mining

Jika diberikan sejumlah titik data yang masing-masing mempunyai sejumlah atribut, dan dengan memakai satu ukuran similaritas, sanggup ditemukan klaster-klaster sedemikian sampai :

  • Titik-titik data dalam satu klaster mempunyai similaritas yang lebih besar.
  • Titik-titik data dalam klaster yang berbeda mempunyai similaritas yang kecil.

Ukuran similaritas yang digunakan

  • Euclidean Distance kalau atributnya kontinyu.
  • Permasalahan lain — ukuran tertentu .

Baca Juga: Teknik Klasifikasi(Classification/Predictive) pada Data mining

Aplikasi dari klasterisasi diantaranya yaitu :

1. Market Segmentation:
Tujuan: Membagi pasar kedalam sub-set pelanggan yang berbeda, dim-ana suatu sub-set mungkin sanggup dipilih sebagai sasaran pasar yang dicapai dengan satu kombinasi pemasaran yang berbeda.
Pendekatan:

  1. Kumpulkan atribut dari pelanggan yang berbeda ber‘dasarkan pada info kawasan tinggal dap gaya hidup.
  2. Tentukan klaster dari pelanggan-pelanggan yang sama.
  3. Hitung kualitas klaster dengan mengobservasi contoh daya beli pelanggan pada klaster yang samaversus dari klaster yang berbeda.

2. Document Clustering:
Tujuan: Untuk mendapat kelompok dokumen yang mempunyai kesamaan berdasarkan  pernyataan atau kata-kata penting yang muncul dalam dokumen tersebut.
Pendekatan:

  1. Untuk mengenali kata-kata yang sering muncul dalam tiap dokumen. Dari suatu pengukuran similaritas yang didasarkan pada frekuensi term yang berbeda.
  2. Gunakan pengukuran ini untuk membentuk klaster-klaster

Pencapaian: Information Retrieval sanggup dimanfaatkan untuk menghubungkan suatu dokumen gres atau mencari term ke dokumen-dokumen yang diklaster.

Iklan Atas Artikel

Iklan Tengah Artikel 1

Iklan Tengah Artikel 2

Iklan Bawah Artikel