Definisi Dan Tipe Data: Himpunan Data, Nilai Atribut, Sifat Atribut Dan Tipe Atribut
Saturday, November 2, 2019
Edit
Pengertian Himpunan Data Dalam Data Mining
Himpunan data (data-set) merupakan kumpulan dari objek dan atributnya. Atribut merupakan sifat atau karakteristik dari suatu objek. Contohnya : Warna mata seseorang, suhu, dsb.Atribut juga dikenal sebagai variabel, field, karakteristik atau fitur. Kumpulan dari atribut menggambarkan sebuah Objek. Objek juga disebut dengan record, titik, kasus, sample, entitas atau instance.
Nilai-Nilai Atribut Dalam Data Mining
Nilai- nilai atribut ialah angka atau simbol yang memberi nilai pada atribut tersebut. Perbedaan antara atribut dan nilai- nilai atribut.
Tipe-tipe Atribut Dalam Data Mining
Atribut sanggup dibedakan dalam tipe-tipe yang berbeda bergantung pada tipe domainnya, yaitu bergantung pada tipe nilai yang diterima. Atribut katagorikal (categorical attribute) ialah salah satu tipe yang domainnya merupakan sebuah himpunan simbol berhingga. Contoh :Ienis kelamin, status, dan pendidikan, dimana domainUenis kelamin) = {L, P},
domain(status) = {Menikah, Belum Menikah} dan domain(Pendidikan) = {SD: SMP, SMA, D3, 51, 52, S3, lainnya}.
Atribut katagorikal dibedakan menjadi dua tipe,yaitu :
Tipe atribut kedua ialah atribut numerik (numeric attribute) yang domainnya berupa bilangan riil atau integer.Contohnya umur dan gaji.Domain(umur) = domain(gaji) = bilangan riil positif. Atribut numerik juga dibedakan menjadi dua,yaitu :
Himpunan data (data-set) merupakan kumpulan dari objek dan atributnya. Atribut merupakan sifat atau karakteristik dari suatu objek. Contohnya : Warna mata seseorang, suhu, dsb.Atribut juga dikenal sebagai variabel, field, karakteristik atau fitur. Kumpulan dari atribut menggambarkan sebuah Objek. Objek juga disebut dengan record, titik, kasus, sample, entitas atau instance.
Nilai-Nilai Atribut Dalam Data Mining
Nilai- nilai atribut ialah angka atau simbol yang memberi nilai pada atribut tersebut. Perbedaan antara atribut dan nilai- nilai atribut.
- Atribut yang sama sanggup dipetakan ke nilai atribut yang berbeda. Contoh: ketinggian sanggup diukur dengan satuan kaki atau meter.
- Atribut yang berbeda sanggup dipetakan ke himpunan nilai yang sama. Contoh: Nilai atribut untuk ID dan umur ialah bilangan bulat,tetapi sifat dari nilai atribut sanggup berbeda. ID tidak terbatas tetapi umur memiliki nilai minimal dan nilai maksimal.
- Pembeda (Distinctness): = 1
- Urutan (Order): <>
- Penjumlahan (Addition): + -
- Perkalian (Multiplication): * /
Tipe-tipe Atribut Dalam Data Mining
Atribut sanggup dibedakan dalam tipe-tipe yang berbeda bergantung pada tipe domainnya, yaitu bergantung pada tipe nilai yang diterima. Atribut katagorikal (categorical attribute) ialah salah satu tipe yang domainnya merupakan sebuah himpunan simbol berhingga. Contoh :Ienis kelamin, status, dan pendidikan, dimana domainUenis kelamin) = {L, P},
domain(status) = {Menikah, Belum Menikah} dan domain(Pendidikan) = {SD: SMP, SMA, D3, 51, 52, S3, lainnya}.
Atribut katagorikal dibedakan menjadi dua tipe,yaitu :
- Nominal: Sebuah atribut dikatakan nominal j ika nilai-nilainya tidak sanggup diurutkan Contoh: Jenis kelamin, warna mata. Atribut nominal memiliki sifat pembeda (distinctness).
- Ordinal: Disebut atribut ordinal kalau nilai-nilainya sanggup diurutkan dalam beberapa cara, contoh: ranking (misal, rasa dari keripik kentang pada skala 1-10), grade, tinggi dalam {tinggi, medium, pendek} atau'pendidikan (karena kita sanggup menyampaikan bahwa pendidikan Sl lebih tinggi dari Sekolah Menengan Atas maupun D3). Sifat dari ordinal atribut ialah pembeda dan urutan (order).
Tipe atribut kedua ialah atribut numerik (numeric attribute) yang domainnya berupa bilangan riil atau integer.Contohnya umur dan gaji.Domain(umur) = domain(gaji) = bilangan riil positif. Atribut numerik juga dibedakan menjadi dua,yaitu :
- Interval: Untuk jenis atribut ini memiliki sifat bahwa perbedaan antara nilai-nilainya sangat berarti. Contoh: tanggal, suhu dalam Celsius atau Fahrenheit, alasannya ialah tidak ada bedanya kalau kita menyatakan bahwa 20°C = dua kali dinginnya 10°C.
- Rasio: Dalam atribut jenis ini, baik beda maupun rasio sangat berarti. Contoh atribut rasio: suhu dalam Kelvin, panjang, waktu, jumlah, Kita sanggup menyatakan bahwa orang berumur 20 tahun dua kali lebih renta dari yang berusia 10 tahun.
- Atribut Diskrit (Discrete Attribute) yaitu atribut yang hanya memakai sebuah himpunan nilai berhingga atau himpunan nilai tak berhingga yang sanggup dihitung. Contoh: zip codes, jumlah, atau himpunan kata dalam kumpulan dokumen. Sering dinyatakan sebagai variabel bilangan lingkaran (integer). Catatan: atribut biner merupakan masalah khusus dari atribut diskrit.
- Atribut Kontinyu (Continudus Attribute) yaitu atribut yang memakai bilangan riil sebagai nilai atribut. Contoh: suhu, ketinggian atau berat. Pada kenyataannya, nilai riil hanya sanggup diukur dan dinyatakan memakai sejumlah digit yang berhinggaAtribut kontinyu secara khusus dinyatakan sebagai variabel decimal (floating-point).