ANALISIS CLUSTER K-MEANS

KONSEP DASAR ANALISIS CLUSTER K-MEANS

Analisis Cluster bertujuan untuk mengelompokkan suatu objek ke dalam beberapa kelompok yang memiliki sifat berbeda antar kelompok, sehingga objek yang terletak di dalam satu kelompok akan mempunyai sifat yang relatif homogen (sama). Salah satu metode dalam Analisis Cluster yaitu, Analisis Cluster Non-Hierarki (K-Means Cluster atau C-Means). Pada Metode K-Means Cluster, jumlah cluster yang di inginkan telah di persiapkan terlebih dahulu, setelah menentukan jumlah cluster baru dilakukan proses pengelompokkan.

Analisis klaster adalah teknik dalam ilmu data yang digunakan untuk mengelompokkan objek atau data ke dalam kelompok-kelompok yang saling mirip atau serupa. Tujuan utama dari analisis klaster adalah untuk mengidentifikasi pola atau struktur yang tersembunyi dalam data tanpa adanya label kelas sebelumnya. Dengan menganalisis kesamaan dan perbedaan antara objek atau data, analisis klaster membantu dalam pemahaman yang lebih baik tentang kelompok-kelompok yang ada dan memberikan wawasan baru yang dapat digunakan untuk pengambilan keputusan.

TUJUAN UTAMA ANALISIS CLUSTER:

  • Identifikasi Struktur Data: Melalui analisis klaster, kita dapat mengidentifikasi pola atau struktur yang ada dalam data yang mungkin sulit dilihat hanya dengan melihat data mentah. Dengan mengelompokkan data ke dalam kelompok-kelompok yang saling mirip, kita dapat melihat hubungan dan karakteristik yang mungkin tidak terlihat sebelumnya.
  • Segmentasi Pelanggan: Analisis klaster sering digunakan dalam pemasaran untuk membagi pelanggan ke dalam kelompok-kelompok yang serupa berdasarkan preferensi, perilaku, atau karakteristik demografis mereka. Dengan memahami kelompok-kelompok ini, bisnis dapat mengembangkan strategi pemasaran yang lebih efektif dan personalisasi komunikasi dengan pelanggan.
  • Pengelompokan Data: Analisis klaster dapat membantu mengelompokkan data yang tidak terstruktur atau tidak terlabel ke dalam kategori-kategori yang saling mirip. Misalnya, dalam pengolahan teks, analisis klaster dapat membantu mengelompokkan dokumen-dokumen berdasarkan topik atau tema yang sama.
  • Pengurangan Dimensi: Analisis klaster juga dapat digunakan sebagai langkah awal dalam pengurangan dimensi. Dengan mengelompokkan data ke dalam kelompok-kelompok yang saling mirip, kita dapat mengidentifikasi fitur-fitur yang paling penting atau representatif dalam setiap kelompok. Hal ini dapat membantu dalam mengurangi dimensi data dan meningkatkan efisiensi komputasi dalam analisis selanjutnya.
  • Pemahaman Domain: Dengan membagi data ke dalam klaster-klaster yang bermakna, analisis klaster dapat membantu dalam pemahaman yang lebih baik tentang domain atau bidang yang sedang diteliti. Ini dapat membantu dalam penemuan pengetahuan baru, pengembangan teori, atau eksplorasi data yang lebih mendalam.

KELEBIHAN & KEKURANGAN ANALISIS CLUSTER K-MEANS

Analisis Cluster K-Means memiliki beberapa kelebihan, diantaranya :

  1. Sederhana dan Mudah diimplementasikan: Algoritma K-Means relatif mudah untuk dipahami dan diimplementasikan. Ini membuatnya dapat digunakan oleh pemula dalam analisis klaster tanpa memerlukan pengetahuan yang mendalam tentang metode analisis klaster.
  2. Efisien untuk Data Berukuran Besar: K-Means memiliki kompleksitas waktu yang relatif rendah, membuatnya efisien untuk data dengan ukuran besar. Ini memungkinkan penggunaan K-Means dalam analisis klaster untuk dataset yang besar tanpa menghabiskan banyak sumber daya komputasi.
  3. Konvergen dengan Cepat: Algoritma K-Means cenderung konvergen dengan cepat, terutama jika titik awal yang baik dipilih. Biasanya, dalam beberapa iterasi, algoritma akan mencapai keadaan di mana tidak ada perubahan signifikan dalam pengelompokan objek.
  4. Skalabilitas: K-Means dapat dengan mudah diubah untuk menangani data dengan fitur yang tinggi. Dalam hal ini, dapat digunakan metode reduksi dimensi sebelum menerapkan K-Means untuk mengatasi masalah kutu dimensi (curse of dimensionality).

Selain memiliki kelebihan, Analisis Cluster K-Means juga memiliki kekurangan, diantaranya :

  1. Sensitif terhadap Inisialisasi Pusat Klaster Awal: Hasil yang diperoleh dari K-Means dapat bervariasi tergantung pada inisialisasi pusat klaster awal yang dipilih. Pilihan yang buruk dapat mengarah pada konvergensi yang lambat atau hasil yang tidak optimal.
  2. Memerlukan Pemilihan Jumlah Klaster yang Tepat: K-Means memerlukan pengguna untuk menentukan jumlah klaster (K) sebelumnya. Pemilihan yang salah dari jumlah klaster dapat menghasilkan klasterisasi yang tidak optimal atau tidak bermakna.
  3. Rentan terhadap Data yang Mengandung Pencilan (Outlier): K-Means rentan terhadap data yang mengandung pencilan (outlier) karena algoritma cenderung menarik pusat klaster ke arah data yang jarang. Pencilan dapat mempengaruhi pengelompokan objek secara signifikan dan menghasilkan hasil yang tidak akurat.
  4. Bergantung pada Bentuk dan Ukuran Klaster yang Seragam: K-Means mengasumsikan bahwa klaster memiliki bentuk dan ukuran yang seragam. Oleh karena itu, ketika klaster memiliki bentuk yang kompleks atau ukuran yang berbeda, K-Means mungkin tidak menghasilkan pengelompokan yang optimal.
  5.  

BERIKUT CARA ANALISIS CLUSTER K-MEANS DI SPSS:

  • Siapkan tabulasi data di Excel, lalu input data atau masukan data ke SPSS pada Page Data View.
  • Jangan lupa isikan juga pada Page Variable View.
  • Selanjutnya melakukan Analisis Cluster K-Means, dengan cara pilih Analyze – Clasify – K-Means Cluster
  • Muncul kotak dialog Analisis Cluster K-Means, seperti ini :
  • Masukan Variabel Crypto, Deposito, Reksadana, Obligasi, Emas dan Saham ke kolom Variables, sedangkan Responden ke kolom Label Cases By, selanjutnya isikan jumlah Cluster yang ingin dibuat pada kolom Number Of Cluster.
  • Selanjutnya pilih Save, Ceklis Cluster Membership lalu pilih Continue
  • Selanjutnya pilih Options, Ceklis Initial Cluster Centers, ANOVA Table dan Cluster Information For Each Case lalu pilih Continue dan OK.
  • Keluar Output SPSS (1) untuk Analisis Cluster K-Means:
  • Interpretasi Output SPSS (1) Analisis Cluster K-Means:
  • Cluster 1 berisikan Emas dan Saham
  • Cluster 2 berisikan Crypto.
  • Cluster 3 berisikan Deposito, Reksadana dan Obligasi
  • Note:

Pada output diatas, kawan-kawan semua bisa fokus pada angka yang paling tinggi di tiap instrumen (Kolom Merah), angka yang paling tinggi tersebut mengindikasikan instrumen investasi masuk di suatu cluster tertentu.

  • Keluar Output SPSS (2) untuk Analisis Cluster K-Means:
  • Interpretasi Output SPSS (2) Analisis Cluster K-Means:

Semua Instrumen Investasi memiliki Nilai Sig. (<0.05) maka bisa diartikan bahwa semua instrumen investasi dapat digunakan untuk membedakan tiap cluster.

  • Keluar Output SPSS (3) untuk Analisis Cluster K-Means:
  • Interpretasi Output SPSS (3) Analisis Cluster K-Means:
  • Cluster 1 berisikan 18 Responden
  • Cluster 2 berisikan 31 Responden
  • Cluster 3 berisikan 51 Responden
  • Note:

Pada output diatas, memberikan informasi tentang jumlah responden yang masuk ke dalam beberapa Cluster.

LINK VIDEO TUTORIAL AS28 GROUP

ANALISIS CLUSTER HIRARKI DI SPSS

ANALISIS CLUSTER K-MEANS DI SPSS

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *