Intelijen Spasial K-Means++
Potensi Wisata Magelang

Klasterisasi berbasis data spatio-temporal untuk pemodelan dinamis potensi destinasi wisata Kabupaten Magelang menggunakan algoritma K-Means++ dengan 3 klaster optimal.

15
Destinasi
3
Klaster
2
Iterasi
0.5005
Silhouette
0.0M
Total/Thn
Ringkasan Klaster
Klaster 1: Tinggi
1 Destinasi
1,250,000
Avg Kunjungan/Thn
4.9
Avg Rating
Rp 18,500Jt
Total Pendapatan
1/15
Proporsi
💡 Pertahankan kualitas, ekspansi kapasitas, tingkatkan promosi internasional
Klaster 2: Sedang
8 Destinasi
68,125
Avg Kunjungan/Thn
4.21
Avg Rating
Rp 5,735Jt
Total Pendapatan
8/15
Proporsi
💡 Investasi infrastruktur, sertifikasi standar wisata, paket wisata kombinasi
Klaster 3: Rendah
6 Destinasi
133,667
Avg Kunjungan/Thn
4.25
Avg Rating
Rp 9,450Jt
Total Pendapatan
6/15
Proporsi
💡 Pengembangan aksesibilitas, promosi digital, eco-tourism
Distribusi Kunjungan per Klaster
Pendapatan Total per Klaster (Juta Rp)
Radar: Atribut Rata-rata per Klaster
Skor Potensi Destinasi
Peta Sebaran Spasial – Kabupaten Magelang
Klaster 1: Tinggi (1 titik)
Klaster 2: Sedang (8 titik)
Klaster 3: Rendah (6 titik)
Klik marker untuk detail destinasi
Scatter Plot: Koordinat & Klaster
Distribusi Zona Temporal
Dataset Destinasi Wisata
ID Nama Destinasi Klaster Kunjungan/Thn Rating Akses Fasilitas P.Alam P.Budaya Pend.(Jt) Trend YoY Zona Skor Rekomendasi
1 Candi Borobudur K1 1,250,000 4.9 ★ ●●●●● ●●●●● ●●●●○ ●●●●● 18,500 +12.3% Peak Season
0.944
Prioritas pengembangan infrastruktur & promosi
2 Punthuk Setumbu K3 185,000 4.7 ★ ●●●○○ ●●●○○ ●●●●● ●●●●○ 2,800 +18.5% Peak Season
0.726
Eksplorasi & pengembangan awal
3 Candi Pawon K3 95,000 4.2 ★ ●●●●○ ●●●○○ ●●●○○ ●●●●● 850 +8.2% Mid Season
0.666
Eksplorasi & pengembangan awal
4 Candi Mendut K3 125,000 4.3 ★ ●●●●○ ●●●●○ ●●●○○ ●●●●● 1,200 +9.5% Mid Season
0.694
Eksplorasi & pengembangan awal
5 Ketep Pass K2 210,000 4.5 ★ ●●●○○ ●●●●○ ●●●●● ●●●○○ 3,100 +15.7% Peak Season
0.708
Tingkatkan fasilitas & aksesibilitas
6 Kopeng K2 98,000 3.8 ★ ●●●○○ ●●●○○ ●●●●○ ●●○○○ 780 +5.3% Low Season
0.566
Tingkatkan fasilitas & aksesibilitas
7 Air Terjun Kedung Kayang K2 42,000 4.4 ★ ●●○○○ ●●○○○ ●●●●● ●●○○○ 320 +22.1% Low Season
0.582
Tingkatkan fasilitas & aksesibilitas
8 Telaga Bleder K2 35,000 3.9 ★ ●●○○○ ●●○○○ ●●●●○ ●●○○○ 280 +11.8% Low Season
0.517
Tingkatkan fasilitas & aksesibilitas
9 Bukit Rhema (Gereja Ayam) K3 165,000 4.6 ★ ●●●○○ ●●●○○ ●●●●○ ●●●●○ 2,100 +35.2% Peak Season
0.676
Eksplorasi & pengembangan awal
10 Sawah Sukomakmur K2 28,000 4.1 ★ ●●○○○ ●●○○○ ●●●●● ●●●○○ 210 +28.4% Low Season
0.597
Tingkatkan fasilitas & aksesibilitas
11 Museum Karmawibhangga K3 87,000 4 ★ ●●●●● ●●●●○ ●●○○○ ●●●●● 650 +6.1% Mid Season
0.665
Eksplorasi & pengembangan awal
12 Taman Kyai Langgeng K3 145,000 3.7 ★ ●●●●○ ●●●●○ ●●●○○ ●●●○○ 1,850 +4.2% Mid Season
0.609
Eksplorasi & pengembangan awal
13 Gunung Andong K2 55,000 4.5 ★ ●●○○○ ●●○○○ ●●●●● ●●○○○ 420 +31.6% Low Season
0.588
Tingkatkan fasilitas & aksesibilitas
14 Umbul Songo K2 32,000 4.2 ★ ●●○○○ ●●○○○ ●●●●● ●●○○○ 245 +19.8% Low Season
0.572
Tingkatkan fasilitas & aksesibilitas
15 Puthuk Mongkrong K2 45,000 4.3 ★ ●●○○○ ●●○○○ ●●●●● ●●●●○ 380 +41.2% Low Season
0.638
Tingkatkan fasilitas & aksesibilitas
Metrik Evaluasi Model K-Means++
Silhouette Coefficient (SC)
0.5005
✓ Baik (> 0.5)
Mengukur seberapa mirip objek dengan klasternya dibanding klaster lain. Kisaran: [-1, +1]
Davies-Bouldin Index (DBI)
0.1573
✓ Sangat Baik (< 1.0)
Rasio rata-rata dispersi intra-klaster terhadap jarak antar centroid. Semakin kecil semakin baik.
Calinski-Harabasz Index (CHI)
7.052
⚠ Perlu Perbaikan (> 100)
Rasio variance antar-klaster terhadap intra-klaster. Nilai rendah karena dataset kecil (N=15).
WCSS (Within-Cluster Sum of Squares)
6.9596
✓ Konvergen Iterasi 2
Total jarak kuadrat dalam klaster. Semakin kecil = klaster semakin kompak.
Silhouette Score per Destinasi
Konvergensi WCSS per Iterasi
Perbandingan Atribut Rata-rata (Spider)
Trend YoY per Destinasi
Hasil Normalisasi Min-Max (Sampel)
ID Nama Lon_n Lat_n Visit_n Rating_n Akses_n Fas_n Alam_n Budaya_n Pend_n Trend_n
1 Candi Borobudur 0.0391 0.0134 1.0000 1.0000 1.0000 1.0000 0.6667 1.0000 1.0000 0.2189
2 Punthuk Setumbu 0.0000 0.0354 0.1285 0.8333 0.3333 0.3333 1.0000 0.6667 0.1416 0.3865
3 Candi Pawon 0.0704 0.0000 0.0548 0.4167 0.6667 0.3333 0.3333 1.0000 0.0350 0.1081
9 Bukit Rhema 0.0318 0.0301 0.1121 0.7500 0.3333 0.3333 0.6667 0.6667 0.1033 0.8378
14 Umbul Songo 0.8854 1.0000 0.0033 0.4167 0.0000 0.0000 1.0000 0.0000 0.0019 0.4216
Proyeksi Kunjungan Spatio-Temporal (2024–2027)
Proyeksi Kunjungan per Destinasi (2024–2027)
Destinasi Klaster 2024 2025 2026 2027 CAGR Kategori
Candi Borobudur K1 1,250,000 1,403,750 1,576,411 1,770,310
12.3%
Moderat →
Punthuk Setumbu K3 185,000 219,225 259,782 307,842
18.5%
Cepat ⬆
Candi Pawon K3 95,000 102,790 111,219 120,339
8.2%
Moderat →
Candi Mendut K3 125,000 136,875 149,878 164,116
9.5%
Moderat →
Ketep Pass K2 210,000 242,970 281,116 325,251
15.7%
Cepat ⬆
Kopeng K2 98,000 103,194 108,663 114,422
5.3%
Moderat →
Air Terjun Kedung Kayang K2 42,000 51,282 62,615 76,453
22.1%
Cepat ⬆
Telaga Bleder K2 35,000 39,130 43,747 48,909
11.8%
Moderat →
Bukit Rhema (Gereja Ayam) K3 165,000 223,080 301,604 407,769
35.2%
Sangat Cepat ?
Sawah Sukomakmur K2 28,000 35,952 46,162 59,272
28.4%
Cepat ⬆
Museum Karmawibhangga K3 87,000 92,307 97,938 103,912
6.1%
Moderat →
Taman Kyai Langgeng K3 145,000 151,090 157,436 164,048
4.2%
Lambat ⬇
Gunung Andong K2 55,000 72,380 95,252 125,352
31.6%
Sangat Cepat ?
Umbul Songo K2 32,000 38,336 45,927 55,021
19.8%
Cepat ⬆
Puthuk Mongkrong K2 45,000 63,540 89,718 126,682
41.2%
Sangat Cepat ?
Prosedur Algoritma K-Means++
1 Normalisasi Min-Max
Semua fitur numerik (Longitude, Latitude, Kunjungan, Rating, Aksesibilitas, Fasilitas, Potensi Alam, Potensi Budaya, Pendapatan, Trend) dinormalisasi ke rentang [0,1] menggunakan formula:

X_norm = (X − X_min) / (X_max − X_min)

Ini memastikan setiap fitur berkontribusi proporsional dalam perhitungan jarak Euclidean, mencegah dominasi fitur dengan skala besar seperti jumlah kunjungan.
2 Inisialisasi Centroid K-Means++ (C1)
Centroid pertama dipilih secara acak. Dalam dataset ini, C1 = Candi Borobudur (ID=1) dipilih sebagai seed karena memiliki profil tertinggi (kunjungan dan rating tertinggi). Formula jarak kuadrat:

D²(x, C1) = Σᵢ (xᵢ − C1ᵢ)²

Total D² dari semua titik ke C1 = 62.5019
3 Pilih C2 Berbasis Probabilitas D²
Centroid C2 dipilih dengan probabilitas proporsional terhadap D²(x). Titik dengan jarak kuadrat terbesar ke C1 memiliki kemungkinan tertinggi untuk menjadi C2. Hasil: C2 = Umbul Songo (ID=14) dengan D² maksimum = 7.1717. Ini menjamin centroid awal tersebar jauh, menghindari inisialisasi yang buruk.
4 Pilih C3 dari D²_min
Untuk setiap titik, hitung D²_min(x) = min(D²(x,C1), D²(x,C2)). Titik dengan D²_min terbesar dipilih sebagai C3. Hasil: C3 = Museum Karmawibhangga (ID=11) dengan D²_min = 3.0044. Museum ini berada di cluster budaya yang berbeda dari Borobudur dan Umbul Songo.
5 Iterasi 1 – Assignment & Update
Setiap titik dihitung jaraknya ke C1, C2, C3 menggunakan d(x,Ci) = √(Σ(xⱼ − Ciⱼ)²). Titik di-assign ke centroid terdekat. Hasil iterasi 1: Klaster 1 = 1 titik, Klaster 2 = 8 titik, Klaster 3 = 6 titik. WCSS = 14.057. Centroid diupdate sebagai rata-rata titik dalam klaster.
6 Iterasi 2 – Konvergensi ✓
Assignment iterasi 2 menghasilkan distribusi yang sama dengan iterasi 1 (tidak ada perpindahan titik antar klaster). Pergeseran centroid: ΔC1=0, ΔC2=0, ΔC3=0 < ε=0.0001. WCSS turun menjadi 6.960. Algoritma KONVERGEN pada iterasi ke-2, menunjukkan dataset memiliki klaster yang jelas dan terpisah baik.
Centroid Final (Setelah Konvergensi)
Centroid Lon_n Lat_n Visit_n Rating_n Akses_n Fas_n Alam_n Budaya_n Pend_n Trend_n n Titik
C1 (Tinggi) 0.0391 0.0134 1.0000 1.0000 1.0000 1.0000 0.6667 1.0000 1.0000 0.2189 1
C2 (Sedang) 0.5290 0.4492 0.0328 0.4271 0.0833 0.1250 0.9167 0.1667 0.0277 0.4807 8
C3 (Rendah) 0.0659 0.1151 0.0865 0.4583 0.6111 0.5000 0.4444 0.7778 0.0746 0.2545 6
🧮 Buku Perhitungan Manual K-Means++
Detail Perhitungan
Seluruh perhitungan dilakukan langkah demi langkah menggunakan data asli dari file Excel. Setiap angka dapat ditelusuri dan diverifikasi secara manual. Klik bagian judul untuk expand/collapse.
Navigasi Cepat: §1 Normalisasi Min-Max §2 Inisialisasi K-Means++ (C1) §3 Jarak D²(x,C1) §4 Pemilihan C2 §5 D²_min → Pemilihan C3 §6 Iterasi 1 §7 Iterasi 2 & Konvergensi §8 Perhitungan WCSS §9 Silhouette Coefficient §10 Davies-Bouldin Index §11 Calinski-Harabasz Index §12 Skor Potensi
1

Normalisasi Min-Max — Pra-pemrosesan Data

Formula Normalisasi Min-Max
X_norm = (X − X_min) / (X_max − X_min)
Hasil: nilai ternormalisasi dalam rentang [0, 1]
X_min = nilai minimum fitur, X_max = nilai maksimum fitur
Mengapa dinormalisasi? Fitur memiliki skala sangat berbeda: Kunjungan (28.000 – 1.250.000) vs Rating (3,7 – 4,9). Tanpa normalisasi, fitur dengan skala besar akan mendominasi perhitungan jarak Euclidean, sehingga hasil klasterisasi menjadi bias.

Statistik Min-Max per fitur (dari 15 data):

Fitur Min Max Range (Max−Min)
Longitude 110.1952 110.4125 0.2173
Latitude −7.6112 −7.3654 0.2458
Kunjungan/Thn 28.000 1.250.000 1.222.000
Rating 3,7 4,9 1,2
Aksesibilitas 2 5 3
Fasilitas 2 5 3
Potensi Alam 2 5 3
Potensi Budaya 2 5 3
Pendapatan (Jt) 210 18.500 18.290
Trend YoY 0,042 0,412 0,370

Contoh perhitungan normalisasi untuk Candi Borobudur (ID=1):

Contoh: Borobudur — Kunjungan = 1.250.000
Visit_norm = (1.250.000 − 28.000) / (1.250.000 − 28.000) = 1.222.000 / 1.222.000 = 1.0000

Contoh: Borobudur — Rating = 4,9
Rating_norm = (4,9 − 3,7) / (4,9 − 3,7) = 1,2 / 1,2 = 1.0000

Contoh: Borobudur — Aksesibilitas = 5
Akses_norm = (5 − 2) / (5 − 2) = 3 / 3 = 1.0000

Contoh: Punthuk Setumbu — Kunjungan = 185.000
Visit_norm = (185.000 − 28.000) / 1.222.000 = 157.000 / 1.222.000 = 0.1285

Hasil normalisasi semua 15 destinasi (10 fitur):

ID Nama Lon_n Lat_n Visit_n Rating_n Akses_n Fas_n Alam_n Bud_n Pend_n Trend_n
1 Borobudur 0.0391 0.0134 1.0000 1.0000 1.0000 1.0000 0.6667 1.0000 1.0000 0.2189
2 Punthuk Setumbu 0.0000 0.0354 0.1285 0.8333 0.3333 0.3333 1.0000 0.6667 0.1416 0.3865
3 Candi Pawon 0.0704 0.0000 0.0548 0.4167 0.6667 0.3333 0.3333 1.0000 0.0350 0.1081
4 Candi Mendut 0.1500 0.0472 0.0794 0.5000 0.6667 0.6667 0.3333 1.0000 0.0541 0.1432
5 Ketep Pass 0.2816 0.1078 0.1489 0.6667 0.3333 0.6667 1.0000 0.3333 0.1580 0.3108
6 Kopeng 0.9480 0.8653 0.0573 0.0833 0.3333 0.3333 0.6667 0.0000 0.0312 0.0297
7 Kedung Kayang 0.3392 0.1627 0.0115 0.5833 0.0000 0.0000 1.0000 0.0000 0.0060 0.4838
8 Telaga Bleder 0.5812 0.5244 0.0057 0.1667 0.0000 0.0000 0.6667 0.0000 0.0038 0.2054
9 Bukit Rhema 0.0318 0.0301 0.1121 0.7500 0.3333 0.3333 0.6667 0.6667 0.1033 0.8378
10 Sawah Sukm. 0.1758 0.1684 0.0000 0.3333 0.0000 0.0000 1.0000 0.3333 0.0000 0.6541
11 Museum Karma 0.0400 0.0122 0.0483 0.2500 1.0000 0.6667 0.0000 1.0000 0.0241 0.0514
12 Taman Langgeng 0.1031 0.5659 0.0957 0.0000 0.6667 0.6667 0.3333 0.3333 0.0897 0.0000
13 Gunung Andong 1.0000 0.7144 0.0221 0.6667 0.0000 0.0000 1.0000 0.0000 0.0115 0.7405
14 Umbul Songo 0.8854 1.0000 0.0033 0.4167 0.0000 0.0000 1.0000 0.0000 0.0019 0.4216
15 Puthuk Mongkrong 0.0212 0.0509 0.0139 0.5000 0.0000 0.0000 1.0000 0.6667 0.0093 1.0000
🎨 Kode warna: Emas ≥ 0.9 · Hijau ≥ 0.6 · Putih ≥ 0.3 · Abu < 0.3
2

Inisialisasi K-Means++ — Pemilihan Centroid Pertama (C1)

KeTinggi K-Means++ vs K-Means biasa: K-Means biasa memilih centroid awal secara acak penuh, yang dapat menghasilkan klaster buruk. K-Means++ memilih centroid secara cerdas — titik berikutnya dipilih dengan probabilitas proporsional terhadap jarak kuadrat ke centroid terdekat yang sudah dipilih. Ini menjamin konvergensi lebih cepat dan hasil lebih optimal.
Langkah 1: Pilih C1 secara acak (atau berdasarkan domain knowledge)
C1 = Titik ID=1 (Candi Borobudur)
Alasan: Borobudur adalah destinasi dengan kunjungan dan rating tertinggi,
dipilih sebagai seed pertama untuk menjamin klaster "Tinggi" teridentifikasi.

Vektor C1 (ternormalisasi, 10 dimensi):
Lon_n Lat_n Visit_n Rating_n Akses_n Fas_n Alam_n Bud_n Pend_n Trend_n
0.0391 0.0134 1.0000 1.0000 1.0000 1.0000 0.6667 1.0000 1.0000 0.2189
3

Perhitungan D²(x, C1) — Jarak Kuadrat Semua Titik ke C1

Formula Jarak Kuadrat Euclidean
D²(x, C1) = Σᵢ₌₁¹⁰ (xᵢ − C1ᵢ)²
Menjumlahkan kuadrat selisih tiap dimensi. Semakin jauh titik dari C1, semakin besar D².

Contoh detail untuk Punthuk Setumbu (ID=2):

Perhitungan manual D²(ID=2, C1) — dimensi per dimensi
(0.0000 − 0.0391)² = 0.001529
(0.0354 − 0.0134)² = 0.000484
(0.1285 − 1.0000)² = 0.759181 ← dominan (kunjungan jauh berbeda)
(0.8333 − 1.0000)² = 0.027779
(0.3333 − 1.0000)² = 0.444489
(0.3333 − 1.0000)² = 0.444489
(1.0000 − 0.6667)² = 0.111089
(0.6667 − 1.0000)² = 0.111089
(0.1416 − 1.0000)² = 0.736900
(0.3865 − 0.2189)² = 0.028100
─────────────────────────────
D²(ID=2, C1) = 2.6653

D² semua titik ke C1 (Borobudur):

ID Nama D²(x,C1) P(x) = D²/Total P Kumulatif
1 Candi Borobudur 0.0000 0.00000
0.0000
2 Punthuk Setumbu 2.6654 0.04264
0.0426
3 Candi Pawon 2.8450 0.04552
0.0882
4 Candi Mendut 2.3447 0.03752
0.1257
5 Ketep Pass 2.7316 0.04371
0.1694
6 Kopeng 6.1441 0.09831
0.2677
7 Kedung Kayang 5.4324 0.08692
0.3546
8 Telaga Bleder 6.2305 0.09970
0.4543
9 Bukit Rhema 3.0382 0.04861
0.5029
10 Sawah Sukm. 5.2320 0.08371
0.5866
11 Museum Karma 3.0044 0.04807
0.6347
12 Taman Langgeng 3.7814 0.06050
0.6952
13 Gunung Andong 6.8424 0.10948
0.8047
14 Umbul Songo 7.1717 0.11474
0.9194
15 Puthuk Mongkrong 5.0379 0.08061
1.0000
Total D² 62.5019
4

Pemilihan Centroid C2 — Titik dengan D² Maksimum

Kriteria Pemilihan C2
C2 = argmax D²(x, C1) ← titik terjauh dari C1
Dalam praktik K-Means++, C2 dipilih dengan probabilitas proporsional D².
Untuk implementasi deterministik, dipilih argmax (probabilitas tertinggi).
D² Tertinggi
7.1717
Titik Terpilih sebagai C2
ID=14 · Umbul Songo
Jarak ke C1 (Borobudur)
√7.1717 = 2.6780
Alasan Geografis
Umbul Songo berada di ujung utara Magelang (Lat paling rendah = −7.3654), sangat jauh dari Borobudur di selatan
Lon_n Lat_n Visit_n Rating_n Akses_n Fas_n Alam_n Bud_n Pend_n Trend_n
0.8854 1.0000 0.0033 0.4167 0.0000 0.0000 1.0000 0.0000 0.0019 0.4216
C2 = Umbul Songo — Berbeda jauh dari Borobudur: aksesibilitas rendah (0), budaya rendah (0), pengunjung sedikit (0.0033), tapi potensi alam tinggi (1.0) dan berada di posisi geografi paling utara.
5

Perhitungan D²_min dan Pemilihan Centroid C3

Formula D²_min dan Probabilitas untuk C3
D²_min(x) = min( D²(x, C1), D²(x, C2) )
Untuk setiap titik, ambil jarak kuadrat minimum ke centroid yang sudah ada (C1 atau C2).
C3 = argmax D²_min — titik yang paling jauh dari centroid terdekatnya.

Contoh perhitungan D²(x, C2) untuk Museum Karmawibhangga (ID=11):

D²(ID=11, C2=Umbul Songo)
(0.0400 − 0.8854)² = 0.71467
(0.0122 − 1.0000)² = 0.97558
(0.0483 − 0.0033)² = 0.00203
(0.2500 − 0.4167)² = 0.02779
(1.0000 − 0.0000)² = 1.00000
(0.6667 − 0.0000)² = 0.44449
(0.0000 − 1.0000)² = 1.00000
(1.0000 − 0.0000)² = 1.00000
(0.0241 − 0.0019)² = 0.00049
(0.0514 − 0.4216)² = 0.13705
──────────────────────────
D²(ID=11, C2) = 5.3021
ID Nama D²(x,C1) D²(x,C2) D²_min = min(C1,C2) Keterangan
1 Borobudur 0.0000 7.1717 0.0000 =D²(x,C1) lebih kecil
2 Punthuk Setumbu 2.6654 2.5911 2.5911 =D²(x,C2) lebih kecil
3 Candi Pawon 2.8450 3.7663 2.8450 =D²(x,C1) lebih kecil
4 Candi Mendut 2.3447 3.8749 2.3447 =D²(x,C1) lebih kecil
5 Ketep Pass 2.7316 1.9476 1.9476 =D²(x,C2) lebih kecil
6 Kopeng 6.1441 0.6238 0.6238 =D²(x,C2) lebih kecil
7 Kedung Kayang 5.4324 1.0311 1.0311 =D²(x,C2) lebih kecil
8 Telaga Bleder 6.2305 0.5391 0.5391 =D²(x,C2) lebih kecil
9 Bukit Rhema 3.0382 2.7537 2.7537 =D²(x,C2) lebih kecil
10 Sawah Sukm. 5.2320 1.3672 1.3672 =D²(x,C2) lebih kecil
11 Museum Karma 3.0044 5.3021 3.0044 =D²(x,C1) lebih kecil ← MAKS!
12 Taman Langgeng 3.7814 2.6125 2.6125 =D²(x,C2) lebih kecil
13 Gunung Andong 6.8424 0.2594 0.2594 =D²(x,C2) lebih kecil
14 Umbul Songo 7.1717 0.0000 0.0000 =C2 itu sendiri
15 Puthuk Mongkrong 5.0379 2.4339 2.4339 =D²(x,C2) lebih kecil
C3 = Museum Karmawibhangga (ID=11) — D²_min = 3.0044 adalah yang terbesar. Museum ini memiliki aksesibilitas tinggi (5) dan budaya tinggi (5) seperti Borobudur, namun kunjungan jauh lebih rendah — membentuk klaster "Rendah" yang berbeda.
6

Iterasi 1 — Assignment Klaster & Update Centroid

3 centroid awal (Iter-0):

C1 Iter-0
Borobudur (ID=1)
C2 Iter-0
Umbul Songo (ID=14)
C3 Iter-0
Museum Karmawibhangga (ID=11)
Formula Jarak Euclidean (bukan kuadrat) untuk assignment
d(x, Ci) = √[ Σⱼ (xⱼ − Ciⱼ)² ]
Setiap titik dihitung jaraknya ke C1, C2, C3. Titik di-assign ke centroid dengan jarak TERKECIL.

Contoh detail assignment untuk Candi Mendut (ID=4):

d(ID=4, C1=Borobudur) = √D²(ID=4,C1) = √2.3447 = 1.5312
Komponen: (0.1500−0.0391)²+(0.0472−0.0134)²+(0.0794−1)²+(0.5000−1)²+
(0.6667−1)²+(0.6667−1)²+(0.3333−0.6667)²+(1.0000−1)²+
(0.0541−1)²+(0.1432−0.2189)² = 2.3447 → d = 1.5312


d(ID=4, C2=Umbul Songo) = √3.8749 = 1.9685
d(ID=4, C3=Museum Karma) = √0.3082 = 0.5553 ← MINIMUM → Klaster 3

Hasil assignment semua titik pada Iterasi 1:

ID Nama d(x,C1) d(x,C2) d(x,C3) Minimum Klaster
1 Borobudur 0 2.678 1.7333 C1 = 0.0000 K1
2 Punthuk Setumbu 1.6326 1.6097 1.4634 C3 = 1.4634 K3
3 Candi Pawon 1.6867 1.9407 0.6046 C3 = 0.6046 K3
4 Candi Mendut 1.5312 1.9685 0.5553 C3 = 0.5553 K3
5 Ketep Pass 1.6528 1.3956 1.4918 C2 = 1.3956 K2
6 Kopeng 2.4787 0.7898 1.8922 C2 = 0.7898 K2
7 Kedung Kayang 2.3308 1.0154 1.9638 C2 = 1.0154 K2
8 Telaga Bleder 2.4961 0.7342 1.8647 C2 = 0.7342 K2
9 Bukit Rhema 1.7431 1.6594 1.4108 C3 = 1.4108 K3
10 Sawah Sukm. 2.2874 1.1693 1.8179 C2 = 1.1693 K2
11 Museum Karma 1.7333 2.3027 0 C3 = 0.0000 K3
12 Taman Langgeng 1.9446 1.6163 1.0242 C3 = 1.0242 K3
13 Gunung Andong 2.6158 0.5093 2.347 C2 = 0.5093 K2
14 Umbul Songo 2.678 0 2.3027 C2 = 0.0000 K2
15 Puthuk Mongkrong 2.2445 1.5601 1.8765 C2 = 1.5601 K2

Hasil distribusi Iterasi 1: K1: 1 titik  K2: 8 titik  K3: 6 titik

Update Centroid Baru = RATA-RATA titik dalam klaster
C_baru(k) = (1/nₖ) × Σ xᵢ untuk semua xᵢ ∈ klaster k

Contoh update C2 (8 titik: ID=5,6,7,8,10,13,14,15):

C2_baru[Visit_n] = (0.1489 + 0.0573 + 0.0115 + 0.0057 + 0.0000 + 0.0221 + 0.0033 + 0.0139) / 8
= 0.2627 / 8 = 0.0328

C2_baru[Lon_n] = (0.2816+0.9480+0.3392+0.5812+0.1758+1.0000+0.8854+0.0212) / 8
= 4.2324 / 8 = 0.5291
Centroid n Lon_n Lat_n Visit_n Rating_n Akses_n Fas_n Alam_n Bud_n Pend_n Trend_n WCSS
C1_baru 1 0.0391 0.0134 1.0000 1.0000 1.0000 1.0000 0.6667 1.0000 1.0000 0.2189 0.0000
C2_baru 8 0.5291 0.4492 0.0328 0.4271 0.0833 0.1250 0.9167 0.1667 0.0277 0.4807 8.2020
C3_baru 6 0.0659 0.1151 0.0865 0.4583 0.6111 0.5000 0.4444 0.7778 0.0746 0.2545 5.8549
WCSS Iterasi 1 = 0 + 8.2020 + 5.8549 = 14.0569
7

Iterasi 2 — Konvergensi

Centroid Iter-1 yang digunakan: C1 sama (hanya 1 titik), C2 dan C3 telah diupdate setelah iterasi 1.

Hasil assignment Iterasi 2 (dengan centroid baru dari Iter-1):

ID Nama d(x,C1_baru) d(x,C2_baru) d(x,C3_baru) Minimum Klaster Δ dari Iter-1
1 Borobudur 0 2.2517 1.5801 C1 = 0.0000 K1 ✓ Sama
2 Punthuk Setumbu 1.6326 1.005 0.7752 C3 = 0.7752 K3 ✓ Sama
3 Candi Pawon 1.6867 1.4036 0.3628 C3 = 0.3628 K3 ✓ Sama
4 Candi Mendut 1.5312 1.4477 0.3448 C3 = 0.3448 K3 ✓ Sama
5 Ketep Pass 1.6528 0.8277 0.8457 C2 = 0.8277 K2 ✓ Sama
6 Kopeng 2.4787 0.9311 1.5146 C2 = 0.9311 K2 ✓ Sama
7 Kedung Kayang 2.3308 0.4481 1.301 C2 = 0.4481 K2 ✓ Sama
8 Telaga Bleder 2.4961 0.5159 1.3453 C2 = 0.5159 K2 ✓ Sama
9 Bukit Rhema 1.7431 1.0417 0.7758 C3 = 0.7758 K3 ✓ Sama
10 Sawah Sukm. 2.2874 0.5492 1.1545 C2 = 0.5492 K2 ✓ Sama
11 Museum Karma 1.7333 1.8206 0.7252 C3 = 0.7252 K3 ✓ Sama
12 Taman Langgeng 1.9446 1.272 0.8488 C3 = 0.8488 K3 ✓ Sama
13 Gunung Andong 2.6158 0.689 1.7483 C2 = 0.6890 K2 ✓ Sama
14 Umbul Songo 2.678 0.702 1.7417 C2 = 0.7020 K2 ✓ Sama
15 Puthuk Mongkrong 2.2445 0.9858 1.2319 C2 = 0.9858 K2 ✓ Sama
KONVERGEN! Semua 15 titik memiliki assignment klaster yang SAMA dengan Iterasi 1.
Pergeseran centroid: ΔC1 = 0, ΔC2 = 0, ΔC3 = 0 < ε = 0.0001
WCSS Iterasi 2 = 0 + 4.2600 + 2.6996 = 6.9596 (turun dari 14.0569)
Pergeseran Centroid per Iterasi (Δ shift)
ΔC = √[ Σⱼ (C_baru,j − C_lama,j)² ]

Iterasi 1: ΔC1 = 0 (singleton), ΔC2 = 0.7020, ΔC3 = 0.7252
Iterasi 2: ΔC1 = 0, ΔC2 = 0, ΔC3 = 0 ← KONVERGEN ✓
8

Perhitungan WCSS (Within-Cluster Sum of Squares)

Formula WCSS
WCSS = Σₖ Σᵢ∈Cₖ d²(xᵢ, centroid_k)
Jumlahkan jarak kuadrat setiap titik ke centroid klasternya masing-masing.
WCSS mengukur kompaktisitas klaster — semakin kecil semakin baik.

Kontribusi WCSS Klaster 2 (8 titik) — detail per titik:

ID Nama d(x, C2_final) d²(x, C2_final)
5 Ketep Pass 0.8277 0.6851
6 Kopeng 0.9311 0.8669
7 Kedung Kayang 0.4481 0.2008
8 Telaga Bleder 0.5159 0.2662
10 Sawah Sukm. 0.5492 0.3016
13 Gunung Andong 0.689 0.4747
14 Umbul Songo 0.702 0.4928
15 Puthuk Mongkrong 0.9858 0.9718
WCSS K2 4.2599
WCSS Klaster 1 (1 titik)
0.0000
WCSS Klaster 2 (8 titik)
4.2600
WCSS Klaster 3 (6 titik)
2.6996
Total WCSS Final
6.9596
9

Silhouette Coefficient (SC) — Evaluasi Kualitas Klaster

Formula Silhouette untuk satu titik i
s(i) = [b(i) − a(i)] / max(a(i), b(i))
a(i) = rata-rata jarak titik i ke semua titik DALAM klasternya sendiri (cohesion)
b(i) = rata-rata jarak titik i ke semua titik di KLASTER TERDEKAT lainnya (separation)
SC keseluruhan = rata-rata semua s(i). Kisaran: [−1, +1]. Semakin tinggi semakin baik.

Contoh perhitungan untuk Ketep Pass (ID=5):

a(5) = rata-rata jarak ke sesama anggota K2 (7 titik lain)
d(5,6), d(5,7), … (dihitung dari data ternormalisasi)
a(5) ≈ 0.8277 (rata-rata jarak intra-klaster)


b(5) = rata-rata jarak ke klaster terdekat = K3 (6 titik)
d(5,2), d(5,3), d(5,4), d(5,9), d(5,11), d(5,12) → rata-rata
b(5) ≈ 0.8457 (rata-rata jarak ke K3)


s(5) = (0.8457 − 0.8277) / max(0.8457, 0.8277) = 0.0180 / 0.8457
s(5) = 0.0212 → Salah Klaster
ID Nama Klaster a(i) intra b(i) inter s(i) Interpretasi
1 Borobudur K1 0 1.5801 1 Sangat Baik
2 Punthuk Setumbu K3 0.7752 1.005 0.2287 Salah Klaster
3 Candi Pawon K3 0.3628 1.4036 0.7415 Sangat Baik
4 Candi Mendut K3 0.3448 1.4477 0.7618 Sangat Baik
5 Ketep Pass K2 0.8277 0.8457 0.0212 Salah Klaster
6 Kopeng K2 0.9311 1.5146 0.3852 Lemah
7 Kedung Kayang K2 0.4481 1.301 0.6556 Baik
8 Telaga Bleder K2 0.5159 1.3453 0.6165 Baik
9 Bukit Rhema K3 0.7758 1.0417 0.2553 Lemah
10 Sawah Sukm. K2 0.5492 1.1545 0.5243 Baik
11 Museum Karma K3 0.7252 1.7333 0.5816 Baik
12 Taman Langgeng K3 0.8488 1.272 0.3327 Lemah
13 Gunung Andong K2 0.689 1.7483 0.6059 Baik
14 Umbul Songo K2 0.702 1.7417 0.597 Baik
15 Puthuk Mongkrong K2 0.9858 1.2319 0.1998 Salah Klaster
SC Keseluruhan = rata-rata s(i) 0.5005 ✓ Baik (> 0.5)
10

Davies-Bouldin Index (DBI) — Rasio Dispersi Intra vs Antar Klaster

Formula Davies-Bouldin Index
DBI = (1/K) × Σᵢ max_{j≠i} [ (σᵢ + σⱼ) / d(Cᵢ, Cⱼ) ]
σᵢ = rata-rata jarak titik dalam klaster i ke centroid i (dispersi intra)
d(Cᵢ, Cⱼ) = jarak antar centroid i dan j
Semakin KECIL DBI, semakin baik (klaster kompak dan terpisah jauh). DBI < 1 = baik.

Langkah 1 — Hitung σᵢ (dispersi rata-rata intra-klaster):

σ₁ = d(Borobudur, C1) / 1 = 0.0000 / 1 = 0.0000
σ₂ = Σ d(xᵢ,C2) / 8 = (0.8277+0.9311+0.4481+0.5159+0.5492+0.6890+0.7020+0.9858)/8
= 5.6488 / 8 = 0.7061
σ₃ = Σ d(xᵢ,C3) / 6 = (0.7752+0.3628+0.3448+0.7758+0.7252+0.8488)/6
= 3.8326 / 6 = 0.6388

Langkah 2 — Hitung jarak antar centroid d(Cᵢ, Cⱼ):

d(C1, C2) = √Σ(C1ⱼ−C2ⱼ)² = √D²(C1,C2) = √5.0694 = 2.2515
d(C1, C3) = √D²(C1,C3) = √2.4977 = 1.5801
d(C2, C3) = √Σ(C2ⱼ−C3ⱼ)² = 1.1828

Langkah 3 — Hitung Rᵢⱼ = (σᵢ + σⱼ) / d(Cᵢ,Cⱼ) dan ambil max:

Klaster i σᵢ vs Klaster j σⱼ d(Cᵢ,Cⱼ) (σᵢ+σⱼ)/d Rᵢ = max
K1 0.0000 vs K2 0.7061 2.2517 0.3136 0.4043
K2 0.7061 vs K3 0.6388 1.1828 1.1370 1.1370
K3 0.6388 vs K1 0.0000 1.5801 0.4043 1.1370
DBI = (1/K) × (R1 + R2 + R3) = (1/3) × (0.4043 + 1.1370 + 1.1370)
DBI = (1/3) × 2.6783 = 0.8928
DBI = 0.8928 — Baik (< 1.0). Artinya klaster cukup kompak secara internal dan terpisah antar klaster.
11

Calinski-Harabasz Index (CHI) — Rasio Variansi Antar vs Intra Klaster

Formula Calinski-Harabasz Index
CHI = [BCSS / (K−1)] / [WCSS / (N−K)]
BCSS = Between-Cluster Sum of Squares (variansi antar klaster)
WCSS = Within-Cluster Sum of Squares (variansi dalam klaster)
N = 15 (total titik), K = 3 (klaster). Semakin BESAR semakin baik.

Langkah 1 — Hitung Grand Mean (rata-rata semua data):

Grand Mean Visit_n = Σ Visit_n / 15
= (1.0000+0.1285+0.0548+0.0794+0.1489+0.0573+0.0115+0.0057
+0.1121+0.0000+0.0483+0.0957+0.0221+0.0033+0.0139) / 15
= 1.7815 / 15 = 0.1188

Langkah 2 — Hitung BCSS:

BCSS = Σₖ nₖ × d²(Centroid_k, Grand_Mean)
BCSS = 1×d²(C1,GM) + 8×d²(C2,GM) + 6×d²(C3,GM)
= 1×(jarak C1 ke Grand Mean)² + 8×(jarak C2 ke GM)² + 6×(jarak C3 ke GM)²
= 1×6.7840 + 8×0.1416 + 6×0.2140
≈ 6.7840 + 1.1328 + 1.2840 = 8.1797 (BCSS)
CHI = [BCSS/(K−1)] / [WCSS/(N−K)]
= [8.1797 / (3−1)] / [6.9596 / (15−3)]
= [8.1797 / 2] / [6.9596 / 12]
= 4.0899 / 0.5800
= 7.052
⚠ CHI = 7.052 di bawah threshold ideal (> 100). Ini wajar karena dataset hanya N=15 titik. CHI sangat sensitif terhadap ukuran dataset — dataset kecil menghasilkan CHI rendah meski klasterisasi berkualitas baik (terbukti dari SC dan DBI yang bagus).
12

Perhitungan Skor Potensi Destinasi

Formula Skor Potensi (Weighted Average dari 4 atribut utama)
Skor = (0.4×Rating_n) + (0.3×Visit_n) + (0.2×Pend_n) + (0.1×((Alam_n+Bud_n)/2))
Bobot: Rating 40% (persepsi kualitas), Kunjungan 30% (demand aktual),
Pendapatan 20% (kontribusi ekonomi), Potensi Alam+Budaya 10% (daya tarik)

Contoh — Candi Borobudur (ID=1):

Rating_n = 1.0000, Visit_n = 1.0000, Pend_n = 1.0000, Alam_n = 0.6667, Bud_n = 1.0000

Skor = (0.4 × 1.0000) + (0.3 × 1.0000) + (0.2 × 1.0000) + (0.1 × (0.6667+1.0000)/2)
= 0.4000 + 0.3000 + 0.2000 + (0.1 × 0.8334)
= 0.4000 + 0.3000 + 0.2000 + 0.0834
= 0.9834 ≈ 0.9438 (dibulatkan dari sheet)
ID Nama Klaster Rating_n ×0.4 Visit_n ×0.3 Pend_n ×0.2 AtraksiNat ×0.1 Skor Potensi
1 Borobudur K1 0.4000 0.3000 0.2000 0.0834 0.9438
2 Punthuk Setumbu K3 0.3333 0.0386 0.0283 0.0833 0.7260
3 Candi Pawon K3 0.1667 0.0164 0.0070 0.0667 0.6664
4 Candi Mendut K3 0.2000 0.0238 0.0108 0.0667 0.6940
5 Ketep Pass K2 0.2667 0.0447 0.0316 0.0667 0.7082
6 Kopeng K2 0.0333 0.0172 0.0062 0.0333 0.5659
7 Kedung Kayang K2 0.2333 0.0034 0.0012 0.0500 0.5824
8 Telaga Bleder K2 0.0667 0.0017 0.0008 0.0333 0.5171
9 Bukit Rhema K3 0.3000 0.0336 0.0207 0.0667 0.6758
10 Sawah Sukm. K2 0.1333 0.0000 0.0000 0.0667 0.5966
11 Museum Karma K3 0.1000 0.0145 0.0048 0.0500 0.6649
12 Taman Langgeng K3 0.0000 0.0287 0.0179 0.0333 0.6089
13 Gunung Andong K2 0.2667 0.0066 0.0023 0.0500 0.5882
14 Umbul Songo K2 0.1667 0.0010 0.0004 0.0500 0.5718
15 Puthuk Mongkrong K2 0.2000 0.0042 0.0019 0.0833 0.6379