Penelitian ini membandingkan dan menganalisis kinerja algoritma load balancing shortest expected delay dan Least Connection untuk Web Server menggunakan Kube-Proxy di Kubernetes. Peningkatan jumlah pengguna dan perubahan jumlah node pekerja yang mempengaruhi kinerja system menjadi focus penelitian ini. Hasil penelitian menunjukkan bahwa pada parameter elapsed time, shortest expected delay dengan memiliki waktu yaitu 216.295 ms. Dalam waktu pemrosesan server, shortest expected delay lebih baik dengan menghasilkan 214.257ms. Throughput saat menggunakan algoritma shortest expected delay lebih besar, rata-rata 560.256 paket/detik. Algoritma Least Connection lebih baik dengan memiliki efisiensi 35,24% dalam hal penggunaan CPU, dibandingkan shortest expected delay. Meningkatkan klaster dari dua node pekerja menjadi empat node pekerja menghasilkan pengurangan waktu pemrosesan server yang signifikan, yang berarti penyeimbangan beban menggunakan 4 node pekerja lebih efektif.