Regresi Linear: Pengertian, Rumus, Contoh, dan Cara Menghitung
Regresi linear adalah salah satu metode statistik yang digunakan untuk memodelkan hubungan antara dua variabel atau lebih. Metode ini banyak digunakan dalam prediksi, analisis data, machine learning, hingga pengambilan keputusan bisnis.
Artikel ini membahas pengertian, jenis, rumus, contoh kasus, hingga cara menghitung regresi linear secara manual dan menggunakan Python.
â Apa Itu Regresi Linear?
Regresi linear adalah metode analisis statistika untuk memprediksi nilai suatu variabel (variabel dependen/Y) berdasarkan variabel lain (variabel independen/X).
Model regresi linear menghasilkan garis lurus yang merepresentasikan hubungan antara X dan Y.
Contoh penggunaan:
-
Memprediksi penjualan berdasarkan biaya iklan
-
Mengestimasi berat badan berdasarkan tinggi badan
-
Menentukan hubungan jumlah jam belajar terhadap nilai ujian
-
Prediksi harga rumah berdasarkan luas tanah
đ Jenis-Jenis Regresi Linear
1. Regresi Linear Sederhana (Simple Linear Regression)
Menggunakan satu variabel X untuk memprediksi Y.
Bentuk persamaan:
2. Regresi Linear Berganda (Multiple Linear Regression)
Menggunakan dua atau lebih variabel X.
Bentuk persamaan:
đ§Ž Rumus Regresi Linear Sederhana
Untuk mencari slope (b) dan intercept (a):
Model akhirnya:
đ Contoh Soal Regresi Linear
Data hubungan jam belajar (X) dan nilai ujian (Y):
| Jam Belajar (X) | Nilai (Y) |
|---|---|
| 1 | 50 |
| 2 | 55 |
| 3 | 65 |
| 4 | 70 |
| 5 | 75 |
1. Hitung nilai b (kemiringan)
Hitung ΣX, ΣY, ΣXY, ΣX²:
-
ÎŁX = 1+2+3+4+5 = 15
-
ÎŁY = 50+55+65+70+75 = 315
-
ÎŁXY = 1(50)+2(55)+3(65)+4(70)+5(75) = 1130
-
ΣX² = 1²+2²+3²+4²+5² = 55
-
n = 5
Masukkan ke rumus:
2. Hitung nilai a (intercept)
3. Persamaan regresi
4. Prediksi nilai jika belajar 6 jam
Artinya, jika seseorang belajar 6 jam, nilai ujian yang diprediksi adalah 118.5 (dibulatkan menjadi 100 jika skala maksimal 100).
đ Regresi Linear Menggunakan Python (Scikit-Learn)
âď¸ Kelebihan Regresi Linear
-
Mudah dipahami dan diimplementasikan
-
Cepat dan efisien
-
Cocok untuk prediksi awal
-
Visualisasi sederhana (garis lurus)
â Kekurangan Regresi Linear
-
Tidak cocok untuk hubungan non-linear
-
Sensitif terhadap outlier
-
Asumsi harus dipenuhi (normalitas, homogenitas, linearitas)
-
Tidak tepat jika multikolinearitas tinggi