Data: https://www.kaggle.com/datasets/nikhil7280/student-performance-multiple-linear-regression/data
Variabel Penjelas atau Independen (X):
- Hours_studied : Jumlah total jam yang dihabiskan untuk belajar oleh setiap siswa.
- Previous_score : Nilai yang diperoleh siswa dalam tes sebelumnya.
- Extracurricular Activities : Apakah siswa berpartisipasi dalam kegiatan ekstrakurikuler (Ya atau Tidak).
- Sleep_hours : Jumlah rata-rata jam tidur siswa per hari.
- Sample_question : Jumlah contoh soal yang telah dikerjakan oleh siswa.
Variabel Target atau Respon (Y): Performance_index: Ukuran performa atau nilai akhir keseluruhan dari setiap siswa. Indeks kinerja mewakili performa akademik siswa dan telah dibulatkan ke bilangan bulat terdekat. Indeks ini berkisar antara 10 hingga 100, dengan nilai yang lebih tinggi menunjukkan kinerja yang lebih baik.
MODEL: OLS (Ordinary Least Squares regression)
Question:
-
Apakah siswa yang belajar lebih lama cenderung mendapatkan nilai yang lebih baik? Jawab: korelasi: 0,37 cukup berpengaruh maka bisa dikatakan siswa yang belajar lebih lama cenderung mendapatkan nilai yang lebih baik.
-
Bagaimana pengaruh jumlah jam tidur terhadap nilai siswa? Jawab: Korelasi: 0,05 sangat lemah, lamanya tidur seorang siswa tidak berpengaruh terhadap nilai akhir. Karena kemungkinan waktu yang ada (selain tidur) digunakan secara produktif (fokus belajar) oleh siswa tersebut.
-
Apakah siswa yang aktif dalam kegiatan ekstrakurikuler mendapatkan nilai yang lebih baik? Jawab: Siswa yg tidak mengikuti kegiatan ekstrakuliker lebih banyak daripada yang mengikuti. Koefisien regresi positif, siswa yang aktif dalam kegiatan ekstrakurikuler mendapatkan nilai yang lebih baik.
-
Apakah siswa yang mengerjakan lebih banyak soal latihan mendapatkan nilai yang lebih tinggi? Jawab: nilai korelasi: 0,04. Banyaknya jumlah latihan soal yg dikerjakan oleh siswa (dalam set soal) tidak berpengaruh terhadap nilai akhir siswa. Ini kemungkinan bahwa siswa yg sudah mengerjakan beberapa set soal latihan kurang fit/sehat pada saat mengerjakan soal-soal ujian akhir atau soal latihan sangat berbeda dengan soal ujian akhir.
-
Apakah nilai siswa sebelumnya mempengaruhi nilai akhir mereka? Jawab: sangat berpengaruh, karena nilai korelasi yang tinggi, menandakan bahwa performa nilai akhir siswa a/d adalah akumulasi atau total dari nilai tugas harian dan UTS siswa.
-
Berapa rata-rata nilai siswa di kelas? Jawab: Rata-rata nilai akhir (Performance Index) dari 10.000 siswa tersebut hanya 55,22.
-
Bagaimana distribusi nilai di antara siswa dalam dataset ini? Jawab: dari 10.000 siswa, mayoritas siswa memperoleh nilai ujian akhir (Performance Index) rentang 40 - 80.
-
Apakah ada batas optimal untuk jam belajar atau tidur yang dapat membantu siswa mencapai performa terbaik? Jawab: karena berkorelasi positif maka hubungan searah, artinya semakin lama dan mengoptimalkan waktu mereka belajar atau tidur, maka dapat membantu siswa mencapai performa terbaik untuk jam belajar. Dari histogram sebaran data, mayoritas lama belajar siswa sekitar 2-4 dan 6-8 jam. Namun, ada beberapa siswa yg bisa belajar > 8 jam. Sedangkan untuk lama tidur, kebanyakan siswa tidur 8-9 jam per harinya. Tapi, ada beberapa siswa yg tidur hanya 4 jam dalam sehari.
NOTE:
- Please note that this dataset is synthetic and created for illustrative purposes. The relationships between the variables and the performance index may not reflect real-world scenarios (dataset not real)
- disarankan untuk menggunakan software SPSS untuk mengecek data pencilan dan amatan berpengaruh.