Analisis dan Prediksi Harga Saham Sektor Energi Terbarukan
Laporan ini menyajikan analisis komprehensif dan pemodelan prediktif untuk harga saham dari tiga perusahaan terkemuka di sektor Energi Baru dan Terbarukan (EBT) Indonesia: PT Barito Renewables Energy Tbk (BREN.JK), PT Pertamina Geothermal Energy Tbk (PGEO.JK), dan PT Kencana Energi Lestari Tbk (KEEN.JK).
- EBT
- Energi Baru dan Terbarukan. Sektor industri yang berfokus pada sumber energi berkelanjutan.
- RNN (Recurrent Neural Network)
- Keluarga arsitektur jaringan saraf yang dirancang untuk data sekuensial atau deret waktu, memiliki "ingatan" dari langkah sebelumnya.
- LSTM (Long Short-Term Memory)
- Jenis arsitektur RNN yang mampu mempelajari dependensi jangka panjang, efektif untuk data deret waktu.
- GRU (Gated Recurrent Unit)
- Varian dari LSTM yang lebih sederhana dengan performa yang seringkali setara, namun lebih efisien secara komputasi.
- LSTM-GRU
- Model hybrid yang menggabungkan LSTM dan GRU secara bertingkat. LSTM pertama menangkap pola jangka panjang, kemudian GRU mengolah output tersebut untuk prediksi yang lebih efisien.
- Deep Learning
- Sub-bidang dari machine learning yang menggunakan jaringan saraf dengan banyak lapisan (lapisan dalam/"deep") untuk mempelajari pola kompleks dari data.
- EDA (Analisis Data Eksploratif)
- Proses investigasi awal pada data untuk menemukan pola, anomali, dan wawasan utama melalui statistik dan visualisasi.
- Pra-pemrosesan (Pre-processing)
- Tahap persiapan data mentah (seperti normalisasi dan pembuatan sekuens) agar sesuai untuk model machine learning.
- SMA (Simple Moving Average)
- Indikator teknikal yang menghaluskan data harga untuk membentuk garis tren dengan menghitung rata-rata harga selama periode tertentu.
- RMSE (Root Mean Squared Error)
- Metrik evaluasi yang mengukur rata-rata besarnya kesalahan prediksi, memberikan bobot lebih pada kesalahan yang besar.
- MAPE (Mean Absolute Percentage Error)
- Metrik evaluasi yang mengukur kesalahan prediksi sebagai persentase, berguna untuk memahami skala kesalahan relatif.
- Sequence Length (Lookback)
- Jumlah langkah waktu (misal: 60 hari) yang digunakan model sebagai input untuk memprediksi langkah waktu berikutnya.
- Harga Penutupan (Closing Price)
- Harga terakhir di mana saham diperdagangkan selama satu hari perdagangan. Sering digunakan sebagai fitur utama untuk prediksi.
- Epoch
- Satu siklus lengkap di mana model machine learning telah memproses seluruh data pelatihan satu kali.
- Overfitting
- Kondisi di mana model terlalu 'hafal' data pelatihan sehingga performanya buruk pada data baru yang belum pernah dilihat.
- Validation Loss
- Metrik kesalahan model yang dihitung pada set data validasi (data yang tidak digunakan untuk pelatihan) selama proses training. Digunakan untuk memonitor overfitting.
- EarlyStopping
- Teknik regularisasi untuk menghentikan pelatihan model secara otomatis ketika performa pada data validasi tidak lagi meningkat.
- Lapisan Dense
- Lapisan dasar dalam jaringan saraf di mana setiap neuron terhubung ke semua neuron di lapisan sebelumnya (fully connected).
- Dropout
- Teknik regularisasi di mana sebagian neuron diabaikan secara acak selama pelatihan untuk mencegah model terlalu bergantung pada neuron tertentu (mencegah overfitting).
Ringkasan Eksekutif
Tujuan utama dari analisis ini adalah untuk mengembangkan dan mengevaluasi model deep learning yang mampu memprediksi pergerakan harga saham di masa depan, guna menyediakan alat bantu pengambilan keputusan yang berbasis data bagi investor dan analis.
Metodologi yang Diterapkan:
Data historis untuk setiap saham diunduh menggunakan pustaka yfinance dari Python, yang mengakses data dari portal Yahoo Finance. Data yang diambil mencakup harga Pembukaan (Open), Tertinggi (High), Terendah (Low), Penutupan (Close), dan Volume Perdagangan (Volume) untuk periode yang telah ditentukan.
EDA dilakukan untuk mendapatkan wawasan awal dari data. Ini mencakup:
- Visualisasi Harga Historis: Mengamati tren jangka panjang dan volatilitas.
- Visualisasi Volume Perdagangan: Mengidentifikasi periode aktivitas perdagangan yang tinggi atau rendah.
- Analisis Moving Average (MA): Menggunakan SMA 20 dan 50 hari untuk membantu mengidentifikasi sinyal tren.
Data mentah disiapkan untuk model deep learning melalui beberapa tahap:
- Normalisasi: Harga penutupan dinormalisasi ke rentang [0, 1] menggunakan
MinMaxScaler. - Pembuatan Sekuens: Data diubah menjadi format sekuens (60 hari data untuk memprediksi hari ke-61).
- Pembagian Data: Data dibagi menjadi 80% untuk pelatihan dan 20% untuk pengujian.
Tiga arsitektur model (LSTM, GRU, dan LSTM-GRU hybrid) dibangun dengan struktur berikut:
- LSTM & GRU: Dua lapisan berurutan dengan 50 unit masing-masing.
- LSTM-GRU Hybrid: Lapisan LSTM diikuti lapisan GRU, masing-masing 50 unit.
- Lapisan Dense & Dropout: 25 unit dengan regularisasi Dropout (0.2).
- Lapisan Output: 1 unit untuk prediksi nilai tunggal.
Semua model dikompilasi menggunakan optimizer adam dan loss mean_squared_error.
Kinerja model diukur pada data uji menggunakan metrik berikut:
- RMSE (Root Mean Squared Error): Memberi bobot lebih pada kesalahan besar.
- MAPE (Mean Absolute Percentage Error): Mudah diinterpretasikan sebagai persentase kesalahan.
Model dilatih dengan EarlyStopping untuk mencegah overfitting.
Temuan Kunci:
Fitur SMA memberikan dampak berbeda-beda pada setiap saham. Untuk BREN.JK dan PGEO.JK, model tanpa SMA menghasilkan performa yang lebih baik, sedangkan untuk KEEN.JK hasilnya relatif setara.
Model GRU tetap menunjukkan performa terbaik untuk BREN.JK (3.61% MAPE tanpa SMA) dan KEEN.JK (1.29% MAPE dengan SMA), namun untuk PGEO.JK, LSTM-GRU sedikit unggul (4.16% MAPE tanpa SMA).
Kompleksitas fitur tidak selalu meningkatkan akurasi. Pada BREN.JK dan PGEO.JK, model sederhana tanpa SMA justru memberikan hasil yang lebih akurat daripada model dengan fitur SMA tambahan.
KEEN.JK menunjukkan prediktabilitas tertinggi dengan MAPE di bawah 1.6% untuk semua kombinasi model dan fitur, menunjukkan karakteristik pergerakan harga yang lebih teratur.
Analisis Data Eksploratif: BREN.JK
Grafik Harga Penutupan
Harga & Moving Averages
Volume Perdagangan
Kinerja Model: BREN.JK
Perbandingan Prediksi vs Aktual
Metrik Evaluasi Model
Kurva Loss Model
Proyeksi 30 Hari ke Depan: BREN.JK
Kesimpulan & Rekomendasi
Kesimpulan
- Pemilihan fitur yang tepat sangat berpengaruh pada akurasi model. Untuk BREN.JK dan PGEO.JK, model tanpa SMA menghasilkan performa yang jauh lebih baik (MAPE turun hingga 50%), sementara untuk KEEN.JK perbedaannya minimal.
- Model GRU tetap menjadi pilihan terbaik untuk sebagian besar kasus, dengan performa terbaik: BREN.JK (3.61% MAPE), PGEO.JK (4.15% MAPE), dan KEEN.JK (1.29% MAPE).
- KEEN.JK menunjukkan prediktabilitas tertinggi dengan MAPE konsisten di bawah 1.6% untuk semua kombinasi, menunjukkan karakteristik pergerakan harga yang lebih stabil dan teratur.
- Kompleksitas tidak selalu menghasilkan akurasi yang lebih baik. Model sederhana dengan fitur minimal sering kali mengungguli model dengan fitur teknikal tambahan, menunjukkan pentingnya feature selection yang tepat.
- Model-model ini dapat memberikan panduan yang sangat berguna untuk analisis teknikal, terutama untuk saham dengan volatilitas rendah seperti KEEN.JK, namun tetap perlu dikombinasikan dengan analisis fundamental.
Rekomendasi
Bagi Investor:
Gunakan model GRU dengan feature selection yang tepat sebagai alat bantu analisis. Untuk BREN.JK dan PGEO.JK, prioritaskan model tanpa SMA. Untuk KEEN.JK, kedua versi dapat digunakan dengan tingkat kepercayaan tinggi.
Untuk Pengembangan Lanjutan:
Feature Selection yang Adaptif
Kembangkan sistem yang dapat secara otomatis memilih set fitur optimal untuk setiap saham, karena terbukti bahwa kompleksitas fitur tidak selalu meningkatkan akurasi.
Model Ensemble Berbasis Karakteristik Saham
Untuk saham volatil seperti PGEO.JK, kombinasikan beberapa model sederhana. Untuk saham stabil seperti KEEN.JK, fokus pada fine-tuning model tunggal.
Validasi Cross-Temporal
Implementasikan validasi yang mempertimbangkan periode volatilitas berbeda untuk memastikan robustness model terhadap kondisi pasar yang berubah.