Halo Sobat TeknoBgt! Apakah kamu pernah mendengar tentang confusion matrix? Confusion matrix adalah alat penting yang digunakan untuk mengevaluasi keakuratan hasil dari model machine learning. Dalam artikel ini, kita akan membahas cara menghitung akurasi confusion matrix secara lengkap dan mudah dipahami. Yuk, simak artikel ini sampai selesai!
Definisi Confusion Matrix
Sebelum kita membahas cara menghitung akurasi confusion matrix, ada baiknya kita memahami terlebih dahulu apa itu confusion matrix. Confusion matrix adalah tabel yang digunakan untuk mengevaluasi performa model dalam memprediksi label kelas pada data yang diuji. Confusion matrix terdiri dari empat nilai, yaitu true positive (TP), true negative (TN), false positive (FP), dan false negative (FN). Berikut adalah contoh confusion matrix:
Actual Positive | Actual Negative | |
---|---|---|
Predicted Positive | TP | FP |
Predicted Negative | FN | TN |
TP adalah jumlah data yang diprediksi positif dan benar-benar positif. TN adalah jumlah data yang diprediksi negatif dan benar-benar negatif. FP adalah jumlah data yang diprediksi positif tetapi sebenarnya negatif. FN adalah jumlah data yang diprediksi negatif tetapi sebenarnya positif.
Menghitung Akurasi Confusion Matrix
Sekarang, mari kita bahas cara menghitung akurasi confusion matrix. Akurasi adalah ukuran yang digunakan untuk mengevaluasi performa model. Akurasi didefinisikan sebagai:
Akurasi = (TP + TN) / (TP + TN + FP + FN)
Artinya, akurasi adalah jumlah data yang diprediksi benar (TP dan TN) dibagi dengan jumlah total data (TP, TN, FP, dan FN). Semakin tinggi hasil akurasi, semakin baik performa model.
Contoh Kasus:
Misalkan sebuah model machine learning dipakai untuk memprediksi apakah seseorang terkena penyakit atau tidak berdasarkan beberapa faktor. Setelah melakukan pengujian, didapatkan confusion matrix sebagai berikut:
Actual Positive | Actual Negative | |
---|---|---|
Predicted Positive | 90 | 20 |
Predicted Negative | 10 | 80 |
Maka, akurasi model dapat dihitung sebagai berikut:
Akurasi = (90 + 80) / (90 + 80 + 20 + 10) = 0.85 atau 85%
Artinya, model tersebut memiliki akurasi sebesar 85%, yang artinya model tersebut cukup baik dalam memprediksi apakah seseorang terkena penyakit atau tidak.
FAQ
1. Apa itu precision?
Precision adalah ukuran yang digunakan untuk mengevaluasi performa model dalam memprediksi data positif. Precision didefinisikan sebagai:
Precision = TP / (TP + FP)
Artinya, precision adalah jumlah data yang diprediksi positif dan benar-benar positif (TP) dibagi dengan jumlah data yang diprediksi positif (TP dan FP). Semakin tinggi nilai precision, semakin baik model dalam memprediksi data positif.
2. Apa itu recall?
Recall adalah ukuran yang digunakan untuk mengevaluasi performa model dalam mengidentifikasi data positif. Recall didefinisikan sebagai:
Recall = TP / (TP + FN)
Artinya, recall adalah jumlah data yang diprediksi positif dan benar-benar positif (TP) dibagi dengan jumlah data yang sebenarnya positif (TP dan FN). Semakin tinggi nilai recall, semakin baik model dalam mengidentifikasi data positif.
Kesimpulan
Dalam artikel ini, kita telah membahas tentang cara menghitung akurasi confusion matrix. Akurasi adalah ukuran yang digunakan untuk mengevaluasi performa model machine learning, sedangkan confusion matrix adalah tabel yang digunakan untuk mengevaluasi keakuratan hasil dari model machine learning. Semoga artikel ini bermanfaat dan sampai jumpa di artikel menarik lainnya!