2021-05-18 12:57:13
Tuberkulosis adalah salah satu penyebab kematian terbesar di dunia. Setiap tahun, ada sekitar 10 juta orang yang terinfeksi tuberkulosis. Terdapat tiga negara terbesar penderita tuberkulosis yaitu India (23%), Indonesia (10%) dan China (10%) dari total jumlah penderita tuberkulosis di dunia. Penyakit ini menyerang manusia tanpa memandang usia, baik anak-anak maupun orang dewasa. Penyakit tuberkulosis ini tidak hanya menyerang organ paru-paru saja, tetapi penyakit ini dapat menyerang organ lain seperti otak, ginjal, kulit dan tulang. Bakteri tuberkulosis memiliki ukuran yang bervariasi. yaitu panjang berkisar dari 1 sampai 4 µm dengan ketebalan berkisar antara 0,3 sampai 0,6 µm. Bakteri tuberkulosis dapat dilihat menggunakan mikroskop konvensional dengan perbesaran 1000x. Bakteri TBC yang terdapat dalam dahak memiliki ciri khas yaitu berwarna kemerahan yang disebut bakteri tahan asam (BTA). Warna kemerahan ini muncul akibat cairan pewarnaan menggunakan metode pewarnaan Ziehl-Neelsen (ZN).
Metode Convolution Neural Network (CNN) telah banyak digunakan oleh para peneliti sebelumnya. Hal ini dikarenakan algoritma ini diklaim sebagai metode terbaik dalam menyelesaikan masalah pendeteksian suatu objek. Beberapa model arsitektur CNN yang dipelajari pada studi sebelumnya seperti LeNet, AlexNet, ZFNet, GoogleNet, VGGNet dan ResNet. Berdasarkan studi literatur di atas, maka peneliti mengembangkan sistem klasifikasi bakteri tuberkulosis menggunakan Arsitektur CNN yang digunakan menggunakan ResNet101 yang dikombinasikan dengan SVM sebagai pengklasifikasiannya. Dalam penelitian ini sasaran yang dicapai adalah membantu ahli patologi klinis dalam menyelesaikan tugasnya mengidentifikasi bakteri tuberkulosis dan menghasilkan klasifikasi hasil yang terbaik.
Data citra yang digunakan dalam penelitian ini berupa citra sputum berukuran 800 x 600 piksel yang telah diberi metode pewarnaan Ziehl-Neelsen (ZN). Pengambilan gambar dahak menggunakan mikroskop digital Labomed Digi 3 yang dilengkapi dengan Lx400 dan modul kamera digital iVu 5100 dengan kapasitas 5,0 megapiksel. Citra dahak ini memiliki resolusi 120 dengan kedalaman 24 bit dan pembesaran 100x. Data citra dahak diambil sebanyak 50 citra. Dari 50 citra tersebut, kemudian diambil citra individu bakteri TB. Teknik segmentasi untuk memisahkan bakteri pada citra citra sputum. Dimensi citra bakteri TB berbeda-beda tergantung dari ukuran bakteri dan posisi bakteri.
CNN adalah jaringan saraf feed-forward yang dikembangkan dari algoritma Perseptron Multilayer. Setiap rangkaian parameter yang akan dilatih dalam lapisan konvolusional (disebut sebagai filter konvolusional) mengekstrak konsep visual yang berarti dari gambar masukan asli; sedangkan kumpulan parameter yang akan dilatih dalam lapisan terhubung sepenuhnya mengklasifikasikan fitur visual yang diekstraksi ke dalam kelas target seperti bentuk bakteri TB atau bukan bakteri TB. Algoritma CNN merupakan algoritma yang banyak digunakan oleh peneliti untuk mengamati suatu objek dan melakukan pengenalan terhadap suatu objek.
Metode Support Vector Machine (SVM) merupakan salah satu metode klasifikasi yang dapat menyelesaikan permasalahan data linier dan non linier. Klasifikasi menggunakan metode SVM dibagi menjadi dua proses, yaitu proses pelatihan dan proses pengujian. Proses pelatihan SVM menggunakan input yang dihasilkan dari proses ekstraksi matriks ciri. Sedangkan pengujian SVM memanfaatkan matriks proyeksi yang dihasilkan pada proses ekstraksi ciri yang kemudian dikalikan dengan data uji (sampel uji) sebagai input. SVM memiliki prinsip kerja yaitu structural risk minimization (SRM). Cara kerja metode SVM adalah melatih sekumpulan data klasifikasi dengan algoritma untuk menghasilkan model klasifikasi yang dapat membantu dalam memprediksi kategori data baru. SVM memiliki banyak keunggulan dalam hal klasifikasi. SVM adalah salah satu metode pembelajaran mesin terkemuka yang memiliki hasil yang baik dalam hal klasifikasi dan prediksi.
Uji coba dalam penelitian ini menggunakan 50 sampel citra dahak berukuran 800 x 600 piksel yang telah diberi pewarnaan Ziehl-Neelsen. Jumlah bakteri yang ditemukan pada 50 citra sputum adalah 1.266 citra yang terdiri dari 633 citra bakteri TB dan 633 citra bakteri non TB. Ukuran bakteri berbeda-beda dan jumlah bakteri pada setiap citra dahak berbeda-beda. Oleh karena itu, perlu dilakukan proses resize 50 x 50 pixel agar citra memiliki ukuran yang sama. Dalam proses uji coba, data dibagi menjadi 2 kelas yaitu kelas Bakteri TB dan Kelas Bakteri Non TB. Data latih yang digunakan 70% dari total data 866 data, sedangkan 30% sebanyak 380 untuk data uji kemudian diuji 5 kali menggunakan metode CNN ResNet101 dan SVM sebagai pengklasifikasi.
Hasil yang diperoleh dari uji coba tersebut nilai ketelitian tertinggi ada pada uji coba ke-3 yaitu 97,9%. Sedangkan nilai recall tertinggi terdapat pada uji coba ke-3 dan uji coba ke-5 dengan nilai 97,4%, untuk akurasi tertinggi dan F1 Score terdapat pada uji coba ke-3 dengan nilai 97,6% dan 97,6%. Selain pengujian sebanyak 5 kali, juga diuji dengan pengklasifikasi yang berbeda yaitu KNN (K-Nearest Neighbor), Naïve Bayes dan Decision Tree. Hasil pengujian pengklasifikasi SVM memiliki nilai akurasi tertinggi dengan nilai 96.56% dan nilai akurasi terendah pada KNN dan pengklasifikasi pohon keputusan dengan nilai 85.32%. Untuk nilai presisi Naïve Bayes memiliki nilai terendah 78.76% dan tertinggi menggunakan SVM dengan nilai 96.96%. Nilai recall tertinggi tetap pada metode SVM dengan nilai 96.28% dan decision tree merupakan classifier terendah dengan nilai 86.58%. Sedangkan skor F1 tertinggi menggunakan SVM dengan nilai 96,6% dan terendah pada Naïve Bayes dengan nilai 84,28%.
Berdasarkan hasil dari 5 percobaan menunjukkan bahwa nilai rata-rata akurasi menggunakan CNN berarsitektur ResNet 101 dengan pengklasifikasi SVM adalah 96.56%. dengan nilai akurasi tertinggi 97.6%. Hal ini menunjukkan bahwa SVM classifier cocok digunakan pada CNN dengan arsitektur Resnet 101. Penggunaan pengklasifikasi dalam klasifikasi bakteri TB bergantung pada metode pengklasifikasi yang kompatibel dengan metode CNN dengan pengklasifikasi SVM. Dengan demikian, pengklasifikasi KNN, Naïve Bayes, dan Pohon Keputusan tidak sesuai untuk digunakan sebagai pengklasifikasi yang akan digabungkan dengan Resnet101.
Sumber: http://news.unair.ac.id/2021/05/02/identifikasi-mycobacterium-tuberculosis-berdasarkan-citra-hapusan-dahak/
Penulis: Dr. Nur Chamidah, M.Si.
Informasi detail dari penelitian ini dapat dilihat pada tulisan kami di:
Aeri Rachmad, Nur Chamidah, Riries Rulaningtyas, 2020, Mycobacterium Tuberculosis Images Classification Based on Combining of Convolutional Neural Network And Support Vector Machine, Commun. Math. Biol. Neurosci. 2020(85), pp.1-13.
https://doi.org/10.28919/cmbn/5035