Peningkatan Kecepatan Inferensi Mask R-CNN Menggunakan MobileNetV3 Small pada Sistem Deteksi Kardus

  • Vikha Tri Vicika Universitas Buana Perjuangan Karawang
  • Jamaludin Indra Universitas Buana Perjuangan Karawang
  • Sutan Faisal Universitas Buana Perjuangan Karawang
  • Hanny Hikmayanti Handayani Universitas Buana Perjuangan Karawang
Keywords: Mask R-CNN, MobileNetV3 Small, Deteksi Kardus, FPS

Abstract

Penelitian ini bertujuan untuk meningkatkan kecepatan inferensi pada sistem deteksi objek dengan mengoptimalkan arsitektur Mask R-CNN melalui penggantian backbone menjadi MobileNetV3 Small. Studi ini difokuskan pada deteksi kardus di lingkungan gudang menggunakan dataset yang dikumpulkan dari berbagai kondisi pencahayaan dan sudut pengambilan gambar. Proses pelatihan dan validasi dilakukan terhadap data yang telah dianotasi secara manual, dengan evaluasi menggunakan metrik presisi, recall, dan kecepatan pemrosesan dalam satuan frame per second (FPS). Hasil pengujian menunjukkan bahwa model dengan backbone MobileNetV3 Small menghasilkan FPS rata-rata sebesar 8,66, lebih tinggi dibandingkan dengan model default yang hanya mencapai 6,94. Dari sisi akurasi, model kustom menunjukkan nilai presisi sebesar 85%, sedangkan model default mencapai nilai recall sebesar 85,7%. Meskipun segmentasi yang dihasilkan oleh model default lebih menyeluruh, model kustom memiliki arsitektur yang lebih ringan dan efisien. Oleh karena itu, model kustom lebih sesuai untuk aplikasi waktu nyata pada perangkat dengan sumber daya terbatas. Temuan ini menunjukkan bahwa penggunaan MobileNetV3 Small sebagai backbone pada arsitektur Mask R-CNN mampu meningkatkan efisiensi inferensi tanpa menurunkan tingkat akurasi secara signifikan.

References

[1] Yohanes Mbiri, Kristina Sara, and Anastasia Mude, “Rancang Bangun Sistem Informasi Adiministrasi Kependudukan Berbasis Website Menggunakan Metode Agile Di Desa Nginamanu Barat Kecamatan Wolomeze Kabupaten Ngada,” Simtek J. Sist. Inf. dan Tek. Komput., vol. 8, no. 1, pp. 148–153, Apr. 2023, doi: 10.51876/simtek.v8i1.236.
[2] S. Teja, M. I. Jalil, S. Nurakmalia, F. A. Rizaldi, and A. Saifudin, “Analisis dan Perancangan Sistem Informasi Inventory pada PT Insan Data Permata,” JURIHUM J. Inov. dan Hum., vol. 1, pp. 231–239, Apr. 2023, doi: 10.30998/jrami.v1i02.231.
[3] E. Fontana, W. Zarotti, and D. Lodi Rizzini, “A Comparative Assessment of Parcel Box Detection Algorithms for Industrial Applications,” in 2021 European Conference on Mobile Robots (ECMR), IEEE, Aug. 2021, pp. 1–6. doi: 10.1109/ECMR50962.2021.9568825.
[4] M. A. Masril and D. P. Caniago, “Optimasi Teknologi Computer Vision pada Robot Industri Sebagai Pemindah Objek Berdasarkan Warna,” ELKOMIKA J. Tek. Energi Elektr. Tek. Telekomun. Tek. Elektron., vol. 11, no. 1, p. 46, Jan. 2023, doi: 10.26760/elkomika.v11i1.46.
[5] T. Anjali Dompeipen, S. R. U. . Sompie, and M. E. . Najoan, “Computer Vision Implementation for Detection and Counting the Number of Humans,” J. Tek. Inform. vol. 16 no. 1, vol. 16, no. 1, pp. 65–76, 2021, doi: 10.35793.
[6] A. Y. Firmandicky and Y. A. Susetyo, “Klasifikasi Kardus Barang di PT XYZ Menggunakan Convolutional Neural Network dengan Pendekatan Fine Grained Image Classification,” J. JTIK (Jurnal Teknol. Inf. dan Komunikasi), vol. 8, no. 4, pp. 954–964, Oct. 2024, doi: 10.35870/jtik.v8i4.2337.
[7] J. Yang et al., “SCD: A Stacked Carton Dataset for Detection and Segmentation,” Sensors, vol. 22, no. 10, p. 3617, May 2022, doi: 10.3390/s22103617.
[8] S. Goel and D. Koundal, “A MaskFormer EfficientNet instance segmentation approach for crowd counting,” Sci. Rep., vol. 15, no. 1, pp. 1–13, 2025, doi: 10.1038/s41598-025-95174-9.
[9] K. He, G. Gkioxari, P. Dollár, and R. Girshick, “Mask R-CNN,” IEEE Trans. Pattern Anal. Mach. Intell., vol. 42, no. 2, pp. 386–397, 2020, doi: 10.1109/TPAMI.2018.2844175.
[10] A. Naumann, F. Hertlein, L. Dörr, and K. Furmans, “TAMPAR: Visual Tampering Detection for Parcel Logistics in Postal Supply Chains,” in 2024 IEEE/CVF Winter Conference on Applications of Computer Vision (WACV), IEEE, Jan. 2024, pp. 8061–8071. doi: 10.1109/WACV57701.2024.00789.
[11] S. Fang, B. Zhang, and J. Hu, “Improved Mask R-CNN Multi-Target Detection and Segmentation for Autonomous Driving in Complex Scenes,” Sensors, vol. 23, no. 8, 2023, doi: 10.3390/s23083853.
[12] R. Rubin, C. Jacob, S. M. Anzar, and A. Panthakkan, “Mask R-CNN with Multi-Backbones - A Comparative Analysis,” 2022 5th Int. Conf. Signal Process. Inf. Secur. ICSPIS 2022, no. December, pp. 55–60, 2022, doi: 10.1109/ICSPIS57063.2022.10002546.
[13] C. Huang, Y. Zhou, and X. Xie, “Intelligent Diagnosis of Concrete Defects Based on Improved Mask R-CNN,” Appl. Sci., vol. 14, no. 10, 2024, doi: 10.3390/app14104148.
[14] L. Cao, P. Song, Y. Wang, Y. Yang, and B. Peng, “An Improved Lightweight Real-Time Detection Algorithm Based on the Edge Computing Platform for UAV Images,” Electron., vol. 12, no. 10, 2023, doi: 10.3390/electronics12102274.
[15] D. D. Karyanto, D. D. Karyanto, J. Indra, A. R. Pratama, and T. Rohana, “Detection of the Size of Plastic Mineral Water Bottle Waste Using the Yolov5 Method,” JIKO (Jurnal Inform. dan Komputer), vol. 7, no. 2, pp. 123–130, 2024, doi: 10.33387/jiko.v7i2.8535.
[16] A. Ardiansyah, J. Triloka, and Indera, “Evaluasi Kinerja Model YOLOv8 dalam Deteksi Kesegaran Buah,” JUPITER, vol. 16, no. 2, pp. 357–368, 2024, doi: 10.5281/zenodo.11296226.
[17] A. P. Nardilasari, A. L. Hananto, S. S. Hilabi, T. Tukino, and B. Priyatna, “Analisis Sentimen Calon Presiden 2024 Menggunakan Algoritma SVM Pada Media Sosial Twitter,” JOINTECS (Journal Inf. Technol. Comput. Sci., vol. 8, no. 1, p. 11, 2023, doi: 10.31328/jointecs.v8i1.4265.
[18] S. Teh, V. Perumal, and H. Abdul Hamid, “Investigating How Frame Rates in Different Styles of Animation Affect the Psychology of the Audience,” Int. J. Creat. Multimed., vol. 4, no. 2, pp. 10–31, 2023, doi: 10.33093/ijcm.2023.4.2.2.
Published
2026-01-31