OCR: Masa Depan Pengenalan Karakter Optik dan Dampaknya pada Kehidupan Modern

Kuncoro Banu, Dhio Andreas, Wisnu Anggoro, Aji Setiawan

Abstract


Artikel ini membahas penggunaan Convolutional Recurrent Neural Network (CRNN) dalam Pengenalan Karakter Optik (OCR) untuk industri pos. Ini memberikan gambaran tentang OCR, aplikasinya dalam industri pos, dan penggunaan jaringan saraf serta dataset dalam OCR. Artikel ini juga membahas arsitektur Convolutional Neural Network (CNN) dan menyajikan karya penelitian yang ada tentang CNN. Kesimpulannya menyoroti potensi untuk mencapai akurasi yang lebih tinggi dalam pengenalan karakter tulisan tangan menggunakan CNN. Penelitian ini menyimpulkan bahwa CRNN memiliki akurasi yang lebih tinggi dan mengurangi waktu pelatihan dibandingkan dengan model lain. Ini menyarankan analisis lebih lanjut dan aplikasi CRNN dalam mendeteksi bahaya awal HST dan memecahkan pengenalan pola komponen kunci dalam operasi HST. Artikel ini juga menyediakan daftar referensi untuk bacaan lebih lanjut. Tabel dalam artikel ini memberikan ringkasan karya penelitian yang ada tentang RNN, termasuk kerangka teoritis/konseptual yang digunakan dan kesimpulan yang diambil oleh para penulis. Ini juga mencakup implikasi untuk penelitian masa depan. Penelitian ini mencakup berbagai aplikasi, termasuk pemrosesan bahasa alami, industri medis, prediksi cuaca, deteksi redundansi, pengenalan plat nomor kendaraan, klasifikasi ECG, ramalan lalu lintas, dan diagnosis kesalahan dalam kereta cepat. Kesimpulannya secara umum mendukung efektivitas arsitektur CRNN dalam berbagai tugas, dengan saran untuk perbaikan dan aplikasi di masa depan.

Full Text:

PDF

References


Hegghammer, T. (2022a). OCR with Tesseract, Amazon Textract, and Google Document AI: a benchmarking experiment. Journal of Computational Social Science, 5(1), 861–882. https://doi.org/10.1007/s42001-021-00149-1

Hegghammer, T. (2022b). OCR with Tesseract, Amazon Textract, and Google Document AI: a benchmarking experiment. Journal of Computational Social Science, 5(1), 861–882. https://doi.org/10.1007/s42001-021-00149-1

Improvement in OCR Technologies in Postal Industry Using CNN-RNN Architecture: Literature Review. (2022). International Journal of Machine Learning and Computing, 12(5). https://doi.org/10.18178/ijmlc.2022.12.5.1095

Jain, M., Mathew, M., & Jawahar, C. V. (2017a). Unconstrained Scene Text and Video Text Recognition for Arabic Script. http://arxiv.org/abs/1711.02396

Jain, M., Mathew, M., & Jawahar, C. V. (2017b). Unconstrained Scene Text and Video Text Recognition for Arabic Script. http://arxiv.org/abs/1711.02396

Kitchenham, B. (2007a). Guidelines for performing Systematic Literature Reviews in Software Engineering. https://www.researchgate.net/publication/302924724

Kitchenham, B. (2007b). Guidelines for performing Systematic Literature Reviews in Software Engineering. https://www.researchgate.net/publication/302924724

Nguyen, T. T. H., Jatowt, A., Coustaty, M., & Doucet, A. (2021a). Survey of Post-OCR Processing Approaches. In ACM Computing Surveys (Vol. 54, Issue 6). Association for Computing Machinery. https://doi.org/10.1145/3453476

Nguyen, T. T. H., Jatowt, A., Coustaty, M., & Doucet, A. (2021b). Survey of Post-OCR Processing Approaches. In ACM Computing Surveys (Vol. 54, Issue 6). Association for Computing Machinery. https://doi.org/10.1145/3453476

P. Verma and G. M. Foomani. (2022). Improvement in OCR Technologies in Postal Industry Using CNN-RNN Architecture: Literature Review. International Journal of Machine Learning and Computing, 12(5). https://doi.org/10.18178/ijmlc.2022.12.5.1095

Tsafnat, G., Glasziou, P., Choong, M. K., Dunn, A., Galgani, F., & Coiera, E. (2014a). Systematic review automation technologies. In Systematic Reviews (Vol. 3, Issue 1). BioMed Central Ltd. https://doi.org/10.1186/2046-4053-3-74

Tsafnat, G., Glasziou, P., Choong, M. K., Dunn, A., Galgani, F., & Coiera, E. (2014b). Systematic review automation technologies. In Systematic Reviews (Vol. 3, Issue 1). BioMed Central Ltd. https://doi.org/10.1186/2046-4053-3-74

Yalniz, I. Z., & Manmatha, R. (2011a). A fast alignment scheme for automatic OCR evaluation of books. Proceedings of the International Conference on Document Analysis and Recognition, ICDAR, 754–758. https://doi.org/10.1109/ICDAR.2011.157

Yalniz, I. Z., & Manmatha, R. (2011b). A fast alignment scheme for automatic OCR evaluation of books. Proceedings of the International Conference on Document Analysis and Recognition, ICDAR, 754–758. https://doi.org/10.1109/ICDAR.2011.157




DOI: https://doi.org/10.52643/jti.v9i2.3798

Refbacks

  • There are currently no refbacks.


Flag Counter

 

StatCounter

View My Stats

 

Creative Commons License
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.