Page Header

ระบบบริการการจำแนกเพศและประเมินอายุบุคคลจากภาพใบหน้าด้วยวิธีการเรียนรู้เชิงลึก
A Service System for Estimation of Gender and Assessing the Person's Age from Facial Images by Deep Learning-based Method

Choopan Rattanapoka, Panupong Jannet, Teeratorn Moonpanyo

Abstract


บทความนี้เสนอการออกแบบและพัฒนาแบบจำลองการเรียนรู้เชิงลึกสำหรับทำนายอายุและเพศ รวมถึงออกแบบและพัฒนาเว็บ API สำหรับให้บริการเชื่อมต่อและใช้งานแบบจำลองที่พัฒนาขึ้น อีกทั้งยังพัฒนาเว็บแอปพลิเคชันและโมบายแอปพลิเคชันตัวอย่างที่ใช้บริการแบบจำลองการเรียนรู้ผ่านทางเว็บ API แบบจำลองที่พัฒนาขึ้นนั้นมีสถาปัตยกรรมที่ผสมผสานระหว่างสถาปัตยกรรมแบบจำลองการเรียนรู้เชิงลึก VGG16 และ ResNet โดยได้สร้างแบบจำลองขึ้นมา 3 แบบจำลอง ได้แก่ (1) แบบจำลองที่ทำนายอายุ (2) แบบจำลองที่ทำนายเพศ และ (3) แบบจำลองที่ทำนายทั้งอายุและเพศ ทั้ง 3 แบบจำลองถูกฝึกด้วยชุดข้อมูลภาพ IMDB จำนวน 154,667 ภาพ จากการทดสอบแบบจำลองโดยใช้ชุดข้อมูลภาพ WIKI จำนวน 38,138 ภาพ พบว่าแบบจำลองทำนายอายุมีค่าความผิดพลาดสัมบูรณ์เฉลี่ยเท่ากับ 5.949 ใช้เวลาในการประมวลผล 0.167 วินาที ในขณะที่แบบจำลองทำนายเพศมีถูกต้องเท่ากับ 96.58% ใช้เวลาในการประมวลผล 0.169 วินาที และสุดท้ายคือแบบจำลองที่ทำนายทั้งอายุและเพศ มีความถูกต้องในการทำนายเพศเท่ากับ 95.82% และมีค่าความผิดพลาดสัมบูรณ์เฉลี่ยในการทำนายอายุเท่ากับ 6.347 โดยใช้เวลาในการทำนายต่อภาพเท่ากับ 0.171 วินาที

This article proposes the design and development of deep learning models for predicting age and gender from a facial image, the web API for using the developed model, and a web application and a mobile application that use our model via the web API. The architecture of the developed model is based on the integration of VGG16 and ResNet. We implemented three models: (1) an age prediction model, (2) a gender prediction model, and (3) an age and gender prediction model. All three models were trained with 154,667 images from the IMDB dataset. The models were evaluated with 38,138 images from the WIKI datasets. From the experiments, we found that the age prediction model had a mean absolute error of 5.949 with 0.167s processing time while the gender prediction model has 96.58% accuracy with 0.169s processing time. Finally, the age and gender prediction model has a gender prediction accuracy of 95.82% and a mean absolute error in age prediction of 6.347 with a prediction time of 0.171s.

Keywords: เว็บ API; การประมวลผลภาพ; การเรียนรู้เชิงลึก; โครงข่ายประสาทคอนโวลูชัน; Web API; Image processing; Deep learning; Convolutional neural network


[1] Y. LeCun, Y. Bengio, and G. Hinton, Deep learning, Nature, 2015, 521, 436-444.

[2] J. Liu and X. Wang, Tomato diseases and pests detection based on improved Yolo V3 convolutional neural network, Frontiers in Plant Science, 2020, 11, 898.

[3] Y. Ji, S. Kim, Y.J. Kim, and K.B. Lee, Human-like sign-language learning method using deep learning, ETRI Journal, 2018, 40(4), 435-445.

[4] S.E. Bekhouche, A. Ouafi, A. Benlamoudi, A. Taleb-Ahmed, and A. Hadid, Facial age estimation and gender classification using multi level local phase quantization, The 3rd International Conference on Control, Engineering Information Technology (CEIT- 2015), Proceeding, 2015, 1-4.

[5] S. H. Lee, S. Hosseini, H. J. Kwon, J. Moon, H. I. Koo, and N. I. Cho, Age and gender estimation using deep residual learning network, International Workshop on Advanced Image Technology (IWAIT-2018), Proceeding, 2018, 1-3.

[6] https://github.com/yu4u/age-gender-estimation. (Accessed on 15 February 2022)

[7] M. Tan and Q.V. Le, EfficientNet: Rethinking model scaling for convolutional neural networks, arXiv, 2019, 1905.11946.

[8] K. Simonyan and A. Zisserman, Very deep convolutional networks for large-scale image recognition, arXiv, 2014, 1409.1556.

[9] https://github.com/rcmalli/keras-vggface. (Accessed on 10 February 2022)

[10] K. He, X. Zhang, S. Ren, and J. Sun, Deep residual learning for image recognition, arXiv, 2015, 1512.03385.

[11] S. Loffe and C. Szegedy, Batch normalization: accelerating deep network training by reducing internal covariate shift, arXiv, 2015, 1502.03167.

[12] R. Rothe, R. Timofte, and L.V. Gool, Deep expectation of real and apparent age from a single image without facial landmarks, International Journal of Computer Vision, 2018, 126, 144-157.

[13] M. Jones, J. Bradley, and N. Sakimura, JSON Web Token (JWT), Internet Engineering Task Force, RFC 7519, 2015.

[14] D.E. King, Dlib-ml: A machine learning toolkit, Journal of Machine Learning Research, 2009, 10, 1755-1758.

[15] E. Bisong, Google colaboratory, In: Building machine learning and deep learning models on google cloud platform: A comprehensive guide for beginners, Apress Berkeley, CA, USA, 2019, 59-64.

Full Text: PDF

DOI: 10.14416/j.ind.tech.2022.08.003

Refbacks

  • There are currently no refbacks.