1
دانشجوی دکتری،دانشکده مهندسی برق و کامپیوتر، واحد تهران شمال، دانشگاه آزاد اسلامی، تهران، ایران
2
استادیار،دانشکده مهندسی کامپیوتر، دانشگاه صنعتی قوچان، قوچان، ایران
چکیده
یادگیری عمیق به عنوان یکی از تکنیکهای یادگیری ماشین، از پیشرفتهای فناوری واحدهای پردازش گرافیکی استفاده کرده و این امر به نوبه خود استفاده گسترده از آن را فراهم آورده است. تکنیکهای یادگیری عمیق به نتایج بسیار خوبی در بسیاری از مسائل مهم از جمله شناسایی و تشخیص رویداد در ویدیوی ورزش فوتبال، در مقایسه با روشهای سنتی دست یافتهاند. یکی از چالش های عمده استفاده از شبکههای عصبی عمیق برای مدیریت و طبقه بندی تصاویر، تعداد بسیار زیاد پارامترهای قابل آموزش در این نوع شبکهها است که منجر به بار محاسباتی بالا و زمان طولانی برای آموزش شبکه عصبی عمیق میشود.شبکه عصبی دنسنت یکی از آخرین شبکههای ارائه شده برای اهداف شناسایی و تشخیص اشیاء هست. ما در این مقاله از شبکه عصبی عمیق دنسنت برای شناسایی و تشخیص رویدادهای کارت زرد و قرمز، پنالتی و ضربه آزاد در ویدیوی ورزش فوتبال به عنوان یک معماری پایه استفاده کردهایم. تعداد و اندازه بلوکهای شبکه دنس-نت در تعداد پارامترهای قابل آموزش و همچنین دقت شبکه تاثیر گذار است. در این مقاله ما سعی کردهایم با ایجاد تغییر در معماری پایه شبکه عصبی عمیق دنسنت با حفظ دقت، تعداد پارامترهای قابل آموزش این شبکه را کاهش دهیم. برای این منظور با بررسی حالتهای ممکن برای قرار گیری بلوکهای با سایز مختلف شبکه دنسنت اقدام به ارائه یک معماری پیشنهادی برای شبکه عصبی عمیق کردهایم. نتایج ارزیابیها، نشاندهنده کاهش تعداد پارامترهای قابل آموزش شبکه عصبی عمیق و در عین حال افزایش دقت معماری پیشنهادی برای شناسایی و تشخیص رویدادهای مهم در ورزش فوتبال است
[1] R. da Silva and S. R. Dahmen, “Universality in the distance between two teams in a football tournament,” Physica A: Statistical Mechanics and its Applications, vol. 398, pp. 56–64, 2014.
[2] K. Bandyopadhyay, Legacies of Great Men in World Soccer: Heroes, Icons, Legends. Routledge, 2017.
[3] M. Fei, W. Jiang, and W. Mao, “Creating personalized video summaries via semantic event detection,” Journal of Ambient Intelligence and Humanized Computing, pp. 1–12, 2018.
[4] J. Yu, A. Lei, and Y. Hu, “Soccer Video Event Detection Based on Deep Learning,” in International Conference on Multimedia Modeling, 2019, pp. 377–389.
[5] M. N. Ali, M. Abdullah-Al-Wadud, and S.-L. Lee, “An efficient algorithm for detection of soccer ball and players,” Proc. 16th ASTL Control and Networking, vol. 16, 2012.
[6] A. Bialkowski, P. Lucey, P. Carr, Y. Yue, S. Sridharan, and I. Matthews, “Large-scale analysis of soccer matches using spatiotemporal tracking data,” in 2014 IEEE International Conference on Data Mining, 2014, pp. 725–730.
[7] W. Dubitzky, P. Lopes, J. Davis, and D. Berrar, “The open international soccer database for machine learning,” Machine Learning, vol. 108, no. 1, pp. 9–28, 2019.
[8] C. Cuevas, D. Quilón, and N. García, “Techniques and applications for soccer video analysis: A survey,” Multimedia Tools and Applications, vol. 79, no. 39, pp. 29685–29721, 2020.
[9] Z. Wang, J. Yu, and Y. He, “Soccer video event annotation by synchronization of attack–defense clips and match reports with coarse-grained time information,” IEEE Transactions on Circuits and Systems for Video Technology, vol. 27, no. 5, pp. 1104–1117, 2016.
[10] K. Tang, Y. Bao, Z. Zhao, L. Zhu, Y. Lin, and Y. Peng, “AutoHighlight: Automatic Highlights Detection and Segmentation in Soccer Matches,” in 2018 IEEE International Conference on Big Data (Big Data), 2018, pp. 4619–4624.
[11] S. Jai-Andaloussi, A. Mohamed, N. Madrane, and A. Sekkaki, “Soccer video summarization using video content analysis and social media streams,” in 2014 IEEE/ACM International Symposium on Big Data Computing, 2014, pp. 1–7.
[12] P. Shi and X. Yu, “Goal event detection in soccer videos using multi-clues detection rules,” in Management and Service Science, 2009. MASS’09. International Conference on, 2009, pp. 1–4.
[13] M.-L. Shyu, Z. Xie, M. Chen, and S.-C. Chen, “Video semantic event/concept detection using a subspace-based multimedia data mining framework,” IEEE Transactions on Multimedia, vol. 10, no. 2, pp. 252–259, 2008.
[14] M. H. Kolekar, “Bayesian belief network based broadcast sports video indexing,” Multimedia Tools and Applications, vol. 54, no. 1, pp. 27–54, 2011.
[15] D. W. Tjondronegoro and Y.-P. P. Chen, “Knowledge-discounted event detection in sports video,” Ieee transactions on systems, man, and cybernetics-part a: Systems and humans, vol. 40, no. 5, pp. 1009–1024, 2010.
[16] M. Y. Eldib, B. S. A. Zaid, H. M. Zawbaa, M. El-Zahar, and M. El-Saban, “Soccer video summarization using enhanced logo detection,” in Image Processing (ICIP), 2009 16th IEEE International Conference on, 2009, pp. 4345–4348.
[17] B. Fakhar, H. R. Kanan, and A. Behrad, “Event detection in soccer videos using unsupervised learning of Spatio-temporal features based on pooled spatial pyramid model,” Multimedia Tools and Applications, pp. 1–31, 2019.
[18] Z. Dang, J. Du, Q. Huang, and S. Jiang, “Replay detection based on semi-automatic logo template sequence extraction in sports video,” in Image and Graphics, 2007. ICIG 2007. Fourth International Conference on, 2007, pp. 839–844.
[19] H. Pan, P. Van Beek, and M. I. Sezan, “Detection of slow-motion replay segments in sports video for highlights generation,” in icassp, 2001, pp. 1649–1652.
[20] H. M. Zawbaa, N. El-Bendary, A. E. Hassanien, and T. Kim, “Event detection based approach for soccer video summarization using machine learning,” International Journal of Multimedia and Ubiquitous Engineering, vol. 7, no. 2, pp. 63–80, 2012.
[21] G. Huang, Z. Liu, L. Van Der Maaten, and K. Q. Weinberger, “Densely connected convolutional networks,” in Proceedings of the IEEE conference on computer vision and pattern recognition, 2017, pp. 4700–4708.
زنگنه,امیرحسین , چمپور,مهدی و لایقی,کامران . (1399). شناسایی رویداد در ویدیو با استفاده از شبکه عصبی عمیق بهینه. (e162015). علوم رایانش و فناوری اطلاعات, 18(2), e162015
MLA
زنگنه,امیرحسین , , چمپور,مهدی , و لایقی,کامران . "شناسایی رویداد در ویدیو با استفاده از شبکه عصبی عمیق بهینه" .e162015 , علوم رایانش و فناوری اطلاعات, 18, 2, 1399, e162015.
HARVARD
زنگنه امیرحسین, چمپور مهدی, لایقی کامران. (1399). 'شناسایی رویداد در ویدیو با استفاده از شبکه عصبی عمیق بهینه', علوم رایانش و فناوری اطلاعات, 18(2), e162015.
CHICAGO
امیرحسین زنگنه, مهدی چمپور و کامران لایقی, "شناسایی رویداد در ویدیو با استفاده از شبکه عصبی عمیق بهینه," علوم رایانش و فناوری اطلاعات, 18 2 (1399): e162015,
VANCOUVER
زنگنه امیرحسین, چمپور مهدی, لایقی کامران. شناسایی رویداد در ویدیو با استفاده از شبکه عصبی عمیق بهینه. علوم رایانش و فناوری اطلاعات, 1399; 18(2): e162015.