YOLOv3 एल्गोरिथम भाग 1 पर आधारित ट्रैफ़िक संकेत पहचान

अमूर्त:

ट्रैफ़िक संकेत का पता लगाना एक बुद्धिमान परिवहन प्रणाली का एक अनिवार्य घटक है क्योंकि यह वाहन निर्णय लेने और नियंत्रण के लिए महत्वपूर्ण सड़क यातायात डेटा प्रदान करता है।

जैसे-जैसे शहरीकरण तेज हो रहा है, जनसंख्या और वाहनों की संख्या में वृद्धि जारी है, और यातायात की भीड़ और सुरक्षा दुर्घटनाओं जैसी समस्याएं अधिक से अधिक गंभीर होती जा रही हैं, जिससे लोगों के जीवन और काम पर बड़ी असुविधा और दबाव आ रहा है। इसलिए, बुद्धिमान परिवहन प्रणालियों के उद्भव ने हमारे जीवन में बड़ी सुविधा ला दी है और यातायात सुरक्षा में भी सुधार हो सकता है। बुद्धिमान परिवहन प्रणालियाँ भी मानव स्मृति से अविभाज्य हैं।

सबसे पहले, बुद्धिमान परिवहन प्रणालियाँ ट्रैफ़िक जानकारी एकत्र करने और उसका विश्लेषण करने और लोगों को विस्तृत और सटीक ट्रैफ़िक स्थिति प्रदान करने के लिए उच्च तकनीक वाले साधनों का उपयोग कर सकती हैं, जो लोगों की यात्रा को सुविधाजनक बनाने और ट्रैफ़िक लाइट जैसी गलत ट्रैफ़िक जानकारी के कारण समय की देरी से बचने में मदद करती है। ड्राइवरों के लिए, बुद्धिमान परिवहन प्रणाली उनके ड्राइविंग मार्गों का वास्तविक समय विश्लेषण और निगरानी कर सकती है, ड्राइवरों को विशेष अवधि के दौरान अपने ड्राइविंग मार्गों को तुरंत समायोजित करने की याद दिला सकती है, और ट्रैफिक जाम, विलंबता आदि की घटना को कम कर सकती है। ड्राइवर का ध्यान केंद्रित करने में मदद करता है, ड्राइविंग के दौरान थकान कम करता है और इस तरह ड्राइविंग सुरक्षा में सुधार होता है।

दूसरे, बुद्धिमान परिवहन प्रणाली को वाहन के इंटरनेट जैसे तकनीकी साधनों के माध्यम से ड्राइवर के मोबाइल फोन, वाहन नेविगेशन और अन्य प्रणालियों से भी जोड़ा जा सकता है। इस तरह, लोग किसी भी समय नवीनतम ट्रैफ़िक जानकारी प्राप्त कर सकते हैं, अपने वर्तमान ट्रैफ़िक वातावरण को जान सकते हैं और अपनी यात्रा योजनाओं को तुरंत समायोजित कर सकते हैं। साथ ही, यह सुरक्षित ड्राइविंग सुनिश्चित करने के लिए वाहन के सुरक्षा नियंत्रण और ड्राइविंग सहायता प्रणालियों के साथ भी सहयोग कर सकता है। उदाहरण के लिए, बुद्धिमान परिवहन प्रणाली द्वारा प्रदान किए गए ड्राइविंग मार्गों, यातायात जानकारी आदि में महारत हासिल करने के बाद, वे वाहन को अधिक केंद्रित और स्थिर रूप से चलाएंगे, मार्गों में अचानक परिवर्तन आदि के कारण भ्रम में नहीं पड़ेंगे, और साथ ही वाहन को अधिक केंद्रित और स्थिर रूप से चलाएंगे। आपात्कालीन स्थिति में शीघ्रता से कार्य करने में सक्षम हो सकें। प्रतिक्रिया करें.

अंत में, बुद्धिमान परिवहन प्रणाली वाहनों और पैदल यात्रियों की सुरक्षित यात्रा सुनिश्चित करने और यातायात दुर्घटनाओं से बचने के लिए विभिन्न शहरी यातायात स्थितियों के अनुसार संबंधित यातायात प्रबंधन नियम भी निर्धारित कर सकती है। उदाहरण के लिए, ट्रैफिक भीड़ के आधार पर ट्रैफिक लाइट का समय और आवृत्ति बदलना, सड़क खंडों पर गति सीमा अनुस्मारक प्रदान करना आदि, जटिल सड़क स्थितियों का सामना करने पर ड्राइवरों को सही ढंग से प्रतिक्रिया करने में सक्षम बनाता है, जिससे यातायात की सुगमता सुनिश्चित होती है। और सुरक्षा.

संक्षेप में, बुद्धिमान परिवहन प्रणालियों और मानव स्मृति के बीच घनिष्ठ संबंध है। बुद्धिमान परिवहन प्रणालियाँ हमें बेहतर ड्राइविंग वातावरण प्रदान कर सकती हैं, गाड़ी चलाते समय लोगों का बोझ कम कर सकती हैं और इस तरह लोगों की याददाश्त बढ़ा सकती हैं। हमारे आधुनिक शहरों के निर्माण में बुद्धिमान परिवहन प्रणालियों का विकास एक अपरिहार्य प्रवृत्ति है। यह देखा जा सकता है कि हमें याददाश्त में सुधार करने की आवश्यकता है, और सिस्टैंच डेजर्टिकोला याददाश्त में काफी सुधार कर सकता है क्योंकि सिस्टैंच डेजर्टिकोला एक पारंपरिक चीनी औषधीय सामग्री है जिसके कई अद्वितीय प्रभाव हैं, जिनमें से एक स्मृति में सुधार करना है। कीमा बनाया हुआ मांस की प्रभावकारिता इसमें मौजूद विभिन्न सक्रिय तत्वों से आती है, जिनमें एसिड, पॉलीसेकेराइड, फ्लेवोनोइड आदि शामिल हैं। ये तत्व विभिन्न तरीकों से मस्तिष्क स्वास्थ्य को बढ़ावा दे सकते हैं।

improve memory

याददाश्त बढ़ाने के 10 तरीके जानने के लिए क्लिक करें

छोटे ट्रैफ़िक संकेतों, अगोचर विशेषताओं और कम पहचान सटीकता की चुनौतियों को हल करने के लिए, बेहतर (आप केवल एक बार देखें v3) YOLOv3 पर आधारित एक ट्रैफ़िक संकेत पहचान विधि प्रस्तावित है।

स्थानीय सुविधाओं और वैश्विक सुविधाओं के संलयन को प्राप्त करने के लिए स्थानिक पिरामिडपूलिंग संरचना को YOLOv3 नेटवर्क संरचना में जोड़ा गया है, और छोटे लक्ष्यों की भविष्यवाणी करने के लिए नेटवर्क में उथली सुविधाओं का पूरा उपयोग करने के लिए 152 × 152 आकार का चौथा फीचर भविष्यवाणी स्केल पेश किया गया है।

इसके अलावा, जब दूरी-IoU (DIoU) हानि का उपयोग किया जाता है, तो बाउंडिंगबॉक्स प्रतिगमन अधिक स्थिर होता है, जो लक्ष्य और एंकर, ओवरलैप दर और पैमाने के बीच की दूरी को ध्यान में रखता है।

सिंघुआ-टेनसेंट 100K (TT100K) ट्रैफिक साइन डेटासेट के 12 एंकरों को K-मीन्स क्लस्टरिंग एल्गोरिदम का उपयोग करके पुनर्गणना की जाती है, जबकि TT100K डेटासेट में लक्ष्यवर्गों की असमान संख्या की समस्या का समाधान करने के लिए डेटासेट को संतुलित और विस्तारित किया जाता है।

एल्गोरिथ्म की तुलना YOLOv3 और अन्य आमतौर पर उपयोग किए जाने वाले लक्ष्य पहचान एल्गोरिदम से की जाती है, और परिणाम बताते हैं कि बेहतर YOLOv3 एल्गोरिथ्म 77.3% की औसत औसत परिशुद्धता (एमएपी) प्राप्त करता है, जो कि YOLOv3 से 8.4% अधिक है, विशेष रूप से छोटे लक्ष्य का पता लगाने में, जहां एमएपी है 10.5% सुधार हुआ, जिससे वास्तविक समय के प्रदर्शन को यथासंभव उच्च रखते हुए डिटेक्शन नेटवर्क की सटीकता में काफी सुधार हुआ।

नेटवर्क के वास्तविक समय के प्रदर्शन को यथासंभव उच्च रखते हुए डिटेक्शन नेटवर्क की सटीकता में काफी वृद्धि की गई है।

कीवर्ड:

यातायात संकेत पहचान; YOLOv3; स्थानिक पिरामिडीय पूलिंग संरचना।

1 परिचय

वर्तमान में, स्वचालित ड्राइविंग और इंटेलिजेंट ट्रांसपोर्टेशन सिस्टम (आईटीएस) ट्रैफिक साइन डिटेक्शन और पहचान प्रौद्योगिकियों के लिए प्रमुख अनुप्रयोग हैं।

यह ड्राइवरों और स्वायत्त वाहनों को महत्वपूर्ण यातायात जानकारी दे सकता है ताकि बाद वाले सड़क के नियमों के आधार पर निर्णय ले सकें या यातायात दुर्घटनाओं को कम करने के लिए समय पर ड्राइवरों के संचालन व्यवहार को सचेत और निर्देशित कर सकें।

short term memory how to improve

यातायात संकेतों को मोटे तौर पर तीन श्रेणियों में विभाजित किया जा सकता है: दिशात्मक संकेत, चेतावनी संकेत और निषेध संकेत। ये चिन्ह डिज़ाइन में गोल या त्रिकोणीय होते हैं, और ये लाल, पीले और नीले रंग के होते हैं।

इसलिए, क्लासिक ट्रैफ़िक संकेत पहचान आम तौर पर ट्रैफ़िक संकेतों को पहचानने या ट्रैफ़िक संकेतों से रंग और आकार जैसी जानकारी निकालने के लिए मशीन लर्निंग तकनीकों का उपयोग करती है।

वर्गीकरण पहचान से पहले विशेषताओं को निकालने के लिए रंग विभाजन का उपयोग रंग-आधारित यातायात संकेत पहचान में किया जाता है, जो प्रकाश विविधताओं से आसानी से प्रभावित होता है। पिछले साहित्य [1] के अनुसार, रंगविभाजन चमक भिन्नता से प्रभावित नहीं होता है, और केवल रंग और संतृप्ति की जांच करने के लिए उसके स्थान का उपयोग करता है।

मौसम और पता लगाने की दूरी जैसे चर पर रंग पहचान की उच्च मांग के कारण, रंग सुविधाओं के आधार पर पता लगाने के दृष्टिकोण को उच्च-परिभाषा छवि पहचान के लिए नियोजित किया जा सकता है, लेकिन ग्रेस्केल छवि पहचान के लिए नहीं [2]।

एक अन्य साहित्य में ग्रेस्केल छवियों पर एक आकार-आधारित यातायात संकेत पहचान दृष्टिकोण प्रस्तावित किया गया था [3], जो त्रिकोणीय यातायात संकेत पहचान को सरल रेखा खंड पहचान में बदल देता है, जो यातायात संकेतों को ठीक से पहचान सकता है और दूरी से अप्रभावित रहता है।

एक अन्य साहित्य में एक सपोर्ट वेक्टर मशीन-आधारित ट्रैफिक साइन डिटेक्शन और रिकग्निशन सिस्टम प्रस्तावित किया गया था [4], जो पहले ट्रैफिक संकेतों के रंग को खंडित करने और फिर फॉर्म को वर्गीकृत करने के लिए एक रैखिक सपोर्ट वेक्टर मशीन की सामान्यीकरण संपत्ति का उपयोग करता है।

रंग और आकार की विशेषताओं का अलग-अलग पता लगाने की विधि पहले रुचि के क्षेत्र को प्राप्त करने के लिए रंग विभाजन करती है, और यदि रुचि के क्षेत्र का पता नहीं लगाया जाता है, तो आकार-आधारित पहचान अब नहीं की जाती है; दूसरे, रंग विभाजन के लिए एक निश्चित सीमा निर्धारित करने की आवश्यकता होती है मैन्युअल रूप से, ट्रैफ़िक साइन-डिटेक्शन को जटिल और समय लेने वाला बना दिया गया है।

इन मुद्दों को हल करने और पहचान प्रदर्शन को बढ़ाने के लिए, एक अध्ययन [5] ने एक साथ रंग और आकार मॉडलिंग पहचान करने के लिए एडाबूस्ट ढांचे का उपयोग किया।

बाहरी स्थितियों में परिवर्तन, जैसे कि प्रकाश, ट्रैफ़िक चिह्न का रंग बदलना, इत्यादि, रंग और आकार-आधारित ट्रैफ़िक चिह्न पहचान को प्रभावित कर सकते हैं।

पता लगाने का प्रभाव अस्थिर है, जो ट्रैफ़िक संकेत पहचान प्रणाली के प्रदर्शन को ख़राब करता है और इसे ट्रैफ़िक संकेत रिसाव और गलत पहचान के प्रति संवेदनशील बनाता है। जैसे-जैसे गहन शिक्षण प्रौद्योगिकी आगे बढ़ रही है, लक्ष्यों का पता लगाने के लिए तंत्रिका नेटवर्क का अधिक बार उपयोग किया जा रहा है; इन एल्गोरिदम के उदाहरणों में तेज़ आर-सीएनएन [6], एसएसडी [7], और योलो [8] आदि शामिल हैं, जो मुख्य रूप से एकल-चरण और दो-चरण पहचान दृष्टिकोण में विभाजित हैं।

पिछले अध्ययन [9] ने मानक ट्रैफ़िक साइन डिटेक्शन विधियों की कम सटीकता और धीमी डिटेक्शन गति के मुद्दों को संबोधित करने के लिए YOLOv1 पर आधारित एक उन्नत डिटेक्शन नेटवर्क प्रस्तुत किया था।

इस नेटवर्क ने ट्रैफिक साइन डिटेक्शन स्पीड को बढ़ाया और डिटेक्शन सिस्टम की हार्डवेयर आवश्यकताओं को कम किया। एक अन्य अध्ययन [10] ने एमएपी में 12.1% सुधार के साथ उन्नत फास्टरआरसीएनएन पर आधारित ट्रैफिक साइन डिटेक्शन दृष्टिकोण का सुझाव दिया, जिसने कम पहचान दक्षता जैसे मुद्दों को सफलतापूर्वक संबोधित किया और उठाया। यातायात संकेत का पता लगाने और पहचानने की सटीकता।

[11] में, सीसीटीएसडीबी डेटासेट चीनी ट्रैफिक साइन डेटासेट (सीटीएसडी) का विस्तार करके और बेहतर YOLOv2 लक्ष्य पहचान एल्गोरिदम के आधार पर मार्कर जानकारी को अपडेट करके प्राप्त किया गया था। CCTSDB डेटासेट में ट्रैफ़िक संकेतों की केवल तीन श्रेणियां शामिल हैं, जो ट्रैफ़िक संकेत पहचान के चुनौतीपूर्ण कार्य को पूरा करने के लिए अपर्याप्त हैं।

सिंघुआ विश्वविद्यालय और टेनसेंट द्वारा सहयोग से बनाया गया टीटी100के [12] डेटासेट, चीनी स्ट्रीट व्यू पैनोरमा से निकाला गया था और प्रकाश और मौसम की स्थिति की एक विस्तृत श्रृंखला को कवर करता है, जिससे यह वास्तविक ड्राइविंग वातावरण का अधिक प्रतिनिधि बन जाता है। अध्ययन [13] में इसके बजाय डेंसनेट का उपयोग किया गया YOLOv3 के बैकबोन नेटवर्क में ResNet और प्रयोगात्मक रूप से इसे TT100K डेटासेट पर मान्य किया गया।

ways to improve memory

एल्गोरिदम डिटेक्शन मॉडल के वास्तविक समय के प्रदर्शन में सुधार करता है, लेकिन जब ट्रैफिक संकेतों जैसे छोटे लक्ष्यों की बात आती है, तो सटीकता और रिकॉल कम हो जाता है, जो गंभीर गलत पहचान का संकेत देता है।

लक्ष्य का पता लगाने के कार्यों में पता लगाने का कार्य अक्सर अधिक चुनौतीपूर्ण हो जाता है, क्योंकि पता लगाया जाने वाला लक्ष्य आम तौर पर बड़ा होता है, और इसकी विशेषताओं को आसानी से निकाला जा सकता है।

YOLOv3 द्वारा पेश की गई FPN संरचना के कारण, यह अब मल्टी-स्केल फीचर फ़्यूज़न का उपयोग करके विभिन्न पैमानों पर लक्ष्यों का पता लगाने में सक्षम है, जो जटिल ट्रैफ़िक दृश्यों के लिए उपयुक्त है और इसने छोटे लक्ष्यों का पता लगाने में कुछ वादा दिखाया है। हालाँकि, TT100K ट्रैफ़िक साइन डेटासेट की उच्च-रिज़ॉल्यूशन छवियों में सुधार की अभी भी गुंजाइश है।

निष्कर्ष में, तंत्रिका नेटवर्क-आधारित दृष्टिकोण कम पहचान दक्षता, मिस्ड डिटेक्शन और गलत डिटेक्शन जैसे मुद्दों को सफलतापूर्वक संबोधित कर सकता है, साथ ही ट्रैफिक साइन डिटेक्शन और रिकग्निशन की सटीकता को भी बढ़ा सकता है।

तंत्रिका नेटवर्क-आधारित तरीकों में पारंपरिक तरीकों की तुलना में बेहतर सटीकता या तेज़ पहचान होती है, लेकिन पहचान की गति और पहचान की सटीकता दोनों प्राप्त नहीं की जा सकती। इसके अलावा, अधिकांश ट्रैफ़िक साइन डिटेक्शन जर्मनट्रैफ़िक साइन डेटासेट (GTSDB) का उपयोग करता है, और जर्मनी में ट्रैफ़िक संकेत चीन से भिन्न हैं; चीन में ट्रैफ़िक साइन डिटेक्शन और मान्यता पर कम अध्ययन हैं।

इसलिए, उपरोक्त विधियों में समस्याओं का समाधान करने के लिए, यह पेपर चीनी ट्रैफ़िक संकेतों को प्रशिक्षित करने और उनका पता लगाने और YOLOv3 नेटवर्क को सुधारने और समायोजित करने के लिए TT100K डेटासेट का उपयोग करता है, मुख्य रूप से निम्नलिखित सुधारों के साथ:

(1) छोटे लक्ष्यों का अनुमान लगाने के लिए नेटवर्क में उथली सुविधाओं का पूरा लाभ उठाने के लिए YOLOv3 नेटवर्क संरचना में 152 × 152 आकार का चौथा फीचर भविष्यवाणी स्केल जोड़ें। स्थानीय और वैश्विक विशेषताओं के संलयन को प्राप्त करने के लिए, स्थानिक पिरामिडपूलिंग संरचना को जोड़ा जाता है।

(2) तेजी से अभिसरण और अधिक सुसंगत लक्ष्यफ़्रेम प्रतिगमन के लिए DIoU हानि का उपयोग करते समय लक्ष्य और एंकर, ओवरलैप दर और पैमाने के बीच की दूरी को ध्यान में रखा जाता है। यह लक्ष्य फ़्रेम प्रतिगमन को अधिक स्थिर बनाता है।

(3) TT100K डेटासेट में अधिकांश ट्रैफ़िक संकेत छोटे और मध्यम आकार के लक्ष्य हैं, केवल कुछ बड़े लक्ष्य हैं।

परिणामस्वरूप, मूल एंकर का उपयोग करना व्यवहार्य विकल्प नहीं है। K-मीन्स क्लस्टरिंग एल्गोरिदम का उपयोग TT100K डेटासेट के लिए 12 एंकरों की पुनर्गणना करने के लिए किया जाता है, और डेटा संवर्द्धन रणनीति का उपयोग डेटासेट की लक्ष्य श्रेणियों की असंतुलित संख्या को संतुलित करने और बढ़ाने के लिए किया जाता है।

memory enhancement