हेलो दोस्तों मशीन लर्निंग में हम supervised और unsupervised लर्निंग दोनों के बारे में पढ़ चुके हैं, तो आज हम Unsupervised लर्निंग Algorithm के ही एक प्रकार Clustering के बारे में पढ़ेंगे, Clustering क्या होता है, Clustering in machine learning in hindi, क्लस्टरिंग को Cluster analysis भी कहा जाता है।
Clustering in machine learning in Hindi
जैसे की आप जानते होंगे की Unsupervised लर्निंग में ट्रेनिंग के दौरान learning model को पहले से ही किसी भी प्रकार का इनपुट और आउटपुट labelled डाटा नहीं दिया जाता है, बल्कि इसमें मॉडल दिए गए डाटा का खुद ही एनालिसिस करता है, और उस डाटा में से समान दिख रहे patterns और data की पेहचान कर उन्हें groups में विभाजित कर देता है।
इसमें मॉडल Unlabeled डाटा सेट में से Similar patterns को identify करता है, जैसे उसका shape, size, colour, Behavior इत्यादि, यानि data points में समानता और असमानता के आधार पर उन्हें ग्रुप्स (Clusters) में Divide कर दिया जाता है, तो data points को उनके प्रकार अनुसार groups में बाँटने की प्रक्रिया को ही Clustering या Cluster analysis कहा जाता है।
यदि एक वाक्य में कहा जाए तो Clustering डाटा पॉइंट्स को उनमे समानता और असमानता के आधार पर विभिन्न groups में बाँटने की प्रक्रिया है, चलिए इसे एक उदाहरण द्वारा समझते हैं।
यदि आप कभी मॉल में गए होंगे तो आपने देखा होगा वहाँ पर चीजें व्यवस्थित रूप से groups में रखी हुई होती हैं, दरअसल वहाँ Items में Similarities के आधार पर उन्हें विभिन्न groups में बाँट दिया जाता है, जैसे T-shirt’s एक ग्रुप में रखी होती हैं, उसी प्रकार paints, Shirt, trousers इत्यादि सभी को अलग-अलग ग्रुप्स में रखा होता है, वहीँ अगर देखें तो fruits और Vegetables का भी अपना एक अलग section होता है, और यह सब इस लिए किया जाता है, ताकि चीजों को आसानी से ढूंढा जा सके।
तो Clustering का कार्य और उद्देश्य भी यही होता है, जहाँ पर Similarities के आधार पर data points को वभिन्न groups या clusters में बाँट दिया जाता है, जैसे Employees, Customers, documents, products इत्यादि और यही प्रक्रिया क्लस्टरिंग कहलाती है।
हमें उम्मीद है, Clustering की यह छोटी सी जानकरी आपको अच्छी लगी होगी, यदि जानकरी अच्छी लगी है, तो इसे दूसरों के साथ भी शेयर करें।
यह भी पढ़ें :-