What is Kaggle in hindi

Spread the love

What is Kaggle in hindi एक ऐसा मंच है जहां डेटा उत्साही डेटासेट का पता लगाने और उसका विश्लेषण करने और मशीन लर्निंग प्रतियोगिताओं में भाग लेने के लिए एक साथ आते हैं। प्लेटफ़ॉर्म एक मज़ेदार और सहयोगात्मक स्थान है जो सीखने, समस्या-समाधान और नवाचार को प्रोत्साहित करता है।

मैं बस यह जानने को उत्सुक था कि कागल, इंक किस तरह से राजस्व उत्पन्न करता है। कागल को मार्च, 2017 में Google द्वारा अधिग्रहित किया गया था, इसलिए मुझे यकीन है कि Google को कागल से लाभ होने की उम्मीद है।

मैं जानता हूं कि कई कंपनियां टीमों को हल करने के लिए प्रतियोगिताओं की पेशकश करती हैं, तो क्या कागल पुरस्कार राशि का एक प्रतिशत अपने पास रखता है? क्या कागल अन्य उद्योगों को सेवाएँ और/या उत्पाद प्रदान करता है?

मैं पिछले 14 वर्षों से एयरोस्पेस उद्योग में शामिल हूं और इस वर्ष तक कागल के बारे में कभी नहीं सुना था। बस उत्सुक। धन्यवाद

Kaggle क्या है?

Kaggle डेटा वैज्ञानिकों और मशीन सीखने के प्रति उत्साही लोगों के लिए एक ऑनलाइन सामुदायिक मंच है। कागल उपयोगकर्ताओं को अन्य उपयोगकर्ताओं के साथ सहयोग करने, डेटासेट खोजने और प्रकाशित करने, जीपीयू एकीकृत नोटबुक का उपयोग करने और डेटा विज्ञान चुनौतियों को हल करने के लिए अन्य डेटा वैज्ञानिकों के साथ प्रतिस्पर्धा करने की अनुमति देता है।

इस ऑनलाइन प्लेटफ़ॉर्म का उद्देश्य (एंथनी गोल्डब्लूम और जेरेमी हॉवर्ड द्वारा 2010 में स्थापित और 2017 में Google द्वारा अधिग्रहित) पेशेवरों और शिक्षार्थियों को उनके द्वारा प्रदान किए जाने वाले शक्तिशाली उपकरणों और संसाधनों के साथ उनकी डेटा विज्ञान यात्रा में उनके लक्ष्यों तक पहुंचने में मदद करना है। आज (2021) तक, कागल पर 8 मिलियन से अधिक पंजीकृत उपयोगकर्ता हैं।

कागल को इतना लोकप्रिय संसाधन बनाने वाले उप-प्लेटफ़ॉर्मों में से एक उनकी प्रतियोगिताएं हैं। जिस तरह हैकररैंक सॉफ्टवेयर डेवलपर्स और कंप्यूटर इंजीनियरों के लिए भूमिका निभाता है, उसी तरह डेटा वैज्ञानिकों के लिए “कागल प्रतियोगिताएं” का महत्वपूर्ण महत्व है; आप हमारे कागल प्रतियोगिता गाइड में उनके बारे में अधिक जान सकते हैं और हमारे कागल प्रतियोगिता ट्यूटोरियल में चरण-दर-चरण डेटासेट का विश्लेषण करना सीख सकते हैं।

Zoom cas study

कागल या डेटाकैंप जैसी डेटा विज्ञान प्रतियोगिताओं में, कंपनियां और संगठन बड़ी मात्रा में चुनौतीपूर्ण डेटा विज्ञान कार्यों को उदार पुरस्कारों के साथ साझा करते हैं, जिसमें शुरुआती से लेकर अनुभवी तक डेटा वैज्ञानिक, उनके पूरा होने पर प्रतिस्पर्धा करते हैं।

Kaggle कागल नोटबुक भी प्रदान करता है, जो डेटाकैंप वर्कस्पेस की तरह, आपको अपने ब्राउज़र पर डेटा विज्ञान कार्यों के लिए अपना कोड संपादित करने और चलाने की अनुमति देता है, इसलिए आपके स्थानीय कंप्यूटर को सभी भारी काम नहीं करने पड़ते हैं और आपको इसकी आवश्यकता नहीं होती है। अपने दम पर एक नया विकास वातावरण स्थापित करने के लिए।

कागल क्लाउड पर शक्तिशाली संसाधन प्रदान करता है और आपको प्रति सप्ताह अधिकतम 30 घंटे जीपीयू और 20 घंटे टीपीयू का उपयोग करने की अनुमति देता है। आप अपने डेटासेट को कागल पर अपलोड कर सकते हैं और दूसरों के डेटासेट भी डाउनलोड कर सकते हैं।

इसके अतिरिक्त, आप अन्य लोगों के डेटासेट और नोटबुक की जांच कर सकते हैं और उन पर चर्चा विषय शुरू कर सकते हैं। आपकी सभी गतिविधि को प्लेटफ़ॉर्म पर स्कोर किया जाता है और जैसे-जैसे आप दूसरों की मदद करते हैं और उपयोगी जानकारी साझा करते हैं, आपका स्कोर बढ़ता जाता है। एक बार जब आप अंक अर्जित करना शुरू कर देंगे, तो आपको 8 मिलियन कागल उपयोगकर्ताओं के लाइव लीडरबोर्ड पर रखा जाएगा।

कागल लोगों के विभिन्न समूहों के लिए उपयुक्त है, डेटा विज्ञान और कृत्रिम बुद्धिमत्ता में रुचि रखने वाले छात्रों से लेकर दुनिया के सबसे अनुभवी डेटा वैज्ञानिकों तक। यदि आप नौसिखिया हैं, तो आप कागल द्वारा उपलब्ध कराए गए पाठ्यक्रमों का लाभ उठा सकते हैं।

इस प्लेटफ़ॉर्म से जुड़कर, आप विभिन्न स्तर की विशेषज्ञता वाले लोगों के समुदाय में प्रगति कर पाएंगे, और आपको कई उच्च अनुभवी डेटा वैज्ञानिकों के साथ संवाद करने का मौका मिलेगा। जैसे-जैसे आप कागल अंक और पदक अर्जित करते हैं, जो आपकी प्रगति का प्रमाण हैं, यह काफी संभव है कि आप हेडहंटर्स और भर्तीकर्ताओं को भी आकर्षित कर सकते हैं, और नौकरी के नए अवसर खोल सकते हैं।

अंतिम लेकिन महत्वपूर्ण बात, डेटा विज्ञान में नौकरियों के लिए आवेदन करते समय, अपने कागल अनुभव का उल्लेख निश्चित रूप से सकारात्मक प्रभाव डालता है। कहने की जरूरत नहीं है कि ये सभी लाभ अत्यधिक अनुभवी डेटा वैज्ञानिकों पर भी लागू होते हैं।

इससे कोई फर्क नहीं पड़ता कि आप कितने अनुभवी हैं, यह मंच निरंतर सीखने और सुधार की संभावनाएं प्रदान करता है, और निश्चित रूप से, प्रतियोगिताओं के साथ मिलने वाले नकद पुरस्कार भी उतने ही दिलचस्प हैं।

जबकि कागल पिछले कुछ वर्षों में एक अधिक सर्वांगीण डेटा विज्ञान केंद्र के रूप में विकसित हुआ है, प्रतियोगिताएं कागल का उद्देश्य थीं और रहेंगी और सभी आकारों और रूपों में आती हैं, लेकिन उन्हें तीन मुख्य (यद्यपि थोड़ा मनमाना) श्रेणियों में विभाजित किया जा सकता है।

सबसे पहले शुरुआत करने वाली प्रतियोगिताएं हैं, जैसे टाइटैनिक या डिजिट रिकॉग्नाइज़र। इनका मतलब एक सैंडबॉक्स के रूप में है जिसका एक अच्छी तरह से परिभाषित लक्ष्य है ताकि नए लोगों को एमएल अवधारणाओं, पुस्तकालयों और कागल पारिस्थितिकी तंत्र से मजेदार तरीके से परिचित कराया जा सके।

सामुदायिक प्रतियोगिताओं के साथ, जहां किसी के पास एक दिलचस्प प्रतियोगिता के लिए एक विचार था, ये आम तौर पर “प्रशंसा”, “स्वैग” या “ज्ञान” को अपने पुरस्कार के रूप में सूचीबद्ध करते हैं, इस तर्क के साथ कि रास्ते में प्राप्त यात्रा और ज्ञान अधिक महत्वपूर्ण हैं मंजिल।

वास्तव में जो चीज़ लोगों को कागल की ओर आकर्षित करती है वह नकद पुरस्कार वाली प्रतियोगिताएं हैं। ये पुरस्कार राशि को शीर्ष लीडरबोर्ड स्थानों से जोड़ते हैं और आमतौर पर उन कंपनियों या अनुसंधान संस्थानों द्वारा स्थापित किए जाते हैं जो वास्तव में किसी समस्या का समाधान चाहते हैं और चाहते हैं कि व्यापक दर्शक इस पर ध्यान दें।

कुछ 100 से लेकर 100,000 डॉलर तक के पुरस्कारों के साथ, ये अपने संबंधित क्षेत्रों में सर्वश्रेष्ठ लोगों को आकर्षित करते हैं, जो प्रतिस्पर्धा को चुनौतीपूर्ण लेकिन बहुत फायदेमंद बनाता है।

उन प्रतियोगिताओं में से प्रत्येक को एक डेटासेट और एक मूल्यांकन स्कोर द्वारा परिभाषित किया गया है। यहां डेटासेट से लेबल हल की जाने वाली समस्या को परिभाषित करते हैं और मूल्यांकन स्कोर एकल उद्देश्य माप है जो इंगित करता है कि कोई समाधान इस समस्या को कितनी अच्छी तरह हल करता है (और इसका उपयोग लीडरबोर्ड के लिए समाधानों को रैंक करने के लिए किया जाएगा)।

जबकि ट्रेन सेट सार्वजनिक रूप से उपलब्ध है, समाधानों का मूल्यांकन करने के लिए उपयोग किया जाने वाला डेटा आम तौर पर दो भागों में विभाजित नहीं होता है।

सबसे पहले सार्वजनिक लीडरबोर्ड परीक्षण सेट है जिसका उपयोग प्रतियोगिता जारी रहने के दौरान लीडरबोर्ड स्कोर की गणना करने के लिए किया जाता है। इसका उपयोग टीमों द्वारा यह जांचने के लिए किया जा सकता है कि उनका समाधान अनदेखे डेटा पर कितना अच्छा प्रदर्शन करता है और उनकी सत्यापन रणनीति को सत्यापित करता है।

दूसरा, निजी लीडरबोर्ड परीक्षण सेट है। इसका उपयोग निजी लीडरबोर्ड स्कोर की गणना करने के लिए किया जाता है, जो किसी का वास्तविक अंतिम स्थान तय करता है, और इनका खुलासा प्रतियोगिता समाप्त होने के बाद ही किया जाता है।

यह न केवल परीक्षण डेटा पर फाइन-ट्यूनिंग को रोकता है, बल्कि चीजों को बाहर निकलने से भी रोकता है क्योंकि अगर लोगों ने ऐसा किया (या तो जानबूझकर या नहीं) तो लीडरबोर्ड अंतिम मिनट में पूरी तरह से बदल सकता है।

परिणामी फेरबदल आम तौर पर कुछ दिलचस्प नाटक का कारण बनता है जहां लंबे समय तक राज करने वाले चैंपियन अपनी गरिमा खो देते हैं और किसी का ध्यान नहीं जाने वाले दलित, जिन्होंने सर्वोत्तम प्रथाओं को ध्यान में रखा था, अचानक शीर्ष पर पहुंच जाते हैं।

How to take the Win a Kaggle competition ?

यह अपनाए गए दृष्टिकोण का मामला है और आप लीडरबोर्ड पर शीर्ष पर पहुंचने के लिए अपने कितने विचारों को आज़मा सकते हैं!

हमने वेसुवियस चैलेंज – इंक डिटेक्शन प्रतियोगिता में भाग लिया। हालाँकि हमने कोई पुरस्कार नहीं जीता, लेकिन प्रतियोगिता समाप्त होने के बाद कुछ शीर्ष कागल प्रतियोगियों ने अपने समाधान साझा किए। विजेताओं द्वारा उपयोग की जाने वाली कार्यप्रणाली पूरे बोर्ड में कमोबेश एक जैसी ही प्रतीत होती है। उन्हें जानने में दिलचस्पी है? आइए उन्हें कुछ सरल चरणों में तोड़ें!

1. प्रतिस्पर्धा की अच्छी समझ रखें और समस्या से कैसे निपटें

चूँकि जो लोग इन प्रतियोगिताओं का आयोजन कर रहे हैं वे अक्सर पहले से ही एक अच्छा समाधान खोजने में बहुत समय बिताते हैं, बहुत सारी सामग्री पहले से ही उपलब्ध हो सकती है। हम आपको इसकी अनुशंसा करेंगे:

प्रतियोगिता अवलोकन और जुड़े संसाधनों को अच्छी तरह से पढ़ें

डेटा से परिचित हों. नमूने, प्लॉट आँकड़े, सभी सामान्य ईडीए देखें

इस या इसी तरह की समस्याओं को हल करने में जिन दृष्टिकोणों को आजमाया गया/सफल रहे, उन पर मौजूदा साहित्य की जाँच करें

2. आरंभ करने के लिए अन्य प्रतिभागियों के कार्य से प्रेरित हों

कागल पदक अर्जित करने के लिए या क्योंकि वे वास्तव में अच्छे हैं, कुछ प्रतियोगी “अपवोट्स” प्राप्त करने के लिए नोटबुक और डेटासेट को सार्वजनिक करके या चर्चाओं में निष्कर्ष और अंतर्दृष्टि साझा करके अपना ज्ञान साझा करते हैं।

हम उन्हें पढ़ने की सलाह देते हैं जिन्हें बहुत अधिक अपवोट मिले हैं। यह कदम वास्तव में जरूरी है क्योंकि आपके परिणाम को बेहतर बनाने के लिए प्रयास करने के लिए बहुत सी चीजें हैं, अपनी टीम के साथ सब कुछ कवर करना असंभव है।

अपनी रीडिंग के आधार पर, बेसलाइन के रूप में एक अच्छे एलबी स्कोर के साथ एक स्पष्ट और सरल नोटबुक चुनें। अपने विचारों और साझा कार्य से आपने जो पढ़ा है, उसके आधार पर इस आधार रेखा को कैसे बेहतर बनाया जाए, इस पर एक रणनीति बनाने का प्रयास करें।

3. अपने मॉडल को कुशल तरीके से सुधारें

इस चरण में, आप अपने एलबी में सुधार की उम्मीद में बहुत सारे प्रयोग करेंगे। यहां लक्ष्य सीमित समय में आपके द्वारा आजमाए जाने वाले प्रयोगों की संख्या को अधिकतम करना है!
मध्यवर्ती परिणामों/पूर्व-संसाधित डेटा के लिए डेटासेट बनाएं

सहेजे गए पूर्व-संसाधित डेटासेट और प्रशिक्षित मॉडल आपके परिणामों की तुलना को अधिक “निष्पक्ष” बनाएंगे और दोहराए जाने वाले कार्यों से बचकर आपका कीमती GPU समय बचाएंगे।

तदनुसार, आपकी कार्य संरचना में बड़ी जटिल नोटबुक रखने से बचना चाहिए, बल्कि संसाधित डेटा को इनपुट के रूप में लेने वाली सरल प्रशिक्षण और अनुमान नोटबुक होनी चाहिए।


Spread the love

Leave a Reply

Your email address will not be published. Required fields are marked *