कोर डेटा वैज्ञानिक कौशल

यह ब्लॉग एक भयानक और कुशल डेटा वैज्ञानिक बनने के लिए आवश्यक कौशल की जांच सूची के साथ कोर डेटा साइंटिस्ट कौशल का वर्णन करता है। >>> पर पढ़ें

लिंक्डइन के दो विश्लेषकों ने वर्ष 2008 में ist डेटा साइंटिस्ट ’शब्द गढ़ा था। वे केवल यह बताने का प्रयास कर रहे थे कि वे क्या करते हैं, अर्थात् अपनी वेबसाइट द्वारा उत्पन्न बड़े पैमाने पर डेटा मूल्य प्राप्त करते हैं। इस प्रक्रिया में, उन्होंने नौकरी का नामकरण समाप्त कर दिया, जो आने वाले वर्षों में अविश्वसनीय मांग को देखेगा और यहां तक ​​कि इसे समाप्त भी कहा जाएगा 21 21 की सबसे सेक्सी नौकरीसेंटसदी।'

अब, ऐसे संगठन जो ’डेटा’ को एक मूल्यवान संपत्ति मानते हैं, भविष्य में उनका नेतृत्व करने के लिए इन डेटा विशेषज्ञों या that वैज्ञानिकों ’की तलाश करते हैं।





तो, यह एक महान डेटा वैज्ञानिक होने के लिए क्या करता है? ……… विभिन्न प्रकार के कौशल सेट!

एक डेटा वैज्ञानिक के मूल कौशल पर संक्षिप्त नज़र डालें।



डेटा विज्ञान की प्रक्रिया में 3 चरण शामिल हैं।

  • डेटा कैप्चर
  • डेटा विश्लेषण
  • प्रस्तुतीकरण

आइए हम इनमें से प्रत्येक चरण में एक डेटा वैज्ञानिक की भूमिका पर एक नज़र डालें।

डेटा कैप्चर



कैसे int जावा में डबल बारी करने के लिए
  • प्रोग्रामिंग और डेटाबेस कौशल

डेटा माइनिंग का पहला चरण सही डेटा पर कब्जा करना है। तो, एक डेटा वैज्ञानिक होने के लिए, टूल्स और टेक्नोलॉजी से परिचित होना बहुत आवश्यक है, विशेष रूप से ओपन सोर्स जैसे कि Hadoop, Java, Python, C ++ और डेटाबेस टेक्नोलॉजी जैसे SQL, NoSQL, HBase और इतने पर।

  • बिजनेस डोमेन और विशेषज्ञता

व्यवसाय के अनुसार डेटा भिन्न होता है। इसलिए, व्यावसायिक डेटा को समझने के लिए विशेषज्ञता की आवश्यकता होती है, जो केवल एक विशेष डेटा डोमेन में काम करने से आता है।

उदाहरण के लिए: चिकित्सा क्षेत्र से एकत्रित डेटा खुदरा कपड़ों की दुकान के डेटा से पूरी तरह से अलग होगा।

जावा और c ++ में क्या अंतर है
  • डेटा मॉडलिंग, वेयरहाउस और अनस्ट्रक्चर्ड डेटा कौशल

संगठन विभिन्न संसाधनों के माध्यम से भारी मात्रा में डेटा एकत्र कर रहे हैं। इस फैशन में कैप्चर किए गए डेटा को असंरचित किया जाता है और विश्लेषण से पहले इसे व्यवस्थित किया जाना चाहिए। इसलिए, एक डेटा साइंटिस्ट को अनस्ट्रक्चर्ड डेटा को मॉडलिंग करने में दक्ष होना पड़ता है।

डेटा विश्लेषण

  • सांख्यिकीय उपकरण कौशल

एक डेटा वैज्ञानिक का आवश्यक कौशल यह जानना है कि आर, एक्सेल, एसएएस और इतने पर सांख्यिकीय उपकरणों का उपयोग कैसे करें। इन उपकरणों को कैप्चर किए गए डेटा को पीसने और इसका विश्लेषण करने की आवश्यकता होती है।

  • गणित कौशल

कंप्यूटर वैज्ञानिक ज्ञान केवल एक डेटा वैज्ञानिक होने के लिए पर्याप्त नहीं है। डेटा वैज्ञानिक प्रोफ़ाइल के लिए किसी ऐसे व्यक्ति की आवश्यकता होती है जो एक कुशल सांख्यिकीविद् होने के साथ-साथ बड़े पैमाने पर मशीन लर्निंग एल्गोरिदम और प्रोग्रामिंग को समझ सके। इसके लिए कंप्यूटर भाषाओं के अलावा अन्य वैज्ञानिक और गणितीय विषयों में विशेषज्ञता की आवश्यकता होती है।

प्रस्तुतीकरण

जावा में मर्ज सॉर्ट प्रोग्राम
  • विज़ुअलाइज़ेशन टूल कौशल

आप एकत्र किए गए डेटा को खान और मॉडल करने में सक्षम हो सकते हैं, लेकिन क्या आप इसकी कल्पना कर सकते हैं?

यदि आप एक सफल डेटा वैज्ञानिक बनना चाहते हैं, तो आपको नेत्रहीन डेटा विश्लेषण का प्रतिनिधित्व करने के लिए कुछ डेटा विज़ुअलाइज़ेशन टूल के साथ काम करने में सक्षम होना चाहिए। इनमें से कुछ में R, Flare, HighCharts, AmCharts, D3.js, प्रसंस्करण और Google विज़ुअलाइज़ेशन सिस्टम आदि शामिल हैं।

लेकिन यह अंत नहीं है! यदि आप वास्तव में डेटा वैज्ञानिक बनने के इच्छुक हैं, तो आपके पास निम्नलिखित कौशल भी होने चाहिए:

  • संचार कौशल: सांख्यिकी और एक्सेल मुश्किल से निपटने के लिए कर रहे हैं। डेटा वैज्ञानिकों को डेटा को इस तरह से प्रस्तुत करने में सक्षम होना चाहिए कि यह व्यावसायिक उपयोगकर्ताओं के लिए परिणामों का संचार करे।
  • व्यावसायिक कौशल : डेटा वैज्ञानिकों को कई भूमिका निभानी होगी। उन्हें संगठन में विविध लोगों के साथ संवाद करने की आवश्यकता होगी। इसलिए, मजबूत व्यावसायिक कौशल होने में संचार, योजना, आयोजन और प्रबंधन शामिल है, इससे बहुत मदद मिलेगी। इसमें व्यवसाय और आवेदन की आवश्यकताओं को समझना और उसके अनुसार जानकारी की व्याख्या करना शामिल है। इसके अलावा, उसे उद्योग में महत्वपूर्ण चुनौतियों की समग्र समझ होनी चाहिए और बेहतर निर्णय लेने के लिए वित्तीय अनुपात के बारे में पता होना चाहिए। निचला रेखा, एक डेटा वैज्ञानिक, जैसा कि 'बिजनेस' भी सोचता है।
  • समस्या को सुलझाने के कौशल: यह स्पष्ट है क्योंकि डेटा विज्ञान समस्या समाधान के बारे में है। एक कुशल डेटा वैज्ञानिक को समय निकालना चाहिए और समस्या को गहराई से देखना चाहिए और उपयोगकर्ता के अनुकूल समाधान के साथ आना चाहिए।
  • भविष्यवाणी कौशल: एक डेटा वैज्ञानिक को एक कुशल भविष्यवक्ता भी होना चाहिए। डेटा मॉडल को सही ढंग से फिट करने के लिए सही का चयन करने के लिए उसके पास एल्गोरिदम का व्यापक ज्ञान होना चाहिए। इसमें डेटा का उपयोग करने और बुद्धिमानी से प्रतिनिधित्व करने के लिए निश्चित मात्रा में रचनात्मकता शामिल है।
  • हैकिंग: मुझे पता है कि यह डरावना लगता है, लेकिन अलग-अलग हैकिंग कौशल जैसे कमांड लाइन पर पाठ फ़ाइलों में हेरफेर करना, वेक्टर किए गए संचालन और एल्गोरिथम सोच को समझना आपको एक बेहतर डेटा वैज्ञानिक बना देगा।

उपरोक्त कौशल सेट को देखते हुए यह स्पष्ट है कि डेटा साइंटिस्ट होना डेटा के बारे में सब कुछ जानने के बारे में नहीं है। यह डेटा कौशल, गणित कौशल, व्यावसायिक कौशल और संचार कौशल के एक समामेलन के साथ एक जॉब प्रोफ़ाइल है। इन सभी कौशलों के साथ, एक डाटा साइंटिस्ट को सही मायने में आईटी क्षेत्र का रॉक स्टार कहा जा सकता है।

एक भयानक और कुशल डेटा वैज्ञानिक बनने के लिए सूची की जाँच करें:

हमने उन कौशल को कवर किया है जो डेटा वैज्ञानिक बनने के लिए आवश्यक हैं। केवल एक डेटा वैज्ञानिक बनने और एक भयानक और कुशल डेटा वैज्ञानिक बनने के लिए एक बड़ा अंतर है। उपरोक्त कौशल के साथ निम्नलिखित कौशल, आपको एक सामान्य या यहां तक ​​कि एक औसत दर्जे के डेटा वैज्ञानिक होने के अलावा सेट करता है।

  • गणितीय कौशल - पथरी, मैट्रिक्स ऑपरेशन, न्यूमेरिकल ऑप्टिमाइज़ेशन, स्टोचैस्टिक मेथड्स, इत्यादि।
  • सांख्यिकीय कौशल - प्रतिगमन मॉडल, तनाव, वर्गीकरण, निदान, अनुप्रयुक्त सांख्यिकी आदि।
  • संचार - दृश्य, प्रस्तुति और लेखन।
  • डेटाबेस - काउचडीबी के अलावा, गैर-पारंपरिक डेटाबेस जैसे कि मोंगोडीबी और वर्टिका में ज्ञान।
  • प्रोग्रामिंग भाषा - सुअर, छत्ता, जावा, अजगर, आदि।
  • प्राकृतिक भाषा प्रसंस्करण और डेटा खनन।

एडुर्का ने एक विशेष रूप से क्यूरेट किया है जो आपको K-Means Clustering, Decision Trees, Random Forest, Naive Bayes जैसे मशीन लर्निंग एल्गोरिदम में विशेषज्ञता हासिल करने में मदद करता है। आप सांख्यिकी, टाइम सीरीज़, टेक्स्ट माइनिंग और दीप लर्निंग से परिचय के बारे में जानेंगे। इस कोर्स के लिए नए बैच जल्द ही शुरू हो रहे हैं !!