आर के साथ बिजनेस एनालिटिक्स में मॉडलिंग तकनीक

ब्लॉग आर के साथ बिजनेस एनालिटिक्स में मॉडलिंग तकनीकों का एक संक्षिप्त परिचय देता है।

विभिन्न मॉडलिंग तकनीक:

हम किसी भी समस्या को छोटी प्रक्रियाओं में विभाजित कर सकते हैं:





वर्गीकरण - है, जहां हम डेटा को वर्गीकृत करते हैं। जैसे रोग सभी बीमारियों कुछ व्यवहार को प्रदर्शित करते हैं, और हम उन्हें वर्गीकृत कर सकते हैं।

उदाहरण के लिए: रोग प्रतिरोधक क्षमता कम करने वाले रोग, सिरदर्द देने वाले रोग आदि



प्रतिगमन - कई चर के बीच संबंध का पता लगाना शामिल है।

उदाहरण के लिए: किसी इंसान का वजन उसकी ऊंचाई से कैसे संबंधित है।

अनमोलपता लगाना - मूल रूप से एक उतार-चढ़ाव है।



उदाहरण के लिए: उच्च वोल्टेज या कम वोल्टेज के मामले में।

एक अन्य उदाहरण में विनियमित व्यवहार शामिल हो सकता है जिसमें देश के आधार पर दाईं ओर या बाईं ओर ड्राइविंग शामिल है। यहां की विसंगति किसी को विपरीत दिशा से चला रही है।

एक और उदाहरण नेटवर्क घुसपैठ हो सकता है। यहां, एक प्रमाणित उपयोगकर्ता आपकी कंपनी की वेबसाइट पर लॉग इन करता है, और फिर अगर कोई अनहोनी लॉग इन करता है, तो यह एक हैAn0moly

महत्व को महत्व दें - यह मूल रूप से ऊंचाई, वजन, तापमान, दिल की धड़कन जैसे कई गुण देता है। ध्यान देने वाली बात यह है कि ये सभी विशेषताएँ किसी कार्य के लिए महत्वपूर्ण हैं।

उदाहरण के लिए: कोई व्यक्ति यह अनुमान लगाने की कोशिश कर रहा है कि कोई व्यक्ति किस समय कार्यालय पहुंचेगा। प्रत्येक विशेषता एक महत्वपूर्ण भूमिका निभाती है लेकिन सभी विशेषताएँ महत्वपूर्ण नहीं होती हैं।

एसोसिएशन के नियम - सरल शब्दों में, यह अगले व्यवहार का विश्लेषण या पूर्वानुमान करना है, जहां यह सिफारिश इंजन के चारों ओर घूमता है।

उदाहरण के लिए: रोटी खरीदने वाला व्यक्ति भी दूध खरीद सकता है। यदि हम पिछले खरीदारी व्यवहार का विश्लेषण करते हैं, तो टोकरी में सभी वस्तुओं का एक संबंध है। इस मामले में, एक संभावना हो सकती है कि रोटी खरीदने वाला व्यक्ति भी दूध खरीदेगा।

क्लस्टरिंग - यह आंकड़ों में सबसे पुरानी तकनीकों में से एक है। वास्तव में, कोई भी किसी भी समस्या का मॉडल बना सकता है, यह वर्गीकरण या क्लस्टरिंग हो सकता है, जिसका अर्थ समान संस्थाओं को समूहीकृत करना है।

मान और संदर्भ जावा द्वारा पास

उदाहरण के लिए:

1) सेब और संतरे की एक टोकरी लें, जिसमें हम सेब को संतरे से अलग कर सकते हैं।

2) क्लस्टरिंग के लिए एक महत्वपूर्ण उपयोग मामला स्वास्थ्य देखभाल है। लगभग सभी आँकड़े और विश्लेषण स्वास्थ्य सेवा के उपयोग के मामलों के साथ शुरू हुए। गहराई तक जाने के लिए, सहकर्मियों (समान बीमारियों वाले लोग) नामक एक क्लस्टरिंग शब्द है, ताकि उन्हें मौजूदा ग्राहकों से अलग से अध्ययन किया जा सके। उदाहरण के लिए, यदि 10 लोग बुखार से पीड़ित हैं और अन्य 10 लोग सिरदर्द से पीड़ित हैं, तो हम पाएंगे कि उनके बीच क्या आम है और दवा उत्पन्न करते हैं।

सुविधा निकालना - सुविधा निष्कर्षण सटीकता में, वैधता और विफलता काफी प्रासंगिक है। दूसरे शब्दों में, सुविधा निष्कर्षण को पैटर्न की मान्यता कहा जा सकता है।

उदाहरण के लिए:

Google खोज में, जब कोई उपयोगकर्ता किसी शब्द में प्रवेश करता है, तो वह परिणाम के साथ आता है। अब, एक महत्वपूर्ण प्रश्न यह पूछा जाना चाहिए कि यह कैसे पता चला कि कौन सा पृष्ठ प्रासंगिक और गैर-प्रासंगिक है? यह सुविधा निष्कर्षण और पैटर्न मान्यता के साथ उत्तर दिया जा सकता है, जहां यह प्रमुख विशेषताएं जोड़ता है। हम कहते हैं कि एक तस्वीर दी गई है, कुछ कैमरे चेहरे का पता लगाते हैं, सुंदर चित्रों को देने के लिए चेहरे को उजागर करते हैं, जो सुविधा मान्यता का भी उपयोग करता है।

सुपरवाइज्ड लर्निंग बनाम अनसुप्रवाइज्ड लर्निंग

सेवा मेरे) भविष्यवाणी श्रेणी - तकनीकों में प्रतिगमन, लॉजिस्टिक, तंत्रिका नेटवर्क और निर्णय पेड़ शामिल हैं। कुछ उदाहरणों में धोखाधड़ी का पता लगाना (जहां एक कंप्यूटर सीखता है और धोखाधड़ी के पिछले इतिहास से अगले धोखाधड़ी की भविष्यवाणी करता है)। अप्रशिक्षित सीखने में, कोई उदाहरण के साथ भविष्यवाणी नहीं कर सकता क्योंकि कोई ऐतिहासिक डेटा नहीं है।

बी) वर्गीकरण श्रेणी - एक उदाहरण लेते हुए कि क्या लेन-देन धोखाधड़ी है या नहीं, यह वर्गीकरण की श्रेणी में आता है। यहां, हम ऐतिहासिक डेटा लेते हैं और इसे निर्णय पेड़ों के साथ वर्गीकृत करते हैं या अगर हम कोई ऐतिहासिक डेटा बिल्कुल नहीं लेते हैं, तो हम सीधे डेटा पर शुरू करते हैं और अपने दम पर सुविधाओं का फायदा उठाने की कोशिश करते हैं। उदाहरण के लिए, अगर हमें उन कर्मचारियों को जानना है, जिनके संगठन छोड़ने की संभावना है या रहने की संभावना है। मामले में, यह एक नया संगठन है, जहां हम ऐतिहासिक डेटा का उपयोग नहीं कर सकते हैं, हम हमेशा डेटा निष्कर्षण के लिए क्लस्टरिंग का उपयोग कर सकते हैं।

सी) अन्वेषण श्रेणी - यह एक सीधे आगे की विधि है, जो बड़े डेटा के साथ आता है। बिना पढ़े हुए शिक्षण में, इसे सिद्धांत घटक और क्लस्टरिंग कहा जाता है।

घ) आत्मीयता की श्रेणी - यहां कई तत्व शामिल हैं जैसे क्रॉस-सेल / अप सेल, मार्केट बास्केट एनालिसिस। टोकरी विश्लेषण में, कोई ऐतिहासिक अध्ययन नहीं है क्योंकि कोई ऐतिहासिक डेटा नहीं है। इसलिए हम सीधे डेटा लेते हैं और संघों, अनुक्रमण और कारक विश्लेषण पाते हैं।

क्या आप हमसे कोई प्रश्न पूछना चाहते हैं? उन्हें टिप्पणी अनुभाग में उल्लेख करें और हम आपके पास वापस आ जाएंगे।

संबंधित पोस्ट: