मशीन लर्निंग के लिए आंकड़े: एक शुरुआती गाइड

सांख्यिकी के लिए सांख्यिकी पर यह लेख उदाहरणों के साथ विभिन्न अवधारणाओं ओएस सांख्यिकी पर एक व्यापक गाइड है।

डेटा को समझना और उससे मूल्य बनाने में सक्षम होना दशक का कौशल है। मशीन लर्निंग एक ऐसा मुख्य कौशल है जो कंपनियों को इसे पूरा करने में मदद करता है। हालाँकि, आरंभ करने के लिए, आपको अपनी नींव बनाने की आवश्यकता है। इसलिए, इस लेख में, मैं कुछ बुनियादी अवधारणाओं को कवर करूंगा और आपको मशीन लर्निंग में अपनी यात्रा शुरू करने के लिए दिशानिर्देश प्रदान करूंगा। तो, मशीन लर्निंग के आंकड़ों पर इस लेख में, निम्नलिखित विषयों पर चर्चा की जाएगी:

  1. संभावना
  2. सांख्यिकी
  3. लीनियर अलजेब्रा

मशीन लर्निंग के लिए संभाव्यता और सांख्यिकी:





संभाव्यता क्या है?

संभाव्यता किसी घटना के घटित होने की संभावना को निर्धारित करती है। उदाहरण के लिए, यदि आप निष्पक्ष, निष्पक्ष मरते हैं, तो इसकी संभावना है एक मुड़ना 1/6 है । अब, अगर आप सोच रहे हैं wहाइट? तो जवाब काफी आसान है!

इसका कारण यह है कि छह संभावनाएँ हैं और सभी समान रूप से (निष्पक्ष मर) हैं। इसलिए हम जोड़ सकते हैं 1 + 1 + 1 + 1 + 1 + 1 = 6। लेकिन, जब से हम में रुचि रखते हैं घटना जहाँ 1 बदल जाता है । वहाँ है केवल एक ही घटना हो सकती है। इसलिए,



1 मोड़ की संभावना = 1/6

अन्य सभी संख्याओं के साथ भी ऐसा ही है क्योंकि सभी घटनाएं समान रूप से होने की संभावना है। सरल, सही?

जावा में हाइबरनेट क्या है

ठीक है, इस उदाहरण के लिए प्रायिकता की एक निरंतर परिभाषा है, जैसे - 1 मोड़ने की संभावना 1 बार की संख्या का अनुपात है, जो कि मरने पर लुढ़का हुआ था जब मरने की एक अनंत संख्या में लुढ़का हुआ था। समय।इसका अर्थ कैसे निकलता है?



चलिए इसे और दिलचस्प बनाते हैं। दो मामलों पर विचार करें - आपने 5 बार मेला मरवा दिया। एक मामले में संख्याओं का क्रम बदल रहा है - [1,4,2,6,4,3]। दूसरे मामले में, हम प्राप्त करते हैं - [2,2,2,2,2,2]। आपको कौन सा लगता है कि अधिक संभावना है?

दोनों समान रूप से संभावना है। अजीब लगता है ना?

अब, एक अन्य मामले पर विचार करें जहां प्रत्येक मामले में सभी 5 रोल हैं स्वतंत्र । मतलब, एक रोल दूसरे को प्रभावित नहीं करता है। पहले मामले में, जब 6 मुड़ते हैं, तो यह पता नहीं था कि 2 इससे पहले बदल गया था। इसलिए, सभी 5 रोल समान रूप से होने की संभावना है।

इसी तरह, दूसरे मामले में सीधे 2s को स्वतंत्र घटनाओं के अनुक्रम के रूप में समझा जा सकता है। और इन सभी घटनाओं की समान रूप से संभावना है। कुल मिलाकर, चूंकि हमारे पास एक ही पासा है, केस नंबर दो के रूप में एक विशेष संख्या की संभावना एक ही होने की संभावना है। अगला, मशीन लर्निंग के आंकड़ों पर इस लेख में, हम इस शब्द को समझते हैं आजादी।

आजादी

दो घटनाएँ यदि A की घटना B को प्रभावित नहीं करती है तो A और B को स्वतंत्र कहा जाता है । उदाहरण के लिए, यदि आप एक सिक्का उछालते हैं और मर जाते हैं, तो मरने के परिणाम का इस बात पर कोई प्रभाव नहीं पड़ता है कि सिक्का सिर या पूंछ दिखाता है या नहीं। के लिए भी दो स्वतंत्र घटनाएं ए और बी , को संभावना है कि ए और बी एक साथ हो सकते हैं । इसलिए, उदाहरण के लिए, यदि आप चाहते हैं कि सिक्का सिर दिखाता है और डाई शो 3।

P (A और B) = P (A) * P (B)

इसलिए P = & frac12 (सिर मुड़ने की संभावना) * prob (3 मोड़ की संभावना) = 1/12

पिछले उदाहरण में, दोनों मामलों के लिए, पी = ⅙ * ⅙ * ⅙ * example * ⅙ * for।

अब उन घटनाओं के बारे में बात करते हैं जो स्वतंत्र नहीं हैं। निम्नलिखित तालिका पर विचार करें:

मोटापा मोटापा नहीं
हृदय की समस्याएंचार पाचपंद्रह
दिल की कोई समस्या नहीं१०३०

100 लोगों का एक सर्वेक्षण लिया गया था। 60 में दिल की समस्या थी और 40 की नहीं थी। दिल की समस्या वाले 60 में से 45 लोग मोटे थे। दिल की समस्या वाले 40 में से 10 लोग मोटे थे। अगर कोई आपसे पूछे -

  1. दिल की समस्या होने की संभावना क्या है?
  2. दिल की समस्या होने और मोटे न होने की संभावना क्या है?

पहले प्रश्नों का उत्तर आसान है - 60/100। दूसरे के लिए, यह 15/100 होगा। अब तीसरे प्रश्न पर विचार करें - एक व्यक्ति को यादृच्छिक रूप से चुना गया था। उन्हें दिल की बीमारी थी। क्या संभावना है कि वह मोटा है?

अब आपको दी गई जानकारी के बारे में सोचें - यह ज्ञात है कि उसे हृदय रोग है। इसलिए वह 40 से नहीं हो सकता है, जिसे हृदय रोग नहीं है। केवल 60 संभावित विकल्प (तालिका में शीर्ष पंक्ति) हैं। अब, इन कम संभावनाओं के बीच, संभावना है कि वह मोटे हैं 45/60। अब, जब आप जान चुके हैं कि स्वतंत्र कार्यक्रम क्या हैं, तो मशीन लर्निंग के आंकड़ों पर इस लेख में, हम सशर्त संभावनाओं को समझते हैं।

सशर्त संभावनाएं

सशर्त संभावनाओं को समझने के लिए, उपरोक्त चर्चा के साथ अपनी चर्चा जारी रखें। मोटे होने की स्थिति और दिल की समस्या से पीड़ित होने की स्थिति स्वतंत्र नहीं है। अगर मोटे होने से दिल की समस्याओं पर कोई असर नहीं पड़ता है, तो दिल की समस्या वाले लोगों के लिए मोटे और गैर-मोटे मामलों की संख्या समान होती।

इसके अलावा, हमें दिया गया था कि व्यक्ति को हृदय की समस्याएं हैं और हमें यह पता लगाना होगा कि वह मोटा है। इसलिए, इस मामले में, संभावना इस तथ्य पर कही गई है कि उसे हृदय की समस्या है। यदि घटना A की घटना B की स्थिति वातानुकूलित है, तो हम इसका प्रतिनिधित्व करते हैं

P (A | B)

अब, एक प्रमेय है जो हमें इस सशर्त संभावना की गणना करने में मदद करता है। इसे कहते हैं बेय्स रूल

P (A | B) = P (A और B) / P (B)

आप इस प्रमेय की जाँच कर सकते हैं उदाहरण के लिए हमने अभी चर्चा की है। यदि आप अभी तक समझ चुके हैं, तो आप निम्नलिखित के साथ शुरुआत कर सकते हैं - भोले भाले । यह वर्गीकृत करने के लिए सशर्त संभावनाओं का उपयोग करता है कि कोई ईमेल स्पैम है या नहीं। यह कई अन्य वर्गीकरण कार्य कर सकता है। लेकिन अनिवार्य रूप से, सशर्त संभावना के दिल में है ।

आँकड़े:

आंकड़े हैं बड़ी संख्या में डेटा बिंदुओं के बारे में संक्षेप में और निष्कर्ष बनाने के लिए उपयोग किया जाता है। डेटा साइंस और मशीन लर्निंग में, आप अक्सर निम्नलिखित शब्दावली में आएंगे

जावा कैसे एक कार्यक्रम को समाप्त करने के लिए
  • केंद्रीयता के उपाय
  • वितरण (विशेष रूप से सामान्य)

केंद्रीयता के उपाय और प्रसार के उपाय

मतलब:

मीन बस ए है संख्याओं का औसत । मतलब जानने के लिए, आपको संख्याओं को जोड़ना होगा और इसे संख्याओं के साथ विभाजित करना होगा। उदाहरण के लिए, [1,2,3,4,5] का मतलब 15/5 = 3 है।

mean-statistics-for-machine-learning

मेडियन:

मेडियन है संख्याओं के समूह का मध्य तत्व जब उन्हें आरोही क्रम में व्यवस्थित किया जाता है। उदाहरण के लिए, संख्या [1,2,4,3,5] आरोही क्रम में व्यवस्थित हैं [1,2,3,4,5]। इनमें से मध्य एक है 3. इसलिए मध्यिका 3. है लेकिन क्या होगा यदि संख्याओं की संख्या सम है और इसलिए कोई मध्य संख्या नहीं है? उस स्थिति में, आप दो मध्य-सबसे अधिक संख्याओं का औसत लेते हैं। आरोही क्रम में 2n संख्याओं के अनुक्रम के लिए, nth और (n + 1) औसत करेंमंझला पाने के लिए नंबर। उदाहरण - [1,2,3,4,5,6] में माध्यिका (3 + 4) / 2 = 3.5 है

मोड:

मोड बस है संख्याओं के समूह में सबसे अधिक संख्या । उदाहरण के लिए, [1,2,3,3,4,5,5,5] का मोड 5 है।

भिन्न:

भिन्नता कोई केंद्रीयता नहीं है। इसकी माप है इस बीच आपका डेटा कैसे फैल रहा है । इसकी मात्रा निर्धारित है

एक्सएन संख्या का मतलब है। आप एक बिंदु लेते हैं, मतलब घटाते हैं, इस अंतर का वर्ग लेते हैं। सभी एन संख्याओं के लिए ऐसा करें और उन्हें औसत करें। विचरण के वर्गमूल को मानक विचलन कहा जाता है। अगला, मशीन लर्निंग के आंकड़ों पर इस लेख में, आइए हम सामान्य वितरण को समझें।

सामान्य वितरण

वितरण हमारी मदद करता है समझें कि हमारा डेटा कैसे फैला है । उदाहरण के लिए, उम्र के एक नमूने में, हमारे पास बड़े वयस्कों की तुलना में युवा लोग हो सकते हैं और इसलिए अधिक से अधिक उम्र के छोटे मूल्य अधिक होते हैं। लेकिन हम वितरण को कैसे परिभाषित करते हैं? नीचे दिए गए उदाहरण पर विचार करें

Y- अक्ष घनत्व का प्रतिनिधित्व करता है। इस वितरण का मोड 30 है क्योंकि यह शिखर है और इसलिए सबसे अधिक बार होता है। हम माध्यिका का भी पता लगा सकते हैं। मीडियन एक्स-अक्ष पर उस बिंदु पर स्थित है जहां वक्र के नीचे का आधा क्षेत्र कवर किया गया है। किसी भी सामान्य वितरण के तहत क्षेत्र 1 है क्योंकि सभी घटनाओं की संभावनाओं का योग 1 है। उदाहरण के लिए,

उपरोक्त मामले में मेडियन लगभग 4 है। इसका मतलब है कि 4 से पहले वक्र के नीचे का क्षेत्र उसी के बाद का है। 4. एक अन्य उदाहरण पर विचार करें

हम तीन सामान्य वितरण देखते हैं। नीले और लाल रंग का एक ही मतलब है। लाल रंग में अधिक विचरण होता है। इसलिए, यह नीले रंग की तुलना में अधिक फैला हुआ है। लेकिन क्षेत्र 1 होने के कारण, लाल वक्र का शिखर नीला वक्र की तुलना में छोटा है, इस क्षेत्र को स्थिर रखने के लिए।

आशा है कि आप बुनियादी आंकड़ों और सामान्य वितरण को समझ गए होंगे। अब, मशीन लर्निंग के आंकड़ों पर इस लेख में अगला, आइए हम रैखिक बीजगणित के बारे में जानें।

लीनियर अलजेब्रा

लीनियर अलजेब्रा के बिना आधुनिक एआई संभव नहीं होगा। इसका मूल रूप है ध्यान लगा के पढ़ना या सीखना और जैसे सरल एल्गोरिदम में भी इस्तेमाल किया गया है । बिना किसी देरी के, चलो शुरू हो जाओ।

आप वैक्टर से परिचित होना चाहिए। वे अंतरिक्ष में एक प्रकार के ज्यामितीय प्रतिनिधित्व हैं। उदाहरण के लिए, एक वेक्टर [3,4] में एक्स-अक्ष के साथ 3 इकाइयां और वाई-अक्ष के साथ 4 इकाइयां हैं। निम्नलिखित छवि पर विचार करें -

वेक्टर d1 में x- अक्ष के साथ 0.707 और y- अक्ष के साथ 0.707 इकाइयाँ हैं। एक वेक्टर में 1 आयाम होता है। यह आवश्यक रूप से एक परिमाण और एक दिशा है। उदाहरण के लिए,

उपरोक्त छवि में एक वेक्टर (4,3) है। इसका परिमाण 5 है और यह एक्स-अक्ष के साथ 36.9 डिग्री बनाता है।

अब, मैट्रिक्स क्या है? मैट्रिक्स संख्या का एक बहुआयामी सरणी है। यह किसके लिए प्रयोग किया जाता है? हम आगे देखेंगे। लेकिन पहले, आइए देखें कि इसका उपयोग कैसे किया जाता है।

आव्यूह

एक मैट्रिक्स के कई आयाम हो सकते हैं। आइए एक 2-आयामी मैट्रिक्स पर विचार करें। इसकी पंक्तियाँ (m) और स्तंभ (n) हैं। इसलिए इसमें m * n तत्व हैं।

उदाहरण के लिए,

इस मैट्रिक्स में 5 पंक्तियाँ और 5 कॉलम हैं। आइए इसे ए कहते हैं। इसलिए ए (2,3) दूसरी पंक्ति और तीसरे कॉलम में प्रवेश है जो 8 है।

स्ट्रिंग निरंतर पूल में, समान सामग्री वाले दो स्ट्रिंग ऑब्जेक्ट नहीं होंगे।

अब, जब आप जानते हैं कि मैट्रिक्स क्या है, तो हम मैट्रिक्स के विभिन्न कार्यों पर ध्यान दें।

मैट्रिक्स ऑपरेशन

मेट्रिसेस का जोड़

के दो मैट्रेस वही आयाम जोड़े जा सकते हैं। इसके अलावा तत्व-वार होता है।

स्केलर गुणज

एक मैट्रिक्स को एक स्केलर मात्रा से गुणा किया जा सकता है। इस तरह के गुणन को स्केलर द्वारा गुणा किए जा रहे मैट्रिक्स में प्रत्येक प्रविष्टि की ओर जाता है। एक स्केलर सिर्फ एक संख्या है

मैट्रिक्स संक्रमण

मैट्रिक्स संक्रमण सरल है। मैट्रिक्स A (m, n) के लिए, A को इसका स्थानान्तरण मानें। फिर

A '(i, j) = A (j, i)

उदाहरण के लिए,

मैट्रिक्स गुणन

यह शायद अन्य ऑपरेशनों की तुलना में थोड़ा मुश्किल है। इससे पहले कि हम इसमें गोता लगाएँ, दो वैक्टर के बीच डॉट उत्पाद को परिभाषित करें।

वेक्टर X = [1,4,6,0] और वेक्टर Y = [2,3,4,5] पर विचार करें। फिर X और Y के बीच डॉट उत्पाद के रूप में परिभाषित किया गया है

X.Y = 1 * 2 + 4 * 3 + 6 * 4 + 0 * 5 = 38

तो, यह तत्व-वार गुणा और जोड़ है। अभी,आइए दो मैट्रिक्सों पर विचार करें A (m, n) और B (n, k), जहाँ m, n, k आयाम हैं और इसलिए पूर्णांक हैं। हम मैट्रिक्स गुणन को इस प्रकार परिभाषित करते हैं

उपरोक्त उदाहरण में, उत्पाद का पहला तत्व (44) दाएं मैट्रिक्स के पहले कॉलम के साथ बाईं मैट्रिक्स की पहली पंक्ति के डॉट उत्पाद द्वारा प्राप्त किया गया है। इसी तरह, दाएं मैट्रिक्स के दूसरे कॉलम के साथ बाएं मैट्रिक्स की पहली पंक्ति के डॉट उत्पाद द्वारा 72 प्राप्त किया जाता है।

ध्यान दें कि बाएं मैट्रिक्स के लिए, स्तंभों की संख्या दाएं कॉलम में पंक्तियों की संख्या के बराबर होनी चाहिए। हमारे मामले में, उत्पाद AB मौजूद है, लेकिन BA नहीं है क्योंकि m k के बराबर नहीं है। दो मैट्रिक्स ए (एम, एन) और बी (एन, के) के लिए, उत्पाद एबी को परिभाषित किया गया है और उत्पाद का आयाम (एम, के) (एम (एन, एन के बाहरी सबसे आयाम), (एन, के) है ))। लेकिन बीए को तब तक परिभाषित नहीं किया जाता है जब तक कि एम = के।

इसके साथ, हम आंकड़े के लिए मशीन लर्निंग के इस लेख के अंत में आते हैं। मुझे आशा है कि आप कुछ मशीन लर्निंग जारगॉन को समझ गए होंगे। हालांकि यह यहाँ समाप्त नहीं होता है यह सुनिश्चित करने के लिए कि आप उद्योग-तैयार हैं, आप डेटा साइंस और एआई पर एडुर्का के पाठ्यक्रमों की जाँच कर सकते हैं। उन्हें पाया जा सकता है