सोमवार, अक्टूबर 18, 2021
होमComputerक्या आप जानते हैं कि Data Science क्या है?-2020

क्या आप जानते हैं कि Data Science क्या है?-2020

जैसे-जैसे दुनिया Big Data के युग में प्रवेश करती गई, इसके भंडारण की आवश्यकता भी बढ़ती गई। यह 2010 तक enterprise industries के लिए मुख्य चुनौती और चिंता थी। Data Science Artificial Intelligence का भविष्य है। इसलिए, यह समझना बहुत महत्वपूर्ण है कि data Science क्या है? यह क्यों जरूरी है और यह आपके व्यवसाय के लिए मूल्य कैसे जोड़ सकता है।

इस Article के अंत तक, आप समझ पाएंगे कि Data Science क्या है और हमारे चारों ओर Data के Complex और बड़े Sets से सार्थक अंतर्दृष्टि निकालने में इसकी भूमिका क्या है

read this: Operating System क्या है?

आइए समझें कि हमें Data Science की आवश्यकता क्यों है

  • परंपरागत रूप से, हमारे पास जो जानकारी थी, वह ज्यादातर Structured और कम आकार की थी, जिसका विश्लेषण सीधा BI tools का उपयोग करके किया जा सकता है। परंपरागत प्रणालियों के Data के विपरीत, जो ज्यादातर संरचित था, आज अधिकांश जानकारी Unstructured या semi-structured है।
    आइए नीचे दी गई Image के भीतर जानकारी के Trends पर एक नज़र डालें, जिससे पता चलता है कि 2020 तक, जानकारी को देखने के बाद 80% Data unstructured होने जा रहा है।
Data Science kya hai ?
Structured and Unstructured data Graph

यह Data विभिन्न Source से उत्पन्न होता है जैसे Financial Log, Text Files, Multimedia forms, Sensors और Instruments।

Normal BI Tools इस विशाल मात्रा और Data के प्रकार को Processing करने में सक्षम नहीं हैं। यह अक्सर हम processing के लिए अधिक जटिल और उन्नत Analytical Tools और Algorithm को पसंद करते हैं, इसके लिए Meaningful Insights का विश्लेषण और Drawing करते हैं।

यह एकमात्र कारण नहीं है कि Data Science इतना Famous हो गया है। आइए गहराई से देखें और देखें कि विभिन्न Domain में Data Science का उपयोग कैसे किया जा रहा है।

  • यदि आप ग्राहक के पिछले Browsing History, purchase history, Age और Age की तरह ही प्रचलित डेटा से अपने ग्राहकों की सटीक आवश्यकताओं को समझेंगे, तो कैसे होगा।
    इसमें कोई दोराहे नहीं की आपके पास यह सब Data पहले भी था, लेकिन अब बड़ी मात्रा और Data के साथ, आप Model को अधिक प्रभावी ढंग से Train करेंगे और अधिक सटीकता के साथ अपने ग्राहकों को Products की recommendation देंगे।

क्या यह आश्चर्यजनक नहीं है क्योंकि यह आपके Organization में अधिक business लाएगा?

  • निर्णय लेने में ज्ञान विज्ञान की भूमिका को जानने के लिए एक विशेष Example देखते है। कैसा होगा अगर आपकी कार आपको खुद ही आपके घर ले जाए?
    Self-driving कारें सेंसरों से लाइव Data एकत्र करती हैं, जिसमें रडार, कैमरा और लेजर शामिल हैं जो इसके आसपास का नक्शा बनाते हैं। Advance Machine Algorithm का इस्तमाल करके कार का कार्य यह निर्णय लेना है कि कब स्पीड बढ़ानी है ,कब स्पीड घटानी है , कब ओवरटेक करना है, कहां मोड़ की आवश्यकता है।

आइए उन सभी Domain को देखने के लिए नीचे के इन्फोग्राफिक पर एक नज़र डालें जहां Data Science अपनी छाप बना रहा है।

Data Science - Usage of Data Science
By Edureka

अब जब आप डेटा साइंस की आवश्यकता को समझ गए हैं, तो आइए समझते हैं कि Data Science क्या है।

Best Gaming PC India (Desktop) under 50000 in Hindi

यह भी जाने :   Computer Virus क्या है, इनका इतिहास ? पूरी जानकारी।

Data Science क्या है?

Data Science शब्द का इस्तेमाल आम होता जा रहा है, लेकिन इसका क्या मतलब है? Data Scientist बनने के लिए कौन से Skill की जरूरत पड़ती हैं? BI और Data Science के बीच क्या अंतर है? डेटा साइंस में निर्णय और भविष्यवाणियां कैसे की जाती हैं? ये कई सवाल हैं जिनका जवाब आगे दिया जाएगा।

सबसे पहले, आइए देखें कि Data Science क्या है। Data Science विभिन्न Tools, Algorithm, और मशीन लर्निंग सिद्धांतों का एक मिश्रण है, जिसमें raw डेटा से छिपे हुए पैटर्न की खोज करना है। यह कैसे, कुछ वर्षो से किए जा रहे statisticians अलग है ?

इसका उत्तर समझाने और भविष्यवाणी करने के अंतर स्थित में है।

Data Analyst v/s Data Science - Quality Baba

जैसा कि आप ऊपर दी गयी Image में देख सकते है, एक knowledge Analyst आमतौर पर बताता है कि जानकारी के इतिहास के साथ क्या हो रहा है।

इसके विपरीत, Data Scientist न केवल इससे insights प्राप्त करने के लिए खोजपूर्ण विश्लेषण करता है, बल्कि भविष्य के भीतर एक specific घटना की घटना को देखने के लिए विभिन्न उन्नत मशीन लर्निंग Algorithm का भी उपयोग करता है।

एक knowledge Analyst कई कोणों से जानकारी की जाँच करेगा, कभी-कभी ये कोण पहले से ज्ञात नहीं होते।

इसलिए, Data Science का उपयोग मुख्य रूप से निर्णय लेने और Predication करने के लिए किया जाता है जिसमे भविष्य कहनेवाला analytics, prescriptive analytics (भविष्य कहनेवाला निर्णय विज्ञान) और मशीन लर्निंग का उपयोग किया जाता है।

  • Predictive causal analytics – यदि आप एक मॉडल चाहते हैं जो भविष्य में किसी विशेष घटना की संभावनाओं की भविष्यवाणी कर सकता है, तो आपको भविष्य कहनेवाला analytics लागू करने की आवश्यकता है। कहते हैं, यदि आप Credit पर पैसे प्रदान कर रहे हैं, तो समय पर भविष्य के Credit Payment करने वाले ग्राहकों की संभावना आपके लिए चिंता का विषय है। यहां, आप एक मॉडल का निर्माण कर सकते हैं जो भविष्य के Payment समय पर होगा या नहीं, इसका अनुमान लगाने के लिए ग्राहक के payment इतिहास पर भविष्य कहनेवाला विश्लेषण कर सकता है।
  • Prescriptive analytics: यदि आप एक ऐसा मॉडल चाहते हैं जिसमें स्वयं निर्णय लेने की Intelligence हो और इसे Dynamic parameters के साथ संशोधित करने की क्षमता हो, तो आपको निश्चित रूप से इसके लिए Prescriptive analytics की आवश्यकता है। यह relatively नया field सलाह देने के बारे में है। अन्य शब्दों में, यह न केवल भविष्यवाणी करता है, बल्कि निर्धारित कार्यों और संबंधित परिणामों की एक Series का सुझाव देता है।
    इसके लिए सबसे अच्छा उदाहरण Google की Self-driving कार है। वाहनों द्वारा एकत्र किए गए डेटा का उपयोग self-driving कारों को प्रशिक्षित करने के लिए किया जा सकता है। आप इस डेटा पर algorithm चला सकते हैं ताकि इसमें intelligence आ सके। यह आपकी कार को निर्णय लेने में सक्षम करेगा कि कब चालू करना है, कौन सा रास्ता लेना है, कब धीमा करना है या गति बढ़ानी है।
  • Machine learning for making predictions:- यदि आपके पास एक finance कंपनी का लेनदेन Data है और भविष्य की प्रवृत्ति (Trends) को निर्धारित करने के लिए एक मॉडल बनाने की आवश्यकता है, तो मशीन लर्निंग Algorithm सबसे अच्छा है। यह supervised learning के pattern के under आता है। इसे supervised कहा जाता है क्योंकि आपके पास पहले से ही Data है जिसके आधार पर आप अपनी मशीनों को प्रशिक्षित कर सकते हैं। उदाहरण के लिए, एक धोखाधड़ी का पता लगाने वाले मॉडल को धोखाधड़ी खरीद के ऐतिहासिक रिकॉर्ड का उपयोग करके प्रशिक्षित किया जा सकता है।
  • Machine learning for pattern discovery:- यदि आपके पास ऐसे parameter नहीं हैं जिनके आधार पर आप पूर्वानुमान लगा सकते हैं, तो आपको सार्थक पूर्वानुमान बनाने में सक्षम होने के लिए data set के भीतर छिपे हुए pattern का पता लगाने की आवश्यकता है। यह कुछ भी नहीं है लेकिन unsupervised मॉडल के रूप में आपके पास group के लिए कोई predefined labels नहीं है। Pattern की खोज के लिए उपयोग किया जाने वाला सबसे आम Algorithm Clustering है।
    मान लीजिए कि आप एक टेलीफोन कंपनी में काम कर रहे हैं और आपको एक क्षेत्र में टावर लगाकर एक network स्थापित करने की आवश्यकता है। फिर, आप उन टॉवर स्थानों को खोजने के लिए Clustering तकनीक का उपयोग कर सकते हैं जो यह सुनिश्चित करेंगे कि सभी उपयोगकर्ता optimum signal strength प्राप्त करते हैं।
यह भी जाने :   10 best Pen Drive Bootable tools for Windows OS [पूरी जानकारी]
यह भी जाने :   Computer Virus क्या है, इनका इतिहास ? पूरी जानकारी।

Computer Virus क्या है, इनका इतिहास ? पूरी जानकारी।

आइए देखें कि Data Analysis के साथ-साथ Data Science के लिए उपर्युक्त दृष्टिकोणों का अनुपात कैसे भिन्न है। जैसा कि आप नीचे की Image में देख सकते हैं, data Analysis में कुछ हद तक descriptive analytics और भविष्यवाणी शामिल है। दूसरी ओर, डेटा साइंस predictive casual analytics और मशीन लर्निंग के बारे में अधिक है।

Data Science Analytics - Quality Baba
by Edureka

मुझे यकीन है कि आपने Business Intelligence (BI) के बारे में भी सुना होगा। अक्सर डाटा साइंस BI के साथ confused होता है। चलिए दोनों के बिच में कुछ जरुरी अंतर को समझते

Business Intelligence (BI) vs. Data Science

  • BI मूल रूप से व्यापारिक trends का वर्णन करने के लिए insights और hindsight खोजने के लिए पिछले डेटा का विश्लेषण करता है। BI आपको बाहरी और आंतरिक स्रोतों से डेटा लेने, इसे तैयार करने, उस पर query चलाने और quarterly revenue analysis या व्यावसायिक समस्याओं जैसे प्रश्नों का उत्तर देने के लिए Dashboard बनाने में सक्षम बनाता है। निकट भविष्य में BI कुछ घटनाओं के प्रभाव का मूल्यांकन (evaluate) कर सकता है।
  • Data Science एक अधिक forward-looking दृष्टिकोण है, जो अतीत या वर्तमान डेटा का विश्लेषण करने और सूचित निर्णय लेने के उद्देश्य से भविष्य के परिणामों की भविष्यवाणी करने पर ध्यान देने के साथ एक exploratory तरीका है। यह खुले प्रश्नों का उत्तर “क्या” और “कैसे” घटनाओं के रूप में देता है।

Lifecycle of Data Science

यहाँ डेटा विज्ञान जीवनचक्र के मुख्य चरणों का संक्षिप्त विवरण दिया गया है:

Lifecycle of Data Science -Quality Baba

चरण 1 – खोज: परियोजना शुरू करने से पहले, विभिन्न विशिष्टताओं, आवश्यकताओं, प्राथमिकताओं और आवश्यक बजट को समझना महत्वपूर्ण है। आपके पास सही सवाल पूछने की क्षमता होनी चाहिए। यहां, आप आकलन करते हैं कि क्या आपके पास परियोजना के समर्थन के लिए लोगों, प्रौद्योगिकी, समय और डेटा के संदर्भ में आवश्यक संसाधन मौजूद हैं। इस चरण में, आपको व्यवसाय की समस्या को फ्रेम करने और परीक्षण करने के लिए प्रारंभिक परिकल्पना (initial hypotheses- IH) तैयार करने की भी आवश्यकता है।

चरण 2 – Data preparation: इस चरण में, आपको analytical sandbox की आवश्यकता होती है जिसमें आप परियोजना की पूरी अवधि के लिए analytics प्रदर्शन कर सकते हैं। Modeling करने से पहले आपको पता लगाना, preproces और condition Data की जरूरत होती है। इसके अलावा, आप sandbox में डेटा प्राप्त करने के लिए ETLT (extract, transform, load and transform) का प्रदर्शन करेंगे।

यह भी जाने :   Google Jigsaw Technology Kya hai ?
Data preparation - quality Baba

आप डेटा की सफाई, परिवर्तन और दृश्य के लिए R का उपयोग कर सकते हैं। यह आपको outliers को spot करने और variables के बीच संबंध स्थापित करने में मदद करेगा। एक बार जब आप data को साफ और तैयार कर लेते हैं, तो उस पर खोजपूर्ण analysis करने का समय आ जाता है। आइए देखें कि आप इसे कैसे प्राप्त कर सकते हैं

आइए विभिन्न मॉडल नियोजन उपकरणों पर एक नज़र डालें।

Model planning tools in Data Science - Quality Baba
  • R में मॉडलिंग क्षमताओं का एक पूरा सेट है और analytical मॉडल बनाने के लिए एक अच्छा वातावरण प्रदान करता है।
  • SQL Analysis services सामान्य डेटा माइनिंग functions और basic productivity मॉडल का उपयोग करके Database-database analytics का प्रदर्शन कर सकती हैं।
  • SAS / ACCESS का उपयोग Hadoop के डेटा तक पहुंचने के लिए किया जा सकता है और इसका उपयोग repeatable और पुन: प्रयोज्य मॉडल flow diagrams बनाने के लिए किया जाता है।

हालाँकि, कई उपकरण बाजार में मौजूद हैं लेकिन R सबसे अधिक इस्तेमाल किया जाने वाला उपकरण है।

यह भी जाने :   Top 10 important keyboard shortcuts (जरूर पढ़े )

अब जब आप अपने डेटा की प्रकृति में insights प्राप्त कर चुके हैं और उपयोग किए जाने वाले algorithm का फैसला कर चुके हैं। अगले चरण में, आप algorithm लागू करेंगे और एक मॉडल बनाएंगे।

चरण 4—Model building: इस चरण में, आप प्रशिक्षण और परीक्षण उद्देश्यों के लिए Data set विकसित करेंगे। आप विचार करेंगे कि क्या आपके मौजूदा उपकरण मॉडल चलाने के लिए पर्याप्त होंगे या इसके लिए अधिक मजबूत वातावरण (जैसे fast and parallel processing) की आवश्यकता होगी। आप मॉडल बनाने के लिए विभिन्न शिक्षण तकनीकों जैसे classification, association और clustering का विश्लेषण करेंगे।

आप निम्नलिखित उपकरणों के माध्यम से मॉडल निर्माण प्राप्त कर सकते हैं।

Model building tools in Data Science

चरण 5—Operationalize: इस चरण में, आप अंतिम रिपोर्ट, briefing, कोड और तकनीकी दस्तावेज वितरित करते हैं। इसके अलावा, कभी-कभी एक pilot project वास्तविक समय के उत्पादन वातावरण में भी लागू किया जाता है। यह आपको पूर्ण तैनाती से पहले छोटे पैमाने पर प्रदर्शन और अन्य संबंधित बाधाओं की एक स्पष्ट तस्वीर प्रदान करेगा।

चरण 6—Communicate results: अब यह मूल्यांकन करना महत्वपूर्ण है कि क्या आप अपने लक्ष्य को प्राप्त करने में सक्षम हैं जो आपने पहले चरण में योजना बनाई थी। इसलिए, अंतिम चरण में, आप सभी प्रमुख निष्कर्षों की पहचान करते हैं, stakeholder से संवाद करते हैं और यह निर्धारित करते हैं कि परियोजना के परिणाम चरण 1 में विकसित parameter के आधार पर सफलता या विफलता हैं।

Conclusion “Data Science क्या है?”

अंत में, यह कहना गलत नहीं होगा कि भविष्य Data Scientist का है। यह अनुमान लगाया जाता है कि वर्ष 2020 के अंत तक लगभग एक मिलियन Data Scientist की आवश्यकता होगी। अधिक से अधिक Data कुंजी व्यवसाय को चलाने के लिए अवसर प्रदान करेगा

मुझे आशा है कि आपको “Data Science क्या है” के बारे में आपका जवाब मिल गया है।

यदि आपके पास कोई Query बची है तो कृपया एक Comment छोड़ दें

आइये हमारे साथ हमारे mission में जुड़िए और इस पोस्ट को अपने दोस्तों के साथ ज्यादा से ज्यादा शेयर करे ताकि उन्हें भी कुछ नया Technical सिखने को मिले।

Abhimanyu Vaishnavhttps://qualitybaba.com/
Abhimanyu Vaishnav 2015 से कंप्यूटर साइंस टीचर हैं, वह मार्केटिंग, सेल्स एक्सपर्ट है और साथ ही डिजिटल मार्केटिंग, ब्लॉग्गिंग और सॉफ्टवेयर डेवलपमेंट में उनकी अच्छी पकड़ है। अभिमन्यु का लक्ष्य सभी को आसान भाषा में तकनीकी ज्ञान प्रदान करना है ।
RELATED ARTICLES

3 टिप्पणी

कोई जवाब दें

Please enter your comment!
Please enter your name here

Most Popular

All Categories

Recent Comments

Stay Connected – Don’t Miss !

Subscribe our News letter and don’t miss the updates.