Lecture-5 Statistical analysis, mathematical expressions, Database, concepts and types
Statistical analysis, mathematical expressions, Database, concepts and types (सांख्यिकीय विश्लेषण, गणितीय अभिव्यक्तियाँ, डेटाबेस, अवधारणाएँ और प्रकार):-
Statistical analysis (सांख्यिकीय विश्लेषण):-
> Statistical analysis is the process of collecting and analyzing large volumes of data in order to identify trends and develop valuable insights.
(सांख्यिकीय विश्लेषण रुझानों की पहचान करने और मूल्यवान अंतर्दृष्टि विकसित करने के लिए बड़ी मात्रा में डेटा एकत्र करने और विश्लेषण करने की प्रक्रिया है।)
> In the professional world, statistical analysts take raw data and find correlations between variables to reveal patterns and trends to relevant stakeholders. Working in a wide range of different fields, statistical analysts are responsible for new scientific discoveries, improving the health of our communities, and guiding business decisions.
(पेशेवर दुनिया में, सांख्यिकीय विश्लेषक कच्चा डेटा लेते हैं और प्रासंगिक हितधारकों को पैटर्न और रुझान प्रकट करने के लिए चर के बीच सहसंबंध ढूंढते हैं। विभिन्न क्षेत्रों की एक विस्तृत श्रृंखला में काम करते हुए, सांख्यिकीय विश्लेषक नई वैज्ञानिक खोजों, हमारे समुदायों के स्वास्थ्य में सुधार और व्यावसायिक निर्णयों का मार्गदर्शन करने के लिए जिम्मेदार हैं।)
Types of statistical analysis (सांख्यिकीय विश्लेषण के प्रकार):- There are two main types of statistical analysis: descriptive and inferential. As a statistical analyst, you'll likely use both types in your daily work to ensure that data is both clearly communicated to others and that it's used effectively to develop actionable insights.
(सांख्यिकीय विश्लेषण के दो मुख्य प्रकार हैं: वर्णनात्मक और अनुमानात्मक। एक सांख्यिकीय विश्लेषक के रूप में, आप संभवतः अपने दैनिक कार्य में दोनों प्रकार का उपयोग करेंगे ताकि यह सुनिश्चित किया जा सके कि डेटा दूसरों को स्पष्ट रूप से संप्रेषित किया गया है और इसका उपयोग कार्रवाई योग्य अंतर्दृष्टि विकसित करने के लिए प्रभावी ढंग से किया गया है।)
i. Descriptive statistical analysis (वर्णनात्मक सांख्यिकीय विश्लेषण):-
- Descriptive statistics summarizes the information within a data set without drawing conclusions about its contents. For example, if a business gave you a book of its expenses and you summarized the percentage of money it spent on different categories of items, then you would be performing a form of descriptive statistics.
(वर्णनात्मक आँकड़े किसी डेटा सेट के भीतर उसकी सामग्री के बारे में निष्कर्ष निकाले बिना जानकारी का सारांश प्रस्तुत करते हैं। उदाहरण के लिए, यदि किसी व्यवसाय ने आपको अपने खर्चों की एक पुस्तक दी है और आपने विभिन्न श्रेणियों की वस्तुओं पर खर्च किए गए धन के प्रतिशत का सारांश दिया है, तो आप वर्णनात्मक आंकड़ों का एक रूप प्रस्तुत कर रहे होंगे।)
- When performing descriptive statistics, you will often use data visualization to present information in the form of graphs, tables, and charts to clearly convey it to others in an understandable format. Typically, leaders in a company or organization will then use this data to guide their decision making going forward.
(वर्णनात्मक आँकड़े निष्पादित करते समय, आप अक्सर जानकारी को ग्राफ़, तालिकाओं और चार्ट के रूप में प्रस्तुत करने के लिए डेटा विज़ुअलाइज़ेशन का उपयोग करेंगे ताकि इसे समझने योग्य प्रारूप में दूसरों तक स्पष्ट रूप से पहुंचाया जा सके। आमतौर पर, किसी कंपनी या संगठन के नेता आगे चलकर अपने निर्णय लेने में मार्गदर्शन के लिए इस डेटा का उपयोग करेंगे।)
ii. Inferential statistical analysis (अनुमानात्मक सांख्यिकीय विश्लेषण):-
- Inferential statistics takes the results of descriptive statistics one step further by drawing conclusions from the data and then making recommendations. For example, instead of only summarizing the business's expenses, you might go on to recommend in which areas to reduce spending and suggest an alternative budget.
(अनुमानित आँकड़े डेटा से निष्कर्ष निकालकर और फिर सिफारिशें करके वर्णनात्मक आँकड़ों के परिणामों को एक कदम आगे ले जाते हैं। उदाहरण के लिए, केवल व्यवसाय के खर्चों का सारांश देने के बजाय, आप यह सुझाव दे सकते हैं कि किन क्षेत्रों में खर्च कम किया जाए और वैकल्पिक बजट का सुझाव दिया जाए।)
- Inferential statistical analysis is often used by businesses to inform company decisions and in scientific research to find new relationships between variables.
(कंपनी के निर्णयों को सूचित करने और चर के बीच नए संबंधों को खोजने के लिए वैज्ञानिक अनुसंधान में व्यवसायों द्वारा अक्सर अनुमानित सांख्यिकीय विश्लेषण का उपयोग किया जाता है।)
Statistical analyst duties (सांख्यिकीय विश्लेषक कर्तव्य):- Statistical analysts focus on making large sets of data understandable to a more general audience. In effect, you'll use your math and data skills to translate big numbers into easily digestible graphs, charts, and summaries for key decision makers within businesses and other organizations. Typical job responsibilities of statistical analysts include:
(सांख्यिकीय विश्लेषक डेटा के बड़े सेट को अधिक सामान्य दर्शकों के लिए समझने योग्य बनाने पर ध्यान केंद्रित करते हैं। वास्तव में, आप व्यवसायों और अन्य संगठनों के प्रमुख निर्णय निर्माताओं के लिए बड़ी संख्याओं को आसानी से पचने योग्य ग्राफ़, चार्ट और सारांश में अनुवाद करने के लिए अपने गणित और डेटा कौशल का उपयोग करेंगे। सांख्यिकीय विश्लेषकों की विशिष्ट कार्य जिम्मेदारियों में शामिल हैं:)
i. Extracting and organizing large sets of raw data.
(कच्चे डेटा के बड़े सेट को निकालना और व्यवस्थित करना।)
ii. Determining which data is relevant and which should be excluded.
(यह निर्धारित करना कि कौन सा डेटा प्रासंगिक है और किसे बाहर रखा जाना चाहिए।)
iii. Developing new data collection strategies.
(नई डेटा संग्रह रणनीतियाँ विकसित करना।)
iv. Meeting with clients and professionals to review data analysis plans.
(डेटा विश्लेषण योजनाओं की समीक्षा के लिए ग्राहकों और पेशेवरों के साथ बैठक।)
v. Creating data reports and easily understandable representations of the data.
(डेटा रिपोर्ट बनाना और डेटा का आसानी से समझने योग्य प्रतिनिधित्व करना।)
vi. Presenting data.
(डेटा प्रस्तुत करना।)
vii. Interpreting data results.
(डेटा परिणामों की व्याख्या करना।)
viii. Creating recommendations for a company or other organizations.
(किसी कंपनी या अन्य संगठनों के लिए सिफ़ारिशें बनाना।)
Note (नोट):- Your job responsibilities will differ depending on whether you work for a federal agency, a private company, or another business sector. Many industries need statistical analysts, so exploring your passions and seeing how you can best apply your data skills can be exciting.
(आप किसी संघीय एजेंसी, निजी कंपनी या किसी अन्य व्यावसायिक क्षेत्र के लिए काम करते हैं या नहीं, इसके आधार पर आपकी नौकरी की जिम्मेदारियां अलग-अलग होंगी। कई उद्योगों को सांख्यिकीय विश्लेषकों की आवश्यकता होती है, इसलिए अपने जुनून की खोज करना और यह देखना कि आप अपने डेटा कौशल को सर्वोत्तम तरीके से कैसे लागू कर सकते हैं, रोमांचक हो सकता है।)
Statistical analysis skills (सांख्यिकीय विश्लेषण कौशल):- Because most of your job responsibilities will likely focus on data and statistical analysis, mathematical skills are crucial. High-level math skills can help you fact-check your work and create strategies to analyze the data, even if you use software for many computations. When honing in on your mathematical skills, focusing on statistics—specifically statistics with large data sets—can help set you apart when searching for job opportunities. Competency with computer software and learning new platforms will also help you excel in more advanced positions and put you in high demand.
(चूँकि आपकी अधिकांश नौकरी की जिम्मेदारियाँ संभवतः डेटा और सांख्यिकीय विश्लेषण पर केंद्रित होंगी, गणितीय कौशल महत्वपूर्ण हैं। उच्च-स्तरीय गणित कौशल आपको अपने काम की तथ्य-जांच करने और डेटा का विश्लेषण करने के लिए रणनीति बनाने में मदद कर सकते हैं, भले ही आप कई संगणनाओं के लिए सॉफ़्टवेयर का उपयोग करते हों। अपने गणितीय कौशल को निखारते समय, आंकड़ों पर ध्यान केंद्रित करना - विशेष रूप से बड़े डेटा सेट वाले आंकड़े - नौकरी के अवसरों की तलाश करते समय आपको अलग दिखने में मदद कर सकते हैं। कंप्यूटर सॉफ़्टवेयर में योग्यता और नए प्लेटफ़ॉर्म सीखने से आपको अधिक उन्नत पदों पर उत्कृष्टता प्राप्त करने में मदद मिलेगी और आपको उच्च मांग में रखा जाएगा।)
Database (डेटाबेस):-
> A database is a systematic collection of data. They support electronic storage and manipulation of data. Databases make data management easy.
(डेटाबेस डेटा का एक व्यवस्थित संग्रह है। वे इलेक्ट्रॉनिक भंडारण और डेटा के हेरफेर का समर्थन करते हैं। डेटाबेस डेटा प्रबंधन को आसान बनाते हैं।)
> Let us discuss a database example: An online telephone directory uses a database to store data of people, phone numbers, and other contact details. Your electricity service provider uses a database to manage billing, client-related issues, handle fault data, etc.
(आइए एक डेटाबेस उदाहरण पर चर्चा करें: एक ऑनलाइन टेलीफोन निर्देशिका लोगों का डेटा, फोन नंबर और अन्य संपर्क विवरण संग्रहीत करने के लिए एक डेटाबेस का उपयोग करती है। आपका बिजली सेवा प्रदाता बिलिंग, ग्राहक-संबंधित मुद्दों, गलती डेटा को संभालने आदि के लिए एक डेटाबेस का उपयोग करता है।)
> Let us also consider Facebook. It needs to store, manipulate, and present data related to members, their friends, member activities, messages, advertisements, and a lot more. We can provide a countless number of examples for the usage of databases.
(आइये फेसबुक पर भी विचार करें. इसे सदस्यों, उनके दोस्तों, सदस्य गतिविधियों, संदेशों, विज्ञापनों और बहुत कुछ से संबंधित डेटा को संग्रहीत, हेरफेर और प्रस्तुत करने की आवश्यकता है। हम डेटाबेस के उपयोग के लिए अनगिनत उदाहरण प्रदान कर सकते हैं।)
Types of Databases (डेटाबेस के प्रकार):-
i. Distributed databases (वितरण डेटाबेस):- A distributed database is a type of database that has contributions from the common database and information captured by local computers. In this type of database system, the data is not in one place and is distributed at various organizations.
(वितरित डेटाबेस एक प्रकार का डेटाबेस है जिसमें सामान्य डेटाबेस और स्थानीय कंप्यूटरों द्वारा कैप्चर की गई जानकारी का योगदान होता है। इस प्रकार की डेटाबेस प्रणाली में, डेटा एक स्थान पर नहीं होता है और विभिन्न संगठनों में वितरित किया जाता है।)
ii. Relational databases (संबंधपरक डेटाबेस):- This type of database defines database relationships in the form of tables. It is also called Relational DBMS, which is the most popular DBMS type in the market. Database example of the RDBMS system include MySQL, Oracle, and Microsoft SQL Server database.
(इस प्रकार का डेटाबेस डेटाबेस संबंधों को तालिकाओं के रूप में परिभाषित करता है। इसे रिलेशनल DBMS भी कहा जाता है, जो बाज़ार में सबसे लोकप्रिय DBMS प्रकार है। RDBMS सिस्टम के डेटाबेस उदाहरण में MySQL, Oracle और Microsoft SQL सर्वर डेटाबेस शामिल हैं।)
iii. Object-oriented databases (ऑब्जेक्ट-ओरिएंटेड डेटाबेस):- This type of computers database supports the storage of all data types. The data is stored in the form of objects. The objects to be held in the database have attributes and methods that define what to do with the data. PostgreSQL is an example of an object-oriented relational DBMS.
(इस प्रकार का कंप्यूटर डेटाबेस सभी प्रकार के डेटा के भंडारण का समर्थन करता है। डेटा को ऑब्जेक्ट के रूप में संग्रहीत किया जाता है। डेटाबेस में रखी जाने वाली वस्तुओं में विशेषताएँ और विधियाँ होती हैं जो परिभाषित करती हैं कि डेटा के साथ क्या करना है। PostgreSQL ऑब्जेक्ट-ओरिएंटेड रिलेशनल DBMS का एक उदाहरण है।)
iv. Centralized database (केंद्रीकृत डेटाबेस):- It is a centralized location, and users from different backgrounds can access this data. This type of computers databases store application procedures that help users access the data even from a remote location.
(यह एक केंद्रीकृत स्थान है, और विभिन्न पृष्ठभूमि के उपयोगकर्ता इस डेटा तक पहुंच सकते हैं। इस प्रकार के कंप्यूटर डेटाबेस एप्लिकेशन प्रक्रियाओं को संग्रहीत करते हैं जो उपयोगकर्ताओं को दूरस्थ स्थान से भी डेटा तक पहुंचने में मदद करते हैं।)
v. Open-source databases (ओपन-सोर्स डेटाबेस):- This kind of database stored information related to operations. It is mainly used in the field of marketing, employee relations, customer service, of databases.
(इस प्रकार के डेटाबेस में संचालन से संबंधित जानकारी संग्रहीत होती है। इसका उपयोग मुख्य रूप से डेटाबेस के विपणन, कर्मचारी संबंध, ग्राहक सेवा के क्षेत्र में किया जाता है।)
vi. Cloud databases (क्लाउड डेटाबेस):- A cloud database is a database which is optimized or built for such a virtualized environment. There are so many advantages of a cloud database, some of which can pay for storage capacity and bandwidth. It also offers scalability on-demand, along with high availability.
(क्लाउड डेटाबेस एक ऐसा डेटाबेस है जो ऐसे वर्चुअलाइज्ड वातावरण के लिए अनुकूलित या निर्मित किया जाता है। क्लाउड डेटाबेस के बहुत सारे फायदे हैं, जिनमें से कुछ भंडारण क्षमता और बैंडविड्थ के लिए भुगतान कर सकते हैं। यह उच्च उपलब्धता के साथ-साथ ऑन-डिमांड स्केलेबिलिटी भी प्रदान करता है।)
vii. Data warehouses (डेटा गोदाम):- Data Warehouse is to facilitate a single version of truth for a company for decision making and forecasting. A Data warehouse is an information system that contains historical and commutative data from single or multiple sources. Data Warehouse concept simplifies the reporting and analysis process of the organization.
(डेटा वेयरहाउस का उद्देश्य किसी कंपनी को निर्णय लेने और पूर्वानुमान लगाने के लिए सत्य के एकल संस्करण की सुविधा प्रदान करना है। डेटा वेयरहाउस एक सूचना प्रणाली है जिसमें एकल या एकाधिक स्रोतों से ऐतिहासिक और क्रमविनिमेय डेटा शामिल होता है। डेटा वेयरहाउस अवधारणा संगठन की रिपोर्टिंग और विश्लेषण प्रक्रिया को सरल बनाती है।)
viii. NoSQL databases (नोएसक्यूएल डेटाबेस):- NoSQL database is used for large sets of distributed data. There are a few big data performance problems that are effectively handled by relational databases. This type of computers database is very efficient in analyzing large-size unstructured data.
(NoSQL डेटाबेस का उपयोग वितरित डेटा के बड़े सेट के लिए किया जाता है। कुछ बड़ी डेटा प्रदर्शन समस्याएं हैं जिन्हें रिलेशनल डेटाबेस द्वारा प्रभावी ढंग से नियंत्रित किया जाता है। इस प्रकार का कंप्यूटर डेटाबेस बड़े आकार के असंरचित डेटा का विश्लेषण करने में बहुत कुशल है।)
ix. Graph databases (ग्राफ़ डेटाबेस):- A graph-oriented database uses graph theory to store, map, and query relationships. These kinds of computers databases are mostly used for analyzing interconnections. For example, an organization can use a graph database to mine data about customers from social media.
(एक ग्राफ़-उन्मुख डेटाबेस रिश्तों को संग्रहीत करने, मैप करने और क्वेरी करने के लिए ग्राफ़ सिद्धांत का उपयोग करता है। इस प्रकार के कंप्यूटर डेटाबेस का उपयोग अधिकतर इंटरकनेक्शन का विश्लेषण करने के लिए किया जाता है। उदाहरण के लिए, कोई संगठन सोशल मीडिया से ग्राहकों के बारे में डेटा प्राप्त करने के लिए ग्राफ़ डेटाबेस का उपयोग कर सकता है।)