Chi-Square Test of Independence of Attributes in 2X2 Contingency Table

Chi-Square Test of Independence of Attributes in 2X2 Contingency Table (2X2 कंटिन्जेंसी टेबल में गुणों की स्वतंत्रता का काइ-वर्ग परीक्षण):- The Chi-Square Test of Independence is a statistical method used to determine whether there is a significant association between two categorical variables. Specifically, in the context of a 2x2 contingency table, this test assesses whether the distribution of one variable is independent of the other.
(स्वतंत्रता का काइ-वर्ग परीक्षण एक सांख्यिकीय विधि है जिसका उपयोग यह निर्धारित करने के लिए किया जाता है कि दो श्रेणीबद्ध चर के बीच कोई महत्वपूर्ण संबंध है या नहीं। विशेष रूप से, 2x2 कंटिन्जेंसी टेबल के संदर्भ में, यह परीक्षण यह आकलन करता है कि क्या एक चर का वितरण दूसरे से स्वतंत्र है।)
What is a 2x2 Contingency Table (2x2 कंटिन्जेंसी टेबल क्या है):- A 2x2 contingency table is a type of matrix that displays the frequency distribution of two categorical variables. Each variable has two levels (or categories), resulting in a table with four cells.
[2x2 कंटिन्जेंसी टेबल एक प्रकार की मैट्रिक्स है जो दो श्रेणीबद्ध चरों का आवृत्ति वितरण प्रदर्शित करती है। प्रत्येक चर में दो स्तर (या श्रेणियाँ) होते हैं, जिससे चार सेल्स वाली एक टेबल बनती है।]
Here’s a general structure of a 2x2 contingency table:
(यहाँ 2x2 कंटिन्जेंसी टेबल की सामान्य संरचना दी गई है:)
A1, A2:- Categories of Variable A 
(चर A की श्रेणियाँ)
B1, B2:- Categories of Variable B
(चर B की श्रेणियाँ)
A1B1, A1B2, A2B1, A2B2:- Frequencies of occurrences in each category combination
(प्रत्येक श्रेणी संयोजन में घटनाओं की आवृत्तियाँ)
A1+ and A2+:- Row totals (पंक्ति के कुल)
B1+ and B2+:- Column totals (स्तंभ के कुल)
N:- Grand total (sum of all frequencies)
[संपूर्ण कुल (सभी आवृत्तियों का योग)]

Hypotheses (परिकल्पनाएँ):-
Null Hypothesis (शून्य परिकल्पना) (H₀):- The two variables are independent. There is no association between the two categorical variables.
(दोनों चर स्वतंत्र हैं। दोनों श्रेणीबद्ध चरों के बीच कोई संबंध नहीं है।)
Alternative Hypothesis (वैकल्पिक परिकल्पना) (H₁):- The two variables are not independent. There is an association between the two categorical variables.
(दोनों चर स्वतंत्र नहीं हैं। दोनों श्रेणीबद्ध चरों के बीच संबंध है।)

Expected Frequencies (अपेक्षित आवृत्तियाँ):- To conduct the Chi-Square Test, we first calculate the expected frequencies for each cell in the contingency table under the assumption that the variables are independent.
(काइ-वर्ग परीक्षण को करने के लिए, हम सबसे पहले कंटिन्जेंसी टेबल के प्रत्येक सेल के लिए अपेक्षित आवृत्तियों की गणना करते हैं, यह मानते हुए कि चर स्वतंत्र हैं।)
The expected frequency for each cell is calculated as:
(प्रत्येक सेल के लिए अपेक्षित आवृत्ति की गणना इस प्रकार की जाती है:)
Where (जहाँ):
Eij is the expected frequency for cell (i, j),
[Eij सेल (i, j) के लिए अपेक्षित आवृत्ति है,]
Row Total is the total for the row containing cell (i, j),
[पंक्तिकुल वह कुल है जिसमें सेल (i, j) होता है,]
Column Total is the total for the column containing cell (i, j),
[स्तंभकुल वह कुल है जिसमें सेल (i, j) होता है,]
N is the grand total (sum of all observations)
[N संपूर्ण कुल है (सभी अवलोकनों का योग)।]

Calculating the Chi-Square Statistic (काइ-वर्ग सांख्यिकी की गणना ):-
The Chi-Square statistic (χ2) is calculated using the formula:
[ची-स्क्वेयर सांख्यिकी (χ2) की गणना निम्नलिखित सूत्र का उपयोग करके की जाती है:]
Where (जहाँ):
Oij is the observed frequency in cell (i, j),
[Oij सेल (i, j) में देखी गई आवृत्ति है,]
Eij is the expected frequency in cell (i, j).
[Eij सेल (i, j) में अपेक्षित आवृत्ति है।]
This sum is taken over all four cells in the 2x2 contingency table.
[यह योग 2x2 कंटिन्जेंसी टेबल के सभी चार सेल्स पर लिया जाता है।]

Degrees of Freedom (स्वतंत्रता की कोटि):- For a 2x2 contingency table, the degrees of freedom (df) are:
[2x2 कंटिन्जेंसी टेबल के लिए स्वतंत्रता की कोटि (df) इस प्रकार है:]
df = (r − 1) × (c − 1)
Where (जहाँ):
r is the number of rows,
(r पंक्तियों की संख्या है,)
c is the number of columns.
(c स्तंभों की संख्या है।)
For a 2x2 table, df = (2 − 1) × (2 − 1) = 1.
[2x2 टेबल के लिए, df = (2 − 1) × (2 − 1) = 1]

Critical Value and Decision Rule (क्रान्तिक मान और निर्णय नियम):- To determine whether the association between the variables is statistically significant, we compare the calculated χvalue to the critical value from the Chi-Square distribution table at the desired significance level (usually 0.05) and 1 degree of freedom.
[यह निर्धारित करने के लिए कि चरों के बीच संबंध सांख्यिकीय रूप से महत्वपूर्ण है या नहीं, हम गणना किए गए χ2 मान की तुलना काइ-वर्ग वितरण तालिका से दिए गए क्रान्तिक मान से करते हैं, जो वांछित महत्व स्तर (आमतौर पर 0.05) और 1 स्वतंत्रता की कोटि पर होता है।]
- If χ2calculated > χ2critical, we reject the null hypothesis, indicating a significant association between the variables.
(यदि χ2calculated > χ2critical, तो हम शून्य परिकल्पना को अस्वीकार करते हैं, जो कि चरों के बीच महत्वपूर्ण संबंध को दर्शाता है।)
- If χ2calculated ≤ χ2critical, we fail to reject the null hypothesis, indicating no significant association between the variables.
(यदि χ2calculated ≤ χ2critical, तो हम शून्य परिकल्पना को अस्वीकार नहीं करते हैं, जो कि चरों के बीच महत्वपूर्ण संबंध को नहीं दर्शाता है।)

Example (उदाहरण):- Let’s consider an example to illustrate the Chi-Square Test of Independence in a 2x2 contingency table.
(आइए एक उदाहरण पर विचार करें जो 2x2 कंटिन्जेंसी टेबल में काइ-वर्ग स्वतंत्रता परीक्षण को स्पष्ट करता है।)
Suppose we have the following data:
(मान लीजिए हमारे पास निम्नलिखित डेटा है:)

i. Calculate Expected Frequencies (अपेक्षित आवृत्तियों की गणना करें):-
ii. Calculate the Chi-Square Statistic (काइ-वर्ग सांख्यिकी की गणना करें):-
iii. Determine the Critical Value (क्रान्तिक मान निर्धारित करें):- For df = 1 and significance level α=0.05, the critical value from the Chi-Square table is approximately 3.841.
(स्वतंत्रता की डिग्री df=1 और महत्व स्तर α=0.05 पर काइ-वर्ग तालिका से क्रान्तिक मान लगभग 3.841 है।)
iv. Compare and Conclude (तुलना करें और निष्कर्ष निकालें):- 
> If χ2calculated is greater than 3.841, reject the null hypothesis.
(यदि χ2calculated 3.841 से अधिक है, तो शून्य परिकल्पना को अस्वीकार करें।)
> If χ2calculated is less than or equal to 3.841, do not reject the null hypothesis.
(यदि χ2calculated 3.841 से कम या उसके बराबर है, तो शून्य परिकल्पना को अस्वीकार न करें।)
> This test allows us to conclude whether there is a statistically significant association between the variables, such as smoking and heart disease in this example.
(यह परीक्षण हमें यह निष्कर्ष निकालने में सक्षम बनाता है कि चरों के बीच संबंध सांख्यिकीय रूप से महत्वपूर्ण है या नहीं, जैसे इस उदाहरण में धूम्रपान और हृदय रोग के बीच।)

Assumptions and Considerations (धारणाएँ और विचार):-
Sample Size (नमूना आकार):- The test assumes that the sample size is sufficiently large. Generally, expected frequencies in each cell should be 5 or more.
(यह परीक्षण मानता है कि नमूना आकार पर्याप्त रूप से बड़ा है। सामान्यतः, प्रत्येक सेल में अपेक्षित आवृत्तियाँ 5 या उससे अधिक होनी चाहिए।)
Independence (स्वतंत्रता):- Observations should be independent of each other.
(अवलोकन स्वतंत्र होना चाहिए।)
Categorical Variables (श्रेणीबद्ध चर):- The test is appropriate only for categorical data.
(यह परीक्षण केवल श्रेणीबद्ध डेटा के लिए उपयुक्त है।)