Karl Pearson’s Coefficient of Correlation, Linear Regression Equations

Karl Pearson’s Coefficient of Correlation, Linear Regression Equations (कार्ल पीयरसन का सहसंबंध गुणांक, रैखिक प्रतिगमन समीकरण):-
Karl Pearson’s Coefficient of Correlation (कार्ल पीयरसन का सहसंबंध गुणांक):- Karl Pearson’s Coefficient of Correlation (r) is a measure of the strength and direction of the linear relationship between two variables. It is also known as the Pearson correlation coefficient, and it is one of the most commonly used metrics to evaluate the linear association between two continuous variables.
[कार्ल पीयरसन का सहसंबंध गुणांक (r) दो चर के बीच रैखिक संबंध की ताकत और दिशा को मापने का एक उपाय है। इसे पियरसन सहसंबंध गुणांक भी कहा जाता है, और यह निरंतर चरों के बीच रैखिक संबंध का मूल्यांकन करने के लिए सबसे सामान्य रूप से उपयोग किए जाने वाले मापकों में से एक है।]
Formula (सूत्र):- The formula for Pearson's correlation coefficient is:
(पियरसन के सहसंबंध गुणांक का सूत्र इस प्रकार है:)
Where (जहां):
r is the Pearson correlation coefficient
(r पियरसन सहसंबंध गुणांक है)
n is the number of pairs of scores
(n स्कोरों के युग्मों की संख्या है)
x and y are the individual sample points
(x और y व्यक्तिगत नमूना बिंदु हैं)
xy is the sum of the products of paired scores
(∑xy युग्मित स्कोरों के गुणनों का योग है)
x and y are the sums of the
x
 and
y
 scores respectively
(∑x और ∑y क्रमशः x और y स्कोरों का योग है)
x2 and
\sum y^2
y2 are the sums of the squared
x
 and y scores respectively
(∑x2 और ∑y2 क्रमशः x और y स्कोरों के वर्गों का योग है)
Interpretation of r (r का अर्थ):-
r = 1:- Perfect positive correlation, meaning that as one variable increases, the other variable also increases in a perfectly linear relationship.
(पूर्ण धनात्मक सहसंबंध, जिसका अर्थ है कि जैसे ही एक चर बढ़ता है, दूसरा चर भी पूरी तरह रैखिक संबंध में बढ़ता है।)
r = −1:- Perfect negative correlation, meaning that as one variable increases, the other variable decreases in a perfectly linear relationship.
(पूर्ण ऋणात्मक सहसंबंध, जिसका अर्थ है कि जैसे ही एक चर बढ़ता है, दूसरा चर पूरी तरह रैखिक संबंध में घटता है।)
r = 0:- No linear correlation, meaning there is no linear relationship between the variables.
 (कोई रैखिक सहसंबंध नहीं, जिसका अर्थ है कि चरों के बीच कोई रैखिक संबंध नहीं है।)
Note (नोट):- Values of r close to 1 or -1 indicate strong correlations, while values close to 0 indicate weak correlations.
(r के 1 या -1 के करीब मान मजबूत सहसंबंध को दर्शाते हैं, जबकि 0 के करीब मान कमजोर सहसंबंध को दर्शाते हैं।)

Linear Regression Equations (रैखिक प्रतिगमन समीकरण):- Linear regression is a method to model the relationship between two variables by fitting a linear equation to observed data. One variable is considered to be an explanatory variable, and the other is considered to be a dependent variable.
(रैखिक प्रतिगमन एक विधि है जिसमें दो चरों के बीच संबंध को अवलोकित डेटा पर एक रैखिक समीकरण फिट करके मॉडल किया जाता है। एक चर को व्याख्यात्मक चर माना जाता है, और दूसरे को आश्रित चर माना जाता है।)
Simple Linear Regression (साधारण रैखिक प्रतिगमन):- In simple linear regression, the relationship between two variables is modeled with a straight line. The equation of this line (also called the regression equation) is:
[साधारण रैखिक प्रतिगमन में, दो चरों के बीच संबंध को एक सीधी रेखा के साथ मॉडल किया जाता है। इस रेखा का समीकरण (जिसे प्रतिगमन समीकरण भी कहा जाता है) इस प्रकार है:]
y = a + bx
Where (जहां):
y is the dependent variable (the variable we are trying to predict)
[y आश्रित चर है (वह चर जिसे हम अनुमान लगाने की कोशिश कर रहे हैं)]
x is the independent variable (the variable we are using to make predictions)
[x स्वतंत्र चर है (वह चर जिसका उपयोग हम अनुमान बनाने के लिए कर रहे हैं)]
a is the intercept of the regression line (the value of y when = 0)
[a प्रतिगमन रेखा का अवरोध है (जब x=0 होता है तब y का मान)]
b is the slope of the regression line (the change in y for a one-unit change in x)
[b प्रतिगमन रेखा का ढलान है (जब x में एक इकाई का परिवर्तन होता है तो y में परिवर्तन)]
Finding the Regression Coefficients (प्रतिगमन गुणांक प्राप्त करना):- The slope b and intercept a of the regression line can be found using the following formulas:
(प्रतिगमन रेखा का ढलान b और अवरोध a निम्नलिखित सूत्रों का उपयोग करके पाया जा सकता है:)
Interpretation (व्याख्या):-
Slope (ढाल) (b):- Indicates the direction and steepness of the relationship between the variables. A positive slope indicates that as x increases, y also increases. A negative slope indicates that as x increases, y decreases.
(चरों के बीच संबंध की दिशा और ढलान को दर्शाता है। एक सकारात्मक ढलान दर्शाता है कि जैसे-जैसे x बढ़ता है, वैसे-वैसे y भी बढ़ता है। एक नकारात्मक ढलान दर्शाता है कि जैसे-जैसे x बढ़ता है, वैसे-वैसे y घटता है।)
Intercept (अवरोध) (a):- Indicates the expected value of y when x is 0.
(जब x 0 होता है तो y का अपेक्षित मान दर्शाता है।)
Multiple Linear Regression (बहु रैखिक प्रतिगमन):- When there are more than one independent variable, the model is called multiple linear regression. The equation is extended to:
(जब एक से अधिक स्वतंत्र चर होते हैं, तो मॉडल को बहु रैखिक प्रतिगमन कहा जाता है। समीकरण को इस प्रकार विस्तारित किया जाता है:)
y = a + b1 x1​ + b2 x2 + ⋯ + bk xk
Where (जहां):
x1, x2,…, xk are the independent variables.
(x1, x2,…, xk स्वतंत्र चर हैं।)
b1, b2,…, bk are their respective coefficients.
(b1, b2,…, bk उनके संबंधित गुणांक हैं।)
Note (नोट):- Multiple linear regression uses similar methods to simple linear regression to estimate the coefficients b1, b2, … ,bk and the intercept a.
(बहु रैखिक प्रतिगमन समान विधियों का उपयोग करके साधारण रैखिक प्रतिगमन की तरह b1, b2, … ,bk और अवरोध a का अनुमान लगाता है।)
Assumptions of Linear Regression (रैखिक प्रतिगमन की धारणाएं):-
i. Linearity (रैखिकता):- The relationship between the independent and dependent variables should be linear.
(स्वतंत्र और आश्रित चरों के बीच संबंध रैखिक होना चाहिए।)
ii. Independence (स्वतंत्रता):- Observations should be independent of each other.
(अवलोकन एक-दूसरे से स्वतंत्र होना चाहिए।)
iii. Homoscedasticity (समरूपता):- The residuals (the differences between observed and predicted values) should have constant variance.
[अवशेष (प्रेक्षित और पूर्वानुमानित मानों के बीच का अंतर) का स्थिर विचलन होना चाहिए।]
iv. Normality (सामान्यता):- The residuals should be normally distributed.
(अवशेष सामान्य रूप से वितरित होने चाहिए।)
Application (अनुप्रयोग):- Linear regression is widely used in predictive modeling, finance, biology, social sciences, and many other fields where the relationship between variables needs to be understood or predictions need to be made based on the relationship between variables.
(रैखिक प्रतिगमन भविष्यवाणी मॉडलिंग, वित्त, जीवविज्ञान, सामाजिक विज्ञान, और कई अन्य क्षेत्रों में व्यापक रूप से उपयोग किया जाता है, जहां चरों के बीच संबंध को समझने या चरों के बीच संबंध के आधार पर भविष्यवाणियां करने की आवश्यकता होती है।)