ضریب همبستگی چیست؟

تفاوت همبستگی اسپیرمن و پیرسون
شاید برای شما نیز این سوال ایجاد شده باشد که ضریب همبستگی پیرسون یا ضریب همبستگی اسپیرمن چه تفاوتی دارد؟ یا این که هر یک از این ضرایب در کجا کاربرد دارند و چه چیزی را محاسبه می کنند. در ادامه این مقاله ابتدا هر یک از این ضرایب را تعریف می کنیم، در رابطه کاربردهای هر یک به شما توضیح می دهیم و در نهایت تفاوت آن ها را نیز مطرح می کنیم.
بدون شک برای درک تفاوت میان دو مفهوم ابتدا باید تعریف هر یک از آن ها را بلد باشید تا بتوانید شباهت ها و تفاوت های میان آن را نیز درک کنید. در ادامه تعاریف هر یک از ضریب همبستگی پیرسون و ضریب همبستگی اسپیرمن را ارائه می دهیم.
ضریب همبستگی پیرسون
ضریب همبستگی پیرسون یا ضریب همبستگی گشتاوری یا ضریب مرتبه صفر توسط آماردانی به نام کارل پیرسون معرفی شد. هر زمانی که شما بخواهید میزان، نوع و جهت رابطه میان دو متغیر تحت بررسی را تعیین کنید از روش ضریب همبستگی پیرسون استفاده می کنید. فرمول محاسبه مقدار ضریب همبستگی پیرسون به صورت زیر است:
ضریب همبستگی اسپیرمن
ضریب همبستگی رتبه ای اسپیرمن توسط آماردان و روانشنان انگلیسی به نام چارلز اسپیرمن معرفی شده است. این ضریب برای تعیین میزان و نوع ارتباط میان دو متغیر ترتیبی به کار برده می شود. ضریب همبستگی اسپیرمن یک ضریب ناپارامتری است و به جای این که از خود مقادیر استفاده کنیم، از رتبه مربوط به هر یک از مقادیر استفاده می کنیم. فرمول محاسبه این ضریب به صورت زیر می باشد:
تفاوت ضریب ضریب همبستگی چیست؟ همبستگی اسپیرمن و پیرسون
تفاوت های میان این دو روش همبستگی به شرح زیر می باشند:
1- پیرسون پارامتری بوده و برای محاسبه همبستگی میان دو متغیر فاصله ای یا نسبی کاربرد دارد اما اسپیرمن ناپارامتری است و رابطه میان دو متغیر ترتیبی را می سنجد.
2- اسپیرمن برای بررسی روابط غیرخطی به کار برده می شود اما پیرسون رابطه های خطی را آشکار می سازد.
3- عملکرد ضریب همبستگی پیرسون بالاتر از ضریب همبستگی اسپیرمن است.
4- برای محاسبه اسپیرمن پیش فرض های کمتری نیاز داریم در نتیجه محاسبه آن ساده تر است.
منظور از پارامتری و ناپارامتری بودن چیست؟
فرض نرمالیتی (Normality Test) به شما می گوید که یک مجموعه داده از توزیع نرمال پیروی می کنند یا خیر. حال به بیان ساده، اگر یک مجموعه داده از توزیع نرمال پیروی کند، آن را پارامتری نامیده و برای محاسبه رابطه بین چنین متغیرهایی از روش های پارامتری استفاده می کنند. حال اگر این فرضیه رد شود، برای انجام اعمال آماری روی متغیر مورد نظر باید از روش های ناپارامتری استفاده کنیم.
با توجه به توضیحی که در مورد داده های پارامتری و ناپارامتری مطرح شد، برای بررسی رابطه میان دو مجموعه داده ناپارامتری از روش اسپیرمن و برای بررسی دو مجموعه داده پارامتری از پیرسون استفاده می کنیم. حال اگر یکی از متغیرها پارامتری و دیگری ناپارامتری باشد، برای بررسی میزان و نوع رابطه بین آن ها باید از روش رگرسیون استفاده کنیم.
ضریب همبستگی چیست؟
بارها توسط افراد مختلف در حوزههای شغلی گوناگون یا در رسانهها به منظور تحلیل آماری و بیان نتایج تحقیقات، واژه ضریب همبستگی یا اصطلاح لاتین آن Correlation را شنیدهایم. یکی از مهم ترین کاربردهای این مفهوم در بازارهای مالی است، که در این مطلب به بررسی آن و مباحث پیرامونی در حوزه بازار بورس میپردازیم. ضریب همبستگی یک ابزار آماری برای تعیین نوع و درجه رابطه متغیرهای کمی با یکدیگر است. این مفهوم یکی از معیارهای تشخیص میزان همبستگی دو متغیر میباشد. در واقع این ضریب نوع رابطه یعنی مستقیم یا معکوس بودن و شدت رابطه یعنی بازه ۱+ تا ۱- را نشان میدهد. همچنین اگر میان دو متغیر مذکور رابطهای وجود نداشته باشد، مقدار ضریب همبستگی برابر صفر است.
اصول کاربردی ضریب همبستگی
- ضریب همبستگی مثبت یعنی افزایش یک متغیر با افزایش متغیر دیگر و همچنین کاهش یک متغیر با کاهش متغیر دیگر همراه است.
- ضریب همبستگی منفی یعنی افزایش یک متغیر با کاهش متغیر دیگر و ضریب همبستگی چیست؟ همچنین کاهش آن متغیر با افزایش متغیر دیگر همراه است.
- ضریب همبستگی صفر یعنی افزایش و کاهش دو متغیر مستقل از یکدیگر بوده و هیچ ارتباطی ندارند.
- هرچه مقدار ضریب همبستگی به ۱+ یا ۱- نزدیکتر باشد، همبستگی مثبت یا منفی متغیرها قویتر است.
ضریب همبستگی در بازار مالی
یکی از مفاهیم اساسی مورد استفاده معاملهگران حرفهای در انواع بازارهای مالی شامل سهام، کالا و ارز (فارکس) است؛ اما در این مطلب از ذکر مبانی آماری و جزئیات محاسباتی پرهیز نموده و تمرکز اصلی ما روی نحوه استفاده از این مفهوم در بازار سهام ایران میباشد. بررسیهای آماری ثابت کرده است، که نوسانات داراییها در بازارهای مالی نسبت به یکدیگر بدون ارتباط نیستند. حتی در مقیاس بزرگتر، بازارهای جهانی نیز به یکدیگر وابستگی داشته و کاملاً از یکدیگر تاثیر میپذیرند. مثلاً بارها مشاهده نمودهاید، که سقوط قیمت سهام در بازارهای مالی بزرگ جهان به صورت دومینو وار به سایر بازارهای سهام نیز سرایت کرده است. همسبتگی در میان داراییها بیدلیل نبوده و معمولاً به دلیل وجود وجوه اشتراک یا تضاد بنیادی میان این نمادها ایجاد میشود. در واقع یکی از مهمترین مزایای استفاده از مفهوم ضریب همبستگی حین سرمایهگذاری در بازارهای مالی، استفاده از فرصتهای بهینه و کاهش خطای تحلیل تا بیشترین حد ممکن است. از طرف دیگر برخی معاملهگران عمده نیز از این مفهوم به منظور اتخاذ موقعیتهای معاملاتی پوشش ریسک بهره میبرند.
ضریب همبستگی در بازار سهام ایران
اگر تجربه فعالیت در بازار بورس و اوراق بهادار تهران را داشته باشید، حتماً تاکنون وجود ضریب همبستگی مثبت نسبتاً بالا در کل بازار را متوجه شدهاید. به عبارت دیگر سهام موجود در بازار بورس و فرابورس ایران همبستگی مثبت بالایی نسبت به یکدیگر دارند. برای اثبات این موضوع هم میتوان، به نمودار سهام مختلف و شاخص کل در دورههای زمانی متفاوت مراجعه نمود. در واقع رفتار دمینووار بازارهای مالی در بورس تهران به طور کاملاً عینی و ملموس قابل مشاهده است. دلیل این رفتار بازار سهام نیز ناشی از شرایط بازار سرمایه ایران از لحاظ محدودیت تعداد شرکتهای پذیرفته شده، کم عمق بودن بازار، تحریمها و عدم اتصال به بازار جهانی یا رفتار هیجانی توده معاملهگران میباشد.
همبستگی با سهام لیدر یا شاخصساز
در بازار سهام ایران گروههای صنعتی مختلفی داریم. از طرف دیگر تعدادی سهام مربوط به غولهای صنعتی و اصطلاحاً شاخصساز وجود دارند، که از نظر اکثر فعالان بورس تعیینکننده روند بازار بوده و سهام متوسط یا کوچک در بسیاری از موارد تابع روند این نمادها هستند. با بررسی نمودارهای قیمتی بازار بورس موارد متعددی را مشاهده میکنیم، که با ایجاد نوسانات صعودی یا نزولی در سهام نمادهای لیدر بازار شرکتهای کوچکتر همگروه نیز به سرعت تغییر روند داده و با آنها همسو شدهاند. البته مواردی نیز وجود دارند، که به دلیل وقوع اتفاقات خاص درون شرکت یا مؤلفههای بنیادی روند برخی تکسهمها نسبت به سهم لیدر یا کل بازار متفاوت بوده است.
همبستگی با سهامداران عمده (شرکت های مادر)
از دیگر همبستگیهای مهم بازار سهام ایران میتوان، به ترکیب سهامداران شرکتها اشاره نمود. به طور مثال یک شرکت بورسی نظیر هلدینگهای سرمایهگذاری (سایر شرکتها در راستای تملک یا جایگزین نمودن سهام ارزشمند بورسی) اقدام به خرید سهام سایر شرکتهای بورسی از صنایع مختلف نموده و پرتفوی سهام تشکیل داده است. این شرکتها به عنوان سهامدار در ترکیب سهامداران حضور دارند. در چنین شرایطی اگر در وضعیت بنیادی یا قیمتی سهام خریداری شده تحول مثبتی رخ دهد، طبعاً در ارزش ذاتی نماد شرکت سهامدار عمده نیز تعدیل مثبت ایجاد خواهد شده و یا در صورتی که درصد سهامداری بسیار بالا باشد، نوسانات قیمتی نمادها مشابه بوده و تفاوتی ندارند.
همبستگی بر اساس ترکیب پرتفوی
هبستگی سهام بورسی گاهاً بر اساس وضعیت سبد سرمایهگذاری ضریب همبستگی چیست؟ آنها ایجاد میشود. اگر گزارشات و صورتهای مالی برخی شرکتها را بررسی کنید، شباهت زیادی در پرتفوی آنها قابل مشاهده است. حال اگر به نمودار قیمت این نمادها نیز مراجعه کنیم، شباهت معناداری در جزئیات نوسانات قیمتی آنها وجود دارد. به طور کلی با استفاده از ضریب همبستگی میتوانید، فرصتهای سرمایهگذاری مناسبی را شکار کنید. مثلاً اگر سایر شروط تحلیل تکنیکال و بنیادی مورد نظر شما برقرار باشند، خرید سهام یک شرکت سرمایهگذاری دارای پرتفوی بورسی مثبت (نمادهای موجود در پرتفوی شرایط بنیادی و قیمتی مثبتی دارند) در قیمتهای منفی ارزنده است.
تشکیل پرتفوی با توجه به ضریب همبستگی
موارد مذکور شامل بخشی از روابط و همبستگیهایی است، که در بازار سهام مشاهده شده و حین سرمایهگذاری باید حتماً به این موارد توجه داشت. در واقع برای معاملهگری موفق صرفاً نیاز به درک مفاهیم تحلیلی متعدد و پیچیده نداشته و بعضاً با توجه به چنین نکات سادهای میتوان، از ورود به موقعیتهای معاملاتی اشتباه با ریسک بالا جلوگیری نمود. به طور مثال اگر چند سهم با همبستگی مثبت بالا خریداری کرده و یکی از سهام اصلی دچار روند نزولی شود، احتمالاً روند قیمتی بقیه سهام موجود در پرتفوی نیز معکوس شده و یک ضرر سنگین چند برابری را متحمل میشوید!
حال در مورد ضریب همبستگی به دو مثال از بازار سهام تهران توجه کنید.
۱- در تاریخ نگارش مطلب (۲۷/۰۶/۱۳۹۹) و بر اساس اطلاعات سایت TSETMC، شرکت سرمایهگذاری خوارزمی مالک ۱/۱ درصد معادل ۱۱۲ میلیون سهم از گروه خودروسازی بهمن است. همانطور که اشاره نمودیم، در صورت وقوع اتفاقات بنیادی مثبت در نماد خبهمن در میزان سودسازی نماد وخارزم نیز متناسب با میزان تملک سهام خبهمن تعدیل مثبت ایجاد میشود. همچنین اگر در پرتفوی بورسی خود نماد وخارزم دارید، دیگر خرید نماد خبهمن چندان منطقی نیست؛ زیرا به صورت غیرمستقیم و از طریق سرمایهگذاری خوارزمی این نماد (خبهمن) را خریداری نمودهاید! در واقع اگر اصرار به خرید یک نماد خودرویی دارید، حتیالامکان باید نماد خودرویی دیگری را خریداری کنید، تا قاعده متنوع سازی رعایت شده و از تحمل ریسک چند برابر پرهیز نمایید.
۲- در مثال بعدی به بررسی دو نماد خساپا و وساپا میپردازیم. در ابتدا به ترکیب سهامداران خودروسازی سایپا توجه کنید.
ترکیب سهامداران شرکت سرمایهگذاری سایپا نیز جالب است!
در نهایت با توجه به ترکیب سهامداران فوق، قطعاً مشاهده این نمودار قیمتی دور از انتظار نیست.
اگر نمودار این دو سهم را در بلندمدت مورد بررسی قرار دهیم، در بسیاری از مواقع حتی در کوچکترین نوسانات بازار نیز مسیر یکسانی داشتهاند. بنابر تفاسیر فوق خرید و سهامداری همزمان این دو شرکت با توجه به همبستگی تقریباً کامل آنها، از دیدگاه متنوع سازی و مدیریت ریسک اصلاً منطقی نیست.
کلام پایانی
همواره در بخشهای پایانی مقالات و حین معرفی تکنیکهای مختلف معاملهگری به این موضوع تأکید نمودهایم، که هیچ کدام از این ابزار عملکرد قطعی و صد درصدی نداشته و همواره باید با صرف زمان، کسب تجربه و بر اساس تعدادی از روشهای تحلیل و معاملهگری، استراتژی یا فلسفه معاملاتی خود را به مرور زمان بسازید. مفهوم ضریب همبستگی در بازار سهام نیز از این قاعده مستثنی نبوده و اگر بیشتر در این زمینه جستجو کنید، مطمئناً به میزان تسلط بالاتری رسیده و شاید همبستگیهای بیشتری را نیز بیابید.
انواع ضرایب همبستگی
استنباط آماری که در واقع یک نوع نتیجه گیری کلی از جزء به کل است، در معرض آزمایش و خطاست. یک جنبه از استنباط آماری محاسبه برآوردهایی (Estimates ) از پارمترهای جامعه مانند میانگین جامعه از طریق آماره های نمونه ها مانند میانگین نمونه است.
فرضیه (hypothesis) :
فرضیه آماری نقطه آغاز آزمون فرض است. فرضیه آماری یک بیان مقداری در باره پارامترهای جامعه است و اصولا بدون داشتن فرضیه آماری امکان انجام یک آزمون دشوار است.فرضیه آماری به دو دسته فرض صفر (H0) و فرض خلاف (H1) بیان میشود . اغلب فرضیه بیانگر این مطلب است که یک ارتباط علیتی بین دو متغیر وجود دارد به شکلی که میزان یکی (متغیر مستقل یاIndependent ) تا حدودی تعیین کننده دیگری متغیر وابسته یا (Dependent) است.
انواع داده :
1) داده های کمی (فاصله ای) Interval اعدادی هستند که بیانگر کمیت به صورت واحدهای عددی و بر اساس یک مقیاس مستقل است .قد و وزن مثالهای بارز دادههای کمی هستند.
2) دادههای رتبه ای Ordinal مشتمل بر رتبه ها، تعلق داشتن به گروههای رتبه بندی شده یا اطلاعات ترتیبی است. به عنوان مثال اگر دو داور به یک مجموعه 10 تایی از نقاشی رتبه یک (برای بهترین) تا رتبه 10 (برای بدترین) بدهند. مجموعه داده ها ضریب همبستگی چیست؟ مشتمل بر 10 جفت رتبه خواهد بود. که هر جفت برای یک نقاشی است.
3) دادههای اسمی (nomial ) که مربوط به متغیر یا خواص کیفی مانند جنس یا گروه خونی است و بیانگر عضویت در یک گروه خاص می باشد.
محاسبه ضرایب همبستگی تا حدود زیادی متاثر از مقیاس اندازه گیری متغیر ها است، بعنوان مثال برای متغیرهای اسمی جهت رابطه اصلا معنی ندارد، بین جنس و معدل تنها میتوان گفت که شدت وابستگی چه مقدار است اما افزایش یا کاهش جنس معنی ندارد.
با توجه به نوع متغیر ها ضریب همبستگی میتواند یکی از حالتهای زیر را داشته باشد.
1- دو متغیر اسمی
2- دو متغیر رتبهای
3- دو متغیر فاصلهای- نسبی
4- متغیر اسمی و متغیر رتبه ای
5- متغیر اسمی و متغیر فاصلهای - نسبی
6- متغیر رتبهای و متغیر فاصلهای – نسبی
برای هر کدام از حالتهای بالا ضرایب همبستگی متفاوتی وجود دارند و محاسبه آنها در نرم افزار های spss ، lisrel و R امکان پذیراست.
از آنجا که انتخاب ضریب همبستگی مناسب برای بررسی روابط بین متغیرها تحت تاثیر مقیاس اندازه گیری متغیرهای مورد بررسی است لذا تناسب بین سطوح اندازه گیری و ضریب همبستگی سازگار از این جدول برای تصمیم گیری مناسب است
آزمون های آماری
سطح سنجش متغیرها
خی دو – فی – وی کرامر – لاندا
خی دو – فی – وی کرامر – لاندا
تحلیل واریانس یکطرفه – تی تست
فاصله ای یا نسبی
خی دو – فی – وی کرامر – لاندا
ضریب همبستگی رتبه ای اسپیرمن
خی دو – فی – وی کرامر – لاندا
ضریب همبستگی پیرسون r
ضریب همبستگی رتبه ای اسپیرمن
هرگاه رابطه بین دو متغیر را بررسی کردیم و بین آن دو رابطه معنی دار وجود داشت می توانیم ضریب همبستگی و میزان شدت همبستگی را نیز محاسبه کنیم .
ضرایب همبستگی در واقع وابستگی دو متغیر را مشخص می کنند:
اگر ضریب همبستگی بین 25/0 تا 35/0 ضریب بسیار پایین است – تنها 4% تغییرات مشترک میان دو متغیر را نشان می دهد
اگر ضریب همبستگی بین 35/0 تا 65/0 ضریب متوسط است – حدود 25% تغییرات مشترک میان دو متغیر را نشان ضریب همبستگی چیست؟ می دهد
اگر ضریب همبستگی بین 65/0 تا 85/0 ضریب بالایی است –تا 72% تغییرات مشترک میان دو متغیر را نشان می دهد
در اصل برای بررسی میزان هماهنگی میان دو متغیر به دنبال شاخصهایی می گردیم که در اصل دو ویژگی زیر را داشته باشند:
1- به واحد دو جامعه وابسته نباشد
به طور مثال در تحولات اقصادی به دنبال رابطه میان تقاضای نفت خام در برابر تقاضای طلا می باشیم. یا در مطالعه تحولات اجتماعی به دنبال رابطه درآمد سرپرست خانواده و میزان تحصیل فرزندان می باشیم و مثالهایی از این دست.
مجموعه اطلاعات (داده های) موجود در انجام یک آزمون همبستگی که شامل اندازه های بدست آمده از دو متغیر X و Y می باشند را می توان به صورت یک نمونه تصادفی دو متغیره (Xn ,Yn), . (X1 ,Y1) بیان کرد
مطالعه رابطه بین متغیرها بوسیله ((تحلیل همبستگی)) ( Analysis Corroletion ) انجام می شود. که بیانگر وجود یک رابطه خطی بین دو متغیر می باشد.
فرمول ضریب همبستگی به صورت زیر می باشد
با توجه به مقدار r در حاتهای مختلف تفسیرهای گوناگونی از رابطه X و Y خواهیم داشت.
حالتهای مختلف برای r
1- r =1 در این حالت همبستگی کامل و مستقیم گوییم. با افزایش مقدار x مقدار y به طور قطعی
زیاد می شود.
2- r = -1 در این حالت همبستگی را کامل و معکوس گوییم. با افزایش مقدار x مقدار y کاهش می یابد.
انواع ضرایب همبستگی:
ضریب همبستگی چوپروف T :ضریب هبستگی چوپروف به منظور تعیین شدت وابستگی بین متغیرهای مورد مطالعه به کار گرفته می شود و مقدار آن همواره بین صفر ویک در نوسان می باشد زمانی از آن استفاده کرده که هر دو متغیر اسمی و یا یکی اسمی و دیگری ترتیبی باشد. اما نباید تعداد سطر و ستون با هم برابر باشند.یعنی در جدول توافقی 2در2 نمی توان از آن استفاده کرد. در چنین مواردی باید از ضریب فی استفاده کرد.
ضریب همبستگی فی: به منظور بررسی شدت همبستگی بین دو متغیر اسمی که جدول توافقی 2 در 2 می باشد مورد استفاده قرار می گیرد.خی دو سطح معنی دار بودن همبستگی بین دو متغیر را تعیین میکند اما ضریب فی شدت همبستگی آنها را نشان می دهد. مقدار آن همواره بین صفر و یک در نوسان است.
ضریب همبستگی پیرسون r : این ضریب میزان همبستگی بین دو متغیر فاصله ای یا نسبی را محاسبه کرده مقدار آن بین 1+ و 1- می باشد اگر مقدار بدست آمده مثبت باشد به معنی این است که تغییرات دو متغیر به طور هم جهت اتفاق می افتد یعنی با افزایش در هر متغیر، متغیر دیگر نیز افزایش می یابد و برعکس اگر مقدار r منفی شد یعنی اینکه دو متغیر در جهت عکس هم عمل می کنند یعنی با افزایش مقدار یک متغیر مقادیر متغیر دیگر کاهش می یابد و برعکس.اگر مقدار بدست آمده صفر شد نشان میدهد که هیچ رابطه ای بین دو متغیر وجود ندارد و اگر 1+ شد همبستگی مثبت کامل و اگر 1- شد همبستگی کامل و منفی است.
ضریب کرامر: این ضریب برای تغیین میزان شدت همبستگی بین دو متغیر اسمی مورد استفاده قرارمی گیرد و آن را با (V 2 ) نشان می دهند و مقدار آن نیز همواره بین صفر ویک در نوسان است.هم جدول توافقی بیشتر از 2 در 2 وهم برای مستطیلی بکار می رود .
ضریب همبستگی رتبه ای اسپیرمن : آن را با علامتP نشان می دهند و همواره بین 1+ و 1- می باشد از لحاظ سطح سنجش ترتیبی است.در صورتی که داده های ما به صورت فاصله ای و نسبی باشند می توانیم آنها را به رتبه تبدیل کنیم.مهم نیست کدام متغیر وابسته و کدام متغیر مستقل است.
نکته مهم : اگر ضریب همبستگی صفر باشد نشاندهنده عدم وجود همبستگی است
ضریب همبستگی همواره بین 1+ و 1- در نوسان است
اگر ضریب همبستگی کمتر از صفر باشد همبستگی ناقص و منفی است یعنی با افزایش یک متغیر دیگری کاهش می یابد
اگر ضریب همبستگی بزرگتر از صفر باشد ناقص و مثبت است یعنی با افزایش یک متغیر، دیگری نیز افزایش می یابد
اگر صفر باشد نشاندهنده عدم وجود همبستگی است
کاربرد آزمون های پارامتری و ناپارامتری در علوم رفتاری
مقایسه داده ها در دو یا بیش از دو گروه وابسته و مستقل
تعداد گروههای تحت مطالعه
متغیر مورد مطالعه
گروههای تحت مطالعه
نوع آزمون مورد انتخاب
1
دو گروه
کمی
مستقل
t مستقل
2
دو گروه
رتبه ای
مستقل
من ویتنی
3
دو گروه
اسمی
مستقل
خی دو
4
دو گروه
کمی
وابسته
t وابسته
5
دو گروه
رتبه ای
وابسته
ویلکاکسون – آزمون نشانه
ارتباط و ضریب همبستگی Correlation در گراف پد
به دست آوردن اندازه ارتباط و همبستگی بین Variableها از موضوعات مهم در تحلیلهای آماری به حساب میآید. با استفاده از ضریب همبستگی که عددی بین 1- تا 1+ قرار دارد، میتوان به اندازه اثرگذاری بین کمیتها پرداخت.
در نرمافزار گراف پد مثالی با نام Correlation در دسته تحلیلهای XY و در بخش Correlation & regression linear and nonlinear صفحه ورودی نرمافزار گراف پد قرار دارد. فایل مثال را میتوانید از اینجا دانلود کنید.
وقتی مثال را Create میکنیم با دادههای زیر روبهرو میشویم. نحوه نوشتن دادهها در تحلیلهای XY همانگونه که از نام این تحلیلها برمیآید به صورت یک یا چند ستون تحت نام X و Y که قرار است ارتباط بین آنها را به دست آوریم، بیان میشود.
در این مثال همانگونه که مشاهده میکنید، دادهها در 153 سطر و چهار ستون آمدهاند. هر سطر بیانگر یک روز میباشد. ستون X نشاندهندهی سطح اوزون Ozone level و ستونهای Y به صورت تابش خورشیدی solar radiation، باد wind و دما temperature آمدهاند.
هدف ما در این مثال به دست آوردن اندازه ارتباط و اثرگذاری سه شرایط آب و هوایی (تابش، باد و دما) بر روی سطح اوزون است.
به این منظور و جهت مشاهده نتایج به دست آمده در همان شیت دادهها، بر روی دکمه Analyze کلیک میکنیم. در پنجره Analyze data باز شده، تحلیل Correlation را انتخاب میکنیم.
پنجره تنظیمات با نام Parameters: Correlation برای ما به صورت زیر باز میشود.
- Compute correlations between which paires of columns
در این بخش با سه گزینه روبهرو هستیم. Compute r for every pair of Y data sets Correlation matrix برای ما ماتریس همبستگی بین Y ها را به دست میدهد. یعنی ضریب همبستگی بین هر Y با Y دیگر به دست میآید. با انتخاب این گزینه X در ماتریس همبستگی قرار ندارد و ارتباط بین هر Y با X به دست نمیآید.
گزینه Compute r for X vs.every Y data set ضریب همبستگی بین X با هر کدام از Yها را به دست میآورد.
گزینه Compute r between two selected data sets این امکان را در اختیار ما قرار میدهد تا تنها همبستگی بین یک ستون دلخواه با ستون دلخواه دیگری به دست بیاید.
- Assume data are sampled from Gaussian distribution
نرمافزار گراف پد در اینجا سوال مهمی از ما میپرسد. آیا توزیع دادهها نرمال (گوسین) هستند یا خیر؟ پاسخ مثبت یا منفی به این سوال، نوع ضریب همبستگی ما را متفاوت خواهد کرد. در واقع اگر توزیع دادههای مورد بررسی نرمال باشند از ضریب همبستگی پیرسن و اگر دادهها نرمال نباشند از ضریب همبستگی ناپارامتری اسپیرمن، استفاده خواهیم کرد.
انتخاب یک دامنهای بودن و یا Two-tailed بودن آزمون همبستگی در این بخش انجام میشود. توضیح اینکه آزمون همبستگی یک دامنه، بزرگتر از صفر بودن ضریب همبستگی (همبستگی مثبت) و یا کوچکتر از صفر بودن ضریب همبستگی (همبستگی منفی) را بررسی میکند. در حالی که آزمون همبستگی Two دامنه، هم بزرگتر از صفر بودن ضریب همبستگی (همبستگی مثبت) و هم کوچکتر از صفر بودن ضریب همبستگی (همبستگی منفی) را بررسی میکند.
همچنین در همین بخش و از کادر Confidence interval میتوان ضریب اطمینان فاصله اطمینان، برای ضریب همبستگی به دست آمده را تعیین کرد.
تعداد رقمهای اعشار مقدار احتمال P value به دست آمده، در این بخش تعیین میشود. همچنین میتوان درباره نحوه نمایش P value تصمیمگیری کرد.
چنانچه در بخش Compute correlations between which paires of columns گزینه Compute r for every pair of Y data sets Correlation matrix را انتخاب کرده باشیم، با انتخاب این گزینه میتوان Heatmap یا همان نمودار حرارتی ماتریس همبستگی را مشاهده کرد.
بنابراین در ابتدا باید مشخص کنیم که توزیع دادههای ما در این مثال، نرمال است یا خیر. نحوه بررسی نرمال بودن دادهها را مینوانید از این لینک مشاهده کنید. در این مثال، بار دیگر نحوه آزمون نرمالیتی را تکرار نمیکنیم. تنها نتایج نرمافزار را آوردهایم. در خروجی زیر از نرمافزار گراف پد میتوانید، نتیجه آزمون نرمالیتی بر دادههای مثال Correlation را مشاهده کنید.
آنچه از جدول بالا به دست میآید، بیانگر عدم نرمال بودن دادههای تابش، باد و دما میباشد. بنابراین در این مثال میبایست از ضریب همبستگی ناپارامتری اسپیرمن استفاده کنیم.
بنابراین پنجره تنظیمات Parameters: Correlation را به صورت زیر قرار میدهیم.
با OK کردن، شیت نتایج با نام Correlation of Ozone correlations در فولدر Results پنجره راهبری سمت چپ نرمافزار، ساخته میشود.
در این شیت میتوانید اندازه ضریب همبستگی اسپیرمن بین Ozone با هر کدام از Yها را در سطر با نام r مشاهده کنید. فاصله اطمینان 95 درصد برای ضریب همبستگی اسپیرمن نیز آمده است.
در بخش P value سطح معناداری و مقدار احتمال به دست آمده در هر آزمون همبستگی (بین X و هر Y) آمده است. نتیجه به دست آمده نشان میدهد، ارتباط معنادار بین سطح اوزون با هر کدام از شرایط تابش، باد و دما تایید میشود.
در سطر Number of XY Paires تعداد روزهای مورد بررسی آمده است. تفاوت در تعداد روزها به دلیل آن بوده است که ما در برخی از روزها فاقد اطلاعات بودهایم و به عبارتی عددی برای ان روز ثبت نشده است.
آنچه در پایان از این شیت به دست میآید این است که ارتباط بین اوزون با دما و در مرتبه بعدی با تابش معنادار و مثبت است، به همین ترتیب ارتباط بین اوزون با باد معنادار اما منفی و وارون است.
خوب است به فولدر Graphs نیز برویم و نمودار پراکنش بین Variableها را مشاهده کنیم. در فولدر Graphs شیت با نام Ozone correlation دیده میشود. هنگامی که بر روی این شیت کلیک میکنیم، پنجره Change Graph Type برای ما باز میشود.
از آنجا که مثال Correlation در دسته تحلیلهای XY نرمافزار گراف پد قرار دارد، بنابراین به صورت پیشفرض Graph family بر روی XY باز میشود. انواع نمودارهای متناظر با XY را میتوانیم در این پنجره مشاهده کنیم. با OK کردن گراف پراکنش زیر برای ما ساخته میشود.
این گراف به صورت توام، برهمکنش بین اوزون با Solar R، Wind و Temp را شامل میشود. با توجه به مقیاسها و اعداد متفاوت اندازهگیری Yها، نمودار فوق نیاز به اصلاح و ویرایش دارد. در واقع به منظور مشاهده دقیق نحوه اثرگذاری اوزون بر هر Y، باید نمودار جداگانه پراکنش، رسم شود. برای انجام این کار ابتدا بیایید از همین نمودار موجود، چند کپی دیگر بسازیم. برای این کار روی شیت گراف رفته و راست کلیک کنید.
در آنجا گزینه Duplicate Current Sheet را انتخاب کنید. این کار را یکبار دیگر نیز تکرار کنید. یعنی در نهایت به تعداد ستونهای Y که سه تا است، سه شیت گراف شبیه به هم (البته فعلاً تا اینجا) داشته باشید.
هدف ما این است که سه شیت گراف داشته باشیم تا هر کدام از آنها را برای ساختن نمودار پراکنش بین اوزون با هر کدام از Yها (تابش، دما، باد) استفاده کنیم.
در مرحله بعد بر روی نمودار دبل کلیک کنید تا پنجره تنظیمات Format Graph زیر باز شود.
از آنجا بر روی تب Data Sets on Graph بزنید. محیط زیر را مشاهده خواهید کرد.
در کادر Data sets plotted front to back میتوانید اسامی ستونهای Y یعنی Wind، Solar R و Temp را مشاهده کنید. از آنجا که میخواهیم در این مرحله، نمودار پراکنش ما تنها شامل Ozone و مثلاً Solar R باشد، بنابراین بر روی دو سطر Ozone correlation:B:Wind و Ozone correlation:B:temp رفته و دکمه Remove سمت راست را میزنیم.
در پایان تب Data Sets on Graph از پنجره Format Graph به شکل زیر خواهد بود.
بنابراین از نرمافزار، در این مرحله میخواهیم فقط نمودار پراکنش بین اوزون و تابش را رسم کند. با OK کردن، گراف زیر را خواهیم داشت.
برای عنوان محور Y، عبارت Solar R را نوشتهایم. همانگونه که در خروجی نتایج و ضریب همبستگی اسپیرمن نیز نشان دادیم، ارتباط بین اوزون و تابش مستقیم و معنادار به دست آمده بود. گراف پراکنش بالا نیز ارتباط مثبت را بیان میکند. خوب است نام این گراف را به صورت Ozone & Solar R correlations قرار دهیم. برای این کار بر روی شیت Ozone correlations راست کلیک کرده و گزینه Rename Sheet را انتخاب کنید. با اینکار هر نام دلخواهی که دوست دارید، میتوانید قرار دهید.
همین فرایند بالا را اینبار بر روی شیت کپی شده با نام Copy of Ozone correlations انجام داده و اینبار Yهای Solar R و Temp را حذف کنید تا بتوانید نمودار پراکنش جداگانه بین اوزون و Wind را به دست بیاورید.
اینبار با OK کردن نمودار پراکنش زیر را خواهیم داشت.
عنوان نمودار و محور Y را خودمان نوشتهایم. نام شیت را هم با همان فرایند Rename کردن شیت میتوانید به صورت Ozone & Wind correlations قرار دهید. گراف بالا بیانگر وجود ارتباط منفی و وارون بین اوزون و Wind است. قبلاً در Results نیز با استفاده از ضریب همبستگی اسپیرمن، معنادار بودن این ارتباط را مشاهده کردهایم.
در پایان تنها رسم نمودار پراکنش بین Ozone و Temp باقی میماند. این کار را نیز با دبل کلیک کردن بر شیت باقیمانده Copy of Ozone correlations انجام میدهیم. ویرایش نمودار طبق توضیحات بالا و حذف Yهای Solar R و Wind، گراف زیر را برای ما خواهد ساخت.
در گراف پراکنش بالا، ارتباط مستقیم و مثبت بین اوزون و دما، تایید میشود.
اجازه دهید در پایان به یک نکته دیگر نیز اشاره کنیم. در پنجره Parameters: Correlation و گزینه Compute r for every pair of Y data sets Correlation matrix به این موضوع اشاره کردیم که میتوان صرفنظر از X ارتباط درونی بین Y ها را به صورت یک ماتریس همبستگی و همچنین پلات حرارتی Heatmap، به دست آورد.
بنابراین خوب است یکبار دیگر به شیت دادهها رفته و از آنجا با استفاده از دکمه Analyze به پنجره Parameters: Correlation برویم. تنظیمات را مانند شکل زیر قرار میدهیم.
به این ترتیب در فولدر Results شیت جدید دیگری با نام Correlation of Ozone correlations ساخته میشود. جالب است این شیت دارای چهار زبانه است.
ماتریس ضریب همبستگی اسپیرمن بین Solar R، Wind و Temp با یکدیگر، مشاهده میشود. به عنوان مثال عدد 0.447- نشان میدهد، ارتباط بین Wind و Temp وارون و به اندازه 0.447 منفی است.
مقدار احتمال ضریب همبستگیها در این تب بیان شده است. به عنوان مثال همان ارتباط بین Wind و Temp به دلیل کوچک بودن مقدار احتمال آن، معنادار گزارش میشود.
در این تب میتوان به دست آورد که در هر همبستگی، چه تعداد نمونه (هر نمونه بیانگر یک روز بود) وجود داشته است. مثلاً در بررسی ارتباط بین دما و باد، 153 روز مورد بررسی قرار گرفته است. کاهش در تعداد روزها و در همبستگیهای دیگر به دلیل این است که اطلاعات مربوط به آن روز برای دما یا باد در دسترس نبوده است.
- Confidence interval of rs
در این تب میتوانید فاصله اطمینان ضریب همبستگی، به ازای هر کدام از خانههای ماتریس همبستگی را مشاهده کنید. به عنوان مثال فاصله اطمینان 95 درصد ضریب همبستگی اسپیرمن برای ارتباط بین Wind و Temp به صورت (0.3055- , 0.5684-) به دست آمده است. منفی بودن هر دو کران بالا و پایین فاصله اطمینان، بیانگر ارتباط معنادار وارون بین دما و باد میباشد.
ما در پنجره Parameters: Correlation و بخش Graphing گزینه Create a heatmap of the correlation matrix را نیز انتخاب کرده بودیم. نتیجه این انتخاب را میتوانید در فولدر Graphs پنجره Navigator نرمافزار، مشاهده کنید.
یک شیت جدید با نام Spearman r: Correlation of Ozone correlations در فولدر Graphs ساخته شده است. گراف به دست آمده را میتوانید در شکل زیر ببینید.
به این نوع نمودارها که با استفاده از شدت رنگ، اندازهها و آمارههای مختلف را نشان میدهند، پلات حرارتی یا Heat Map گفته میشود. در Heat Mapها همواره خط کش مدرجبندی طیف رنگ، وجود ضریب همبستگی چیست؟ دارد. به عنوان مثال در پلات بالا، رنگ سفید، عدم ارتباط را نشان میدهد (بین Solar R و Wind). آبیها از کمرنگ تا پررنگ، بیانگر ارتباط قوی مثبت و قرمزها از کمرنگ به پررنگ نیز ارتباط قوی منفی را نشان میدهند.
چگونه به این مقاله رفرنس دهیم
GraphPad Statistics (2020). Correlation coefficient in GraphPad Prism Software. Statistical tutorials and software guides. Retrieved Month, Day, Year, from https://graphpad.ir/correlation-prism/.php
For example, if you viewed this guide on 12 th January 2022, you would use the following reference
GraphPad Statistics (2020). Correlation coefficient in GraphPad Prism Software. Statistical tutorials and software guides. Retrieved January, 12, 2022, from https://graphpad.ir/correlation-prism/.php
ارایه خدمات تحلیل و مشاوره آماری
گراف پد برای شما خدمات مشاوره و انجام انواع تحلیلهای آماری را ارایه میدهد. جهت دریافت نکات بیشتر ضریب همبستگی چیست؟ بهتر است با ما تماس بگیرید.
سید محمد طباطبایی بافقی
منبع اصلي: کتاب آموزش کاربردي SPSS
تحقيق همبستگي يکي از روشهاي تحقيق توصيفي (غيرآزمايشي) است که رابطه ميان متغيرها را براساس هدف تحقيق بررسي ميکند. ميتوان تحقيقات همبستگي را براساس هدف به سه دسته تقسيم کرد: همبستگي دو متغيري، تحليل رگرسيون و تحليل کوواريانس يا ماتريس همبستگي. در اين زمينه در بخش اول قسمت تقسيمبندي روشهاي تحقيق براساس هدف توضيح لازم ارائه گرديد. بنابراين همبستگي براي بررسي نوع و ميزان رابطه متغيرها استفاده ميشود. در حاليکه رگرسيون پيشبيني روند آينده يک متغير ملاک (وابسته) براساس يک مجموعه روابط بين متغير ملاک با يک چند متغير پيشبين (مستقل) است که در گذشته ثبت و ضبط شده است.
ضريب همبستگي شاخصي است رياضي که جهت و مقدار رابطه ي بين دو متغير را توصيف ميکند. ضريب همبستگي درمورد توزيع هاي دويا چند متغيره به کار مي رود. اگر مقادير دو متغير شبيه هم تغيير کند يعني با کم يا زياد شدن يکي ديگري هم کم يا زياد شود به گونهاي که بتوان رابطه آنها را به صورت يک معادله بيان کرد گوييم بين اين دو متغيرهمبستگي وجود دارد. ضريب همبستگي پيرسون، ضريب همبستگي اسپيرمن و ضريب همبستگي تاو کندال از مهمترين روشهاي محاسبه همبستگي ميان متغيرها هستند. بطور کلي:
1- اگر هر دو متغير با مقياس رتبهاي باشند از شاخص تاوکندال استفاده ميشود.
2- اگر هر دو متغير با مقياس نسبتي و پيوسته باشند از ضريب همبستگي پيرسون استفاده ميشود.
3- اگر هر دو متغير با مقياس نسبتي و گسسته باشند از ضريب همبستگي اسپيرمن استفاده ميشود.
- تفسير نتايج ضريب همبستگي برونداد SPSS
براساس يک قاعده کلي براساس مقادير زير ميتوان درباره ميزان همبستگي متغيرها قضاوت کرد. بخاطر داشته باشيد همين تفسير براي مقادير منفي نيز قابل استفاده است:
ضريب همبستگي | تفسير |
0.00 - 0.19 | خيلي اندک و قابل چشم پوشي |
0.20 - 0.39 | خيلي اندک تا اندک |
0.40 - 0.69 | متوسط |
0.70 - 0.89 | زياد |
0.90 - 1.00 | خيلي زياد |
اين مقادير يک قانون ثابت نيستند و به صورت تجربي بدست آمده است. در برخي متون مانند زير نيز ارائه شده است:
ضريب همبستگي | تفسير |
0.0 - 0.1 | خيلي اندک و قابل چشم پوشي |
0.1 - 0.3 | اندک |
0.3 - 0.5 | متوسط |
0.5 - 1.0 | زياد |
همچنين آماره .sig يا همان P-Value مربوط به همبستگي مشاهده شده بايد کوچکتر از سطح خطا باشد. يک قانون کلي وجود دارد و آن اينکه اگر همبستگي بزرگتر از 0.3 باشد مقدار معناداري کوچکتر از سطح خطاي 0.05 خواهد بود. تجربه آماري من نيز هميشه مطابق اين قانون بوده است.
ضريب همبستگي پيرسون
در بررسي همبستگي دو متغير اگر هردو متغير مورد مطالعه در مقياس نسبي و فاصلهاي باشند از ضريب همبستگي گشتاوري پيرسون استفاده ميشود. اگر ضريب همبستگي جامعه ρ و ضريب همبستگي نمونهاي به حجم n از جامعه r باشد، ممکن است r تصادفي و اتفاقي بدست آمده باشد. براي اين منظور از آزمون معني داري ضريب همبستگي استفاده ميشود. در اين آزمون بررسي ميشود آيا دو متغير تصادفي و ضریب همبستگی چیست؟ مستقل هستند يا خير. به عبارت ديگر آيا ضريب همبستگي جامعه صفر است يا خير.
این ضریب میزان همبستگی بین دو متغیر فاصله ای یا نسبی را محاسبه کرده مقدار آن بین 1+ و 1- می باشد اگر مقدار بدست آمده مثبت باشد به معنی این است که تغییرات دو متغیر به طور هم جهت اتفاق می افتد یعنی با افزایش در هر متغیر، متغیر دیگر نیز افزایش می یابد و برعکس اگر مقدار r منفی شد یعنی اینکه دو متغیر در جهت عکس هم عمل می کنند یعنی با افزایش مقدار یک متغیر مقادیر متغیر دیگر کاهش می یابد و برعکس.اگر مقدار بدست آمده صفر شد نشان میدهد که هیچ رابطه ای بین دو متغیر وجود ندارد و اگر 1+ شد همبستگی مثبت کامل و اگر 1- شد همبستگی کامل و منفی است.
ضريب همبستگي اسپيرمن
هرگاه دادهها بصورت رتبهاي جمع آوري شده باشند يا به رتبه تبديل شده باشند، ميتوان از همبستگي رتبهاي اسپيرمن (rs) كه يكي از روشهاي ناپارامتريك است، استفاده کرد. (بهبوديان، 1383 : 145) يکي از مزيتهاي ضريب همبستگي اسپيرمن به ضريب همبستگي پيرسون اين است که اگر يک يا چند داده نسبت به ساير اعداد بسيار بزرگ باشد چون تنها ضریب همبستگی چیست؟ رتبه آنها محسوب ميشود، ساير دادهها تحت الشعاع قرار نميگيرند.
براي محاسبة ضريب همبستگي رتبهاي دادههاي زوجي (xi,yi) ابتدا به تمام xها برحسب مقاديرشان رتبه ميدهيم و همين كار را نيز براي yها انجام ميدهيم، سپس تفاضل بين رتبههاي هر زوج را كه با نشان ميدهيم حساب ميكنيم. در مرحله بعد توان دوم dها را محاسبه كرده، در نهايت با استفاده از اين فرمول ضريب همبستگي رتبهاي را حساب ميكنيم.
ضريب همبستگي کندال
موريس گريگور کندال به سال 1930 به مطالعه در مورد اين ضريب پرداخت. دقت کنيد ضريب هماهنگي کندال با ضريب همبستگي تاو کندال تفاوت دارد. کندال در ضريب همبستگي کندال داراي خواصي نظير ضريب همبستگي ساده است. براي برآورد آن از آماره τ استفاده ميشود.
ضريب هماهنگي توافقي کندال
ضريب همبستگي کندال که با نماد w نشان داده ضریب همبستگی چیست؟ ميشود يک آزمون ناپارامتريک است و براي تعيين ميزان هماهنگي ميان نظرات استفاده ميشود. ضريب کندال بين 0 و 1 متغير است. اگر ضريب کندال صفر باشد يعني عدم توافق کامل و اگر يک باشد يعني توافق کامل وجود دارد. ويژگيهاي ضريب کندال يکي از مهمترين کاربردهاي اين آزمون را در مديريت فراهم کرده است. براي پايان راندهاي تکنيک دلفي ميتوان از ضريب هماهنگي کندال استفاده کرد.
ساير ضرائب همبستگي
ضریب همبستگی چوپروف T : ضریب هبستگی چوپروف به منظور تعیین شدت وابستگی بین متغیرهای مورد مطالعه به کار گرفته می شود و مقدار آن همواره بین صفر ویک در نوسان می باشد زمانی از آن استفاده کرده که هر دو متغیر اسمی و یا یکی اسمی و دیگری ترتیبی باشد. اما نباید تعداد سطر و ستون با هم برابر باشند.یعنی در جدول توافقی 2در2 نمی توان از آن استفاده کرد. در چنین مواردی باید از ضریب فی استفاده کرد.
ضریب همبستگی فی: به منظور بررسی شدت همبستگی بین دو متغیر اسمی که جدول توافقی 2 در 2 می باشد مورد استفاده قرار می گیرد.خی دو سطح معنی دار بودن همبستگی بین دو متغیر را تعیین میکند اما ضریب فی شدت همبستگی آنها را نشان می دهد. مقدار آن همواره بین صفر و یک در نوسان است.
ضریب کرامر: این ضریب برای تغیین میزان شدت همبستگی بین دو متغیر اسمی مورد استفاده قرارمی گیرد و آن را با (V2) نشان می دهند و مقدار آن نیز همواره بین صفر ویک در نوسان است.هم جدول توافقی بیشتر از 2 در 2 وهم برای مستطیلی بکار می رود . http://parsmodir.com/db/research/correlation.php
ضریب همبستگی پیرسون که به نام های ضریب همبستگی گشتاوری ویا ضریب همبستگی مرتبه ی صفر نیز نامیده می شود ، توسط سرکارل پیرسون معرفی شده است. این ضریب به منظور تعیین میزان رابطه، نوع و جهت رابطه ی بین دو متغیر فاصله ای یا نسبی و یا یک متغیر فاصله ای و یک متغیر نسبی به کار برده می شود. چندین روش محاسباتی معادل می توان برای محاسبه ی این ضریب تعریف نمود.
الف) روش محاسبه با استفاده از اعداد خام :
ب) روش محاسبه از طریق نمره های استاندارد شده :
ضریب همبستگی پیرسون بین -1 و 1 تغییر می کند.اگر r=1 بیانگر رابطه ی مستقیم کامل بین دو متغیر است ، رایطه ی مستقیم یا مثبت به این معناست که اگر یکی از متغیرها افزایش (کاهش) یابد، دیگری نیز افزایش (کاهش) می یابد. مانند رابطه ی بین میزان ساعات مطالعه در روز و معدل محصلین.
r=-1 نیز وجود یک رابطه ی معکوس کامل بین دو متغیر را نشان می دهد. رابطه ی معکوس یا منفی نشان می دهد که اگر یک متغیر افزایش یابد متغیردیگر کاهش می یابد و بالعکس.
زمانی که ضریب همبستگی برابر صفر است نشان می دهد که بین دو متغیر رابطه ی خطی وجود ندارد.
1) صفر بودن ضریب همبستگی تنها عدم وجود رابطه ی خطی بین دو متغیر را نشان می دهد ولی نمی توان مستقل بودن دو متغیر را نیز نتیجه گرفت. هنگامی که ضریب همبستگی پیرسون بین دو متغیر صفر باشد، این متغیرها تنها در صورتی مستقل از یکدیگرند که توزیع متغیرها نرمال باشد.
2) همبستگی بین دو متغیر تنها نشان دهنده ی این است که افزایش یا کاهش یک متغیر چه تاثیری بر افزایش یا کاهش متغیر دیگر دارد ولی این همبستگی ضرورتا دال بر رابطه ی علّی بین متغیرها نمی باشد. به طور مثال اگر در یک تحقیق دو متغیر قد و تحصیلات همبستگی مثبت بالایی داشته باشندنمی توانیم نتیجه بگیریم که افراد قد بلندتر دارای تحصیلات بیشتری هستند. بنابراین باید بین مفاهیم همبستگی و رابطه ی علّت و معلولی تفاوت قائل شد. به بیان دیگر ممکن است دو متغیر همبستگی داشته باشند ولی لزومی ندارد که یکی از متغیرها علت و دیگری معلول باشد، علاوه براین عوامل متعدد دیگری نیز می توانند بر ضریب همبستگی اثرگذار باشند.
مثال : سنوات خدمت و میزان درآمد تعدادی کارمنددر دست است ، به کمک نرم افزار spss ضریب همبستگی پیرسون را محاسبه می کنیم.