استراتژی گزینه های باینری

ضریب همبستگی چیست؟

تفاوت همبستگی اسپیرمن و پیرسون

شاید برای شما نیز این سوال ایجاد شده باشد که ضریب همبستگی پیرسون یا ضریب همبستگی اسپیرمن چه تفاوتی دارد؟ یا این که هر یک از این ضرایب در کجا کاربرد دارند و چه چیزی را محاسبه می کنند. در ادامه این مقاله ابتدا هر یک از این ضرایب را تعریف می کنیم، در رابطه کاربردهای هر یک به شما توضیح می دهیم و در نهایت تفاوت آن ها را نیز مطرح می کنیم.

بدون شک برای درک تفاوت میان دو مفهوم ابتدا باید تعریف هر یک از آن ها را بلد باشید تا بتوانید شباهت ها و تفاوت های میان آن را نیز درک کنید. در ادامه تعاریف هر یک از ضریب همبستگی پیرسون و ضریب همبستگی اسپیرمن را ارائه می دهیم.

ضریب همبستگی پیرسون

ضریب همبستگی پیرسون یا ضریب همبستگی گشتاوری یا ضریب مرتبه صفر توسط آماردانی به نام کارل پیرسون معرفی شد. هر زمانی که شما بخواهید میزان، نوع و جهت رابطه میان دو متغیر تحت بررسی را تعیین کنید از روش ضریب همبستگی پیرسون استفاده می کنید. فرمول محاسبه مقدار ضریب همبستگی پیرسون به صورت زیر است:

ضریب همبستگی اسپیرمن

ضریب همبستگی رتبه ای اسپیرمن توسط آماردان و روانشنان انگلیسی به نام چارلز اسپیرمن معرفی شده است. این ضریب برای تعیین میزان و نوع ارتباط میان دو متغیر ترتیبی به کار برده می شود. ضریب همبستگی اسپیرمن یک ضریب ناپارامتری است و به جای این که از خود مقادیر استفاده کنیم، از رتبه مربوط به هر یک از مقادیر استفاده می کنیم. فرمول محاسبه این ضریب به صورت زیر می باشد:

تفاوت ضریب ضریب همبستگی چیست؟ همبستگی اسپیرمن و پیرسون

تفاوت های میان این دو روش همبستگی به شرح زیر می باشند:

1- پیرسون پارامتری بوده و برای محاسبه همبستگی میان دو متغیر فاصله ای یا نسبی کاربرد دارد اما اسپیرمن ناپارامتری است و رابطه میان دو متغیر ترتیبی را می سنجد.

2- اسپیرمن برای بررسی روابط غیرخطی به کار برده می شود اما پیرسون رابطه های خطی را آشکار می سازد.

3- عملکرد ضریب همبستگی پیرسون بالاتر از ضریب همبستگی اسپیرمن است.

4- برای محاسبه اسپیرمن پیش فرض های کمتری نیاز داریم در نتیجه محاسبه آن ساده تر است.

منظور از پارامتری و ناپارامتری بودن چیست؟

فرض نرمالیتی (Normality Test) به شما می گوید که یک مجموعه داده از توزیع نرمال پیروی می کنند یا خیر. حال به بیان ساده، اگر یک مجموعه داده از توزیع نرمال پیروی کند، آن را پارامتری نامیده و برای محاسبه رابطه بین چنین متغیرهایی از روش های پارامتری استفاده می کنند. حال اگر این فرضیه رد شود، برای انجام اعمال آماری روی متغیر مورد نظر باید از روش های ناپارامتری استفاده کنیم.

با توجه به توضیحی که در مورد داده های پارامتری و ناپارامتری مطرح شد، برای بررسی رابطه میان دو مجموعه داده ناپارامتری از روش اسپیرمن و برای بررسی دو مجموعه داده پارامتری از پیرسون استفاده می کنیم. حال اگر یکی از متغیرها پارامتری و دیگری ناپارامتری باشد، برای بررسی میزان و نوع رابطه بین آن ها باید از روش رگرسیون استفاده کنیم.

ضریب همبستگی چیست؟

بارها توسط افراد مختلف در حوزه‌های شغلی گوناگون یا در رسانه‌ها به منظور تحلیل آماری و بیان نتایج تحقیقات، واژه ضریب همبستگی یا اصطلاح لاتین آن Correlation را شنیده‌ایم. یکی از مهم ترین کاربردهای این مفهوم در بازارهای مالی است، که در این مطلب به بررسی آن و مباحث پیرامونی در حوزه بازار بورس می‌پردازیم. ضریب همبستگی یک ابزار آماری برای تعیین نوع و درجه رابطه متغیرهای کمی با یکدیگر است. این مفهوم یکی از معیارهای تشخیص میزان همبستگی دو متغیر می‌باشد. در واقع این ضریب نوع رابطه یعنی مستقیم یا معکوس بودن و شدت رابطه یعنی بازه ۱+ تا ۱- را نشان می‌دهد. همچنین اگر میان دو متغیر مذکور رابطه‌ای وجود نداشته باشد، مقدار ضریب همبستگی برابر صفر است.

اصول کاربردی ضریب همبستگی

  • ضریب همبستگی مثبت یعنی افزایش یک متغیر با افزایش متغیر دیگر و همچنین کاهش یک متغیر با کاهش متغیر دیگر همراه است.
  • ضریب همبستگی منفی یعنی افزایش یک متغیر با کاهش متغیر دیگر و ضریب همبستگی چیست؟ همچنین کاهش آن متغیر با افزایش متغیر دیگر همراه است.
  • ضریب همبستگی صفر یعنی افزایش و کاهش دو متغیر مستقل از یکدیگر بوده و هیچ ارتباطی ندارند.
  • هرچه مقدار ضریب همبستگی به ۱+ یا ۱- نزدیک‌تر باشد، همبستگی مثبت یا منفی متغیرها قوی‌تر است.

ضریب همبستگی در بازار مالی

یکی از مفاهیم اساسی مورد استفاده معامله‌گران حرفه‌ای در انواع بازارهای مالی شامل سهام، کالا و ارز (فارکس) است؛ اما در این مطلب از ذکر مبانی آماری و جزئیات محاسباتی پرهیز نموده و تمرکز اصلی ما روی نحوه استفاده از این مفهوم در بازار سهام ایران می‌باشد. بررسی‌های آماری ثابت کرده است، که نوسانات دارایی‌ها در بازارهای مالی نسبت به یکدیگر بدون ارتباط نیستند. حتی در مقیاس بزرگ‌تر، بازارهای جهانی نیز به یکدیگر وابستگی داشته و کاملاً از یکدیگر تاثیر می‌پذیرند. مثلاً بارها مشاهده نموده‌اید، که سقوط قیمت سهام در بازارهای مالی بزرگ جهان به صورت دومینو وار به سایر بازارهای سهام نیز سرایت کرده است. همسبتگی در میان دارایی‌ها بی‌دلیل نبوده و معمولاً به دلیل وجود وجوه اشتراک یا تضاد بنیادی میان این نمادها ایجاد می‌شود. در واقع یکی از مهم‌ترین مزایای استفاده از مفهوم ضریب همبستگی حین سرمایه‌گذاری در بازارهای مالی، استفاده از فرصت‌های بهینه و کاهش خطای تحلیل تا بیشترین حد ممکن است. از طرف دیگر برخی معامله‌گران عمده نیز از این مفهوم به منظور اتخاذ موقعیت‌های معاملاتی پوشش ریسک بهره می‌برند.

ضریب همبستگی در بازار سهام ایران

اگر تجربه فعالیت در بازار بورس و اوراق بهادار تهران را داشته باشید، حتماً تاکنون وجود ضریب همبستگی مثبت نسبتاً بالا در کل بازار را متوجه شده‌اید. به عبارت دیگر سهام موجود در بازار بورس و فرابورس ایران همبستگی مثبت بالایی نسبت به یکدیگر دارند. برای اثبات این موضوع هم می‌توان، به نمودار سهام مختلف و شاخص کل در دوره‌های زمانی متفاوت مراجعه نمود. در واقع رفتار دمینووار بازارهای مالی در بورس تهران به طور کاملاً عینی و ملموس قابل مشاهده است. دلیل این رفتار بازار سهام نیز ناشی از شرایط بازار سرمایه ایران از لحاظ محدودیت تعداد شرکت‌های پذیرفته شده، کم عمق بودن بازار، تحریم‌ها و عدم اتصال به بازار جهانی یا رفتار هیجانی توده معامله‌گران می‌باشد.

همبستگی با سهام لیدر یا شاخص‌ساز

در بازار سهام ایران گروه‌های صنعتی مختلفی داریم. از طرف دیگر تعدادی سهام مربوط به غول‌های صنعتی و اصطلاحاً شاخص‌ساز وجود دارند، که از نظر اکثر فعالان بورس تعیین‌کننده روند بازار بوده و سهام متوسط یا کوچک در بسیاری از موارد تابع روند این نمادها هستند. با بررسی نمودارهای قیمتی بازار بورس موارد متعددی را مشاهده می‌کنیم، که با ایجاد نوسانات صعودی یا نزولی در سهام نمادهای لیدر بازار شرکت‌های کوچک‌تر هم‌گروه نیز به سرعت تغییر روند داده و با آن‌ها همسو شده‌اند. البته مواردی نیز وجود دارند، که به دلیل وقوع اتفاقات خاص درون شرکت یا مؤلفه‌های بنیادی روند برخی تک‌سهم‌ها نسبت به سهم لیدر یا کل بازار متفاوت بوده است.

همبستگی با سهامداران عمده (شرکت های مادر)

از دیگر همبستگی‌های مهم بازار سهام ایران می‌توان، به ترکیب سهامداران شرکت‌ها اشاره نمود. به طور مثال یک شرکت بورسی نظیر هلدینگ‌های سرمایه‌گذاری (سایر شرکت‌ها در راستای تملک یا جایگزین نمودن سهام ارزشمند بورسی) اقدام به خرید سهام سایر شرکت‌های بورسی از صنایع مختلف نموده و پرتفوی سهام تشکیل داده است. این شرکت‌ها به عنوان سهامدار در ترکیب سهامداران حضور دارند. در چنین شرایطی اگر در وضعیت بنیادی یا قیمتی سهام خریداری شده تحول مثبتی رخ دهد، طبعاً در ارزش ذاتی نماد شرکت سهامدار عمده نیز تعدیل مثبت ایجاد خواهد شده و یا در صورتی که درصد سهامداری بسیار بالا باشد، نوسانات قیمتی نمادها مشابه بوده و تفاوتی ندارند.

همبستگی بر اساس ترکیب پرتفوی

هبستگی سهام بورسی گاهاً بر اساس وضعیت سبد سرمایه‌گذاری ضریب همبستگی چیست؟ آن‌ها ایجاد می‌شود. اگر گزارشات و صورت‌های مالی برخی شرکت‌ها را بررسی کنید، شباهت زیادی در پرتفوی آن‌ها قابل مشاهده است. حال اگر به نمودار قیمت این نمادها نیز مراجعه کنیم، شباهت معناداری در جزئیات نوسانات قیمتی آن‌ها وجود دارد. به طور کلی با استفاده از ضریب همبستگی می‌توانید، فرصت‌های سرمایه‌گذاری مناسبی را شکار کنید. مثلاً اگر سایر شروط تحلیل تکنیکال و بنیادی مورد نظر شما برقرار باشند، خرید سهام یک شرکت سرمایه‌گذاری دارای پرتفوی بورسی مثبت (نمادهای موجود در پرتفوی شرایط بنیادی و قیمتی مثبتی دارند) در قیمت‌های منفی ارزنده است.

تشکیل پرتفوی با توجه به ضریب همبستگی

موارد مذکور شامل بخشی از روابط و همبستگی‌هایی است، که در بازار سهام مشاهده شده و حین سرمایه‌گذاری باید حتماً به این موارد توجه داشت. در واقع برای معامله‌گری موفق صرفاً نیاز به درک مفاهیم تحلیلی متعدد و پیچیده نداشته و بعضاً با توجه به چنین نکات ساده‌ای می‌توان، از ورود به موقعیت‌های معاملاتی اشتباه با ریسک بالا جلوگیری نمود. به طور مثال اگر چند سهم با همبستگی مثبت بالا خریداری کرده و یکی از سهام اصلی دچار روند نزولی شود، احتمالاً روند قیمتی بقیه سهام موجود در پرتفوی نیز معکوس شده و یک ضرر سنگین چند برابری را متحمل می‌شوید!

حال در مورد ضریب همبستگی به دو مثال از بازار سهام تهران توجه کنید.

۱- در تاریخ نگارش مطلب (۲۷/۰۶/۱۳۹۹) و بر اساس اطلاعات سایت TSETMC، شرکت سرمایه‌گذاری خوارزمی مالک ۱/۱ درصد معادل ۱۱۲ میلیون سهم از گروه خودروسازی بهمن است. همان‌طور که اشاره نمودیم، در صورت وقوع اتفاقات بنیادی مثبت در نماد خبهمن در میزان سودسازی نماد وخارزم نیز متناسب با میزان تملک سهام خبهمن تعدیل مثبت ایجاد می‌شود. همچنین اگر در پرتفوی بورسی خود نماد وخارزم دارید، دیگر خرید نماد خبهمن چندان منطقی نیست؛ زیرا به صورت غیرمستقیم و از طریق سرمایه‌گذاری خوارزمی این نماد (خبهمن) را خریداری نموده‌اید! در واقع اگر اصرار به خرید یک نماد خودرویی دارید، حتی‌الامکان باید نماد خودرویی دیگری را خریداری کنید، تا قاعده متنوع سازی رعایت شده و از تحمل ریسک چند برابر پرهیز نمایید.

۲- در مثال بعدی به بررسی دو نماد خساپا و وساپا می‌پردازیم. در ابتدا به ترکیب سهامداران خودروسازی سایپا توجه کنید.

ترکیب سهامداران شرکت سرمایه‌گذاری سایپا نیز جالب است!

در نهایت با توجه به ترکیب سهامداران فوق، قطعاً مشاهده این نمودار قیمتی دور از انتظار نیست.

اگر نمودار این دو سهم را در بلندمدت مورد بررسی قرار دهیم، در بسیاری از مواقع حتی در کوچک‌ترین نوسانات بازار نیز مسیر یکسانی داشته‌اند. بنابر تفاسیر فوق خرید و سهامداری همزمان این دو شرکت با توجه به همبستگی تقریباً کامل آن‌ها، از دیدگاه متنوع سازی و مدیریت ریسک اصلاً منطقی نیست.

کلام پایانی

همواره در بخش‌های پایانی مقالات و حین معرفی تکنیک‌های مختلف معامله‌گری به این موضوع تأکید نموده‌ایم، که هیچ کدام از این ابزار عملکرد قطعی و صد درصدی نداشته و همواره باید با صرف زمان، کسب تجربه و بر اساس تعدادی از روش‌های تحلیل و معامله‌گری، استراتژی یا فلسفه معاملاتی خود را به مرور زمان بسازید. مفهوم ضریب همبستگی در بازار سهام نیز از این قاعده مستثنی نبوده و اگر بیشتر در این زمینه جستجو کنید، مطمئناً به میزان تسلط بالاتری رسیده و شاید همبستگی‌های بیشتری را نیز بیابید.

انواع ضرایب همبستگی

انواع ضریب همبستگی

استنباط آماری که در واقع یک نوع نتیجه گیری کلی از جزء به کل است، در معرض آزمایش و خطاست. یک جنبه از استنباط آماری محاسبه برآوردهایی (Estimates ) از پارمترهای جامعه مانند میانگین جامعه از طریق آماره های نمونه ها مانند میانگین نمونه است.

فرضیه (hypothesis) :

فرضیه آماری نقطه آغاز آزمون فرض است. فرضیه آماری یک بیان مقداری در باره پارامترهای جامعه است و اصولا بدون داشتن فرضیه آماری امکان انجام یک آزمون دشوار است.فرضیه آماری به دو دسته فرض صفر (H0) و فرض خلاف (H1) بیان می‌شود . اغلب فرضیه بیانگر این مطلب است که یک ارتباط علیتی بین دو متغیر وجود دارد به شکلی که میزان یکی (متغیر مستقل یاIndependent ) تا حدودی تعیین کننده دیگری متغیر وابسته یا (Dependent) است.

انواع داده :

1) داده های کمی (فاصله ای) Interval اعدادی هستند که بیانگر کمیت به صورت واحدهای عددی و بر اساس یک مقیاس مستقل است .قد و وزن مثالهای بارز دادههای کمی هستند.

2) دادههای رتبه ای Ordinal مشتمل بر رتبه ها، تعلق داشتن به گروههای رتبه بندی شده یا اطلاعات ترتیبی است. به عنوان مثال اگر دو داور به یک مجموعه 10 تایی از نقاشی رتبه یک (برای بهترین) تا رتبه 10 (برای بدترین) بدهند. مجموعه داده ها ضریب همبستگی چیست؟ مشتمل بر 10 جفت رتبه خواهد بود. که هر جفت برای یک نقاشی است.

3) دادههای اسمی (nomial ) که مربوط به متغیر یا خواص کیفی مانند جنس یا گروه خونی است و بیانگر عضویت در یک گروه خاص می باشد.

محاسبه ضرایب همبستگی تا حدود زیادی متاثر از مقیاس اندازه گیری متغیر ها است، بعنوان مثال برای متغیر­های اسمی جهت رابطه اصلا معنی ندارد، بین جنس و معدل تنها می­توان گفت که شدت وابستگی چه مقدار است اما افزایش یا کاهش جنس معنی ندارد.

با توجه به نوع متغیر ها ضریب همبستگی می­تواند یکی از حالت­های زیر را داشته باشد.

1- دو متغیر اسمی

2- دو متغیر رتبه­ای

3- دو متغیر فاصله­ای- نسبی

4- متغیر اسمی و متغیر رتبه ای

5- متغیر اسمی و متغیر فاصله­ای - نسبی

6- متغیر رتبه­ای و متغیر فاصله­ای – نسبی

برای هر کدام از حالت­های بالا ضرایب همبستگی متفاوتی وجود دارند و محاسبه آنها در نرم افزار های spss ، lisrel و R امکان پذیراست.

از آنجا که انتخاب ضریب همبستگی مناسب برای بررسی روابط بین متغیرها تحت تاثیر مقیاس اندازه گیری متغیرهای مورد بررسی است لذا تناسب بین سطوح اندازه گیری و ضریب همبستگی سازگار از این جدول برای تصمیم گیری مناسب است

آزمون های آماری

سطح سنجش متغیرها

خی دو – فی – وی کرامر – لاندا

خی دو – فی – وی کرامر – لاندا

تحلیل واریانس یکطرفه – تی تست

فاصله ای یا نسبی

خی دو – فی – وی کرامر – لاندا

ضریب همبستگی رتبه ای اسپیرمن

خی دو – فی – وی کرامر – لاندا

ضریب همبستگی پیرسون r

ضریب همبستگی رتبه ای اسپیرمن

هرگاه رابطه بین دو متغیر را بررسی کردیم و بین آن دو رابطه معنی دار وجود داشت می توانیم ضریب همبستگی و میزان شدت همبستگی را نیز محاسبه کنیم .

ضرایب همبستگی در واقع وابستگی دو متغیر را مشخص می کنند:

اگر ضریب همبستگی بین 25/0 تا 35/0 ضریب بسیار پایین است – تنها 4% تغییرات مشترک میان دو متغیر را نشان می دهد

اگر ضریب همبستگی بین 35/0 تا 65/0 ضریب متوسط است – حدود 25% تغییرات مشترک میان دو متغیر را نشان ضریب همبستگی چیست؟ می دهد

اگر ضریب همبستگی بین 65/0 تا 85/0 ضریب بالایی است –تا 72% تغییرات مشترک میان دو متغیر را نشان می دهد

در اصل برای بررسی میزان هماهنگی میان دو متغیر به دنبال شاخصهایی می گردیم که در اصل دو ویژگی زیر را داشته باشند:

1- به واحد دو جامعه وابسته نباشد

به طور مثال در تحولات اقصادی به دنبال رابطه میان تقاضای نفت خام در برابر تقاضای طلا می باشیم. یا در مطالعه تحولات اجتماعی به دنبال رابطه درآمد سرپرست خانواده و میزان تحصیل فرزندان می باشیم و مثالهایی از این دست.

مجموعه اطلاعات (داده های) موجود در انجام یک آزمون همبستگی که شامل اندازه های بدست آمده از دو متغیر X و Y می باشند را می توان به صورت یک نمونه تصادفی دو متغیره (Xn ,Yn), . (X1 ,Y1) بیان کرد
مطالعه رابطه بین متغیرها بوسیله ((تحلیل همبستگی)) ( Analysis Corroletion ) انجام می شود. که بیانگر وجود یک رابطه خطی بین دو متغیر می باشد.

فرمول ضریب همبستگی به صورت زیر می باشد

با توجه به مقدار r در حاتهای مختلف تفسیرهای گوناگونی از رابطه X و Y خواهیم داشت.

حالتهای مختلف برای r

1- r =1 در این حالت همبستگی کامل و مستقیم گوییم. با افزایش مقدار x مقدار y به طور قطعی
زیاد می شود.

2- r = -1 در این حالت همبستگی را کامل و معکوس گوییم. با افزایش مقدار x مقدار y کاهش می یابد.

انواع ضرایب همبستگی:

ضریب همبستگی چوپروف T :ضریب هبستگی چوپروف به منظور تعیین شدت وابستگی بین متغیرهای مورد مطالعه به کار گرفته می شود و مقدار آن همواره بین صفر ویک در نوسان می باشد زمانی از آن استفاده کرده که هر دو متغیر اسمی و یا یکی اسمی و دیگری ترتیبی باشد. اما نباید تعداد سطر و ستون با هم برابر باشند.یعنی در جدول توافقی 2در2 نمی توان از آن استفاده کرد. در چنین مواردی باید از ضریب فی استفاده کرد.

ضریب همبستگی فی: به منظور بررسی شدت همبستگی بین دو متغیر اسمی که جدول توافقی 2 در 2 می باشد مورد استفاده قرار می گیرد.خی دو سطح معنی دار بودن همبستگی بین دو متغیر را تعیین میکند اما ضریب فی شدت همبستگی آنها را نشان می دهد. مقدار آن همواره بین صفر و یک در نوسان است.

ضریب همبستگی پیرسون r : این ضریب میزان همبستگی بین دو متغیر فاصله ای یا نسبی را محاسبه کرده مقدار آن بین 1+ و 1- می باشد اگر مقدار بدست آمده مثبت باشد به معنی این است که تغییرات دو متغیر به طور هم جهت اتفاق می افتد یعنی با افزایش در هر متغیر، متغیر دیگر نیز افزایش می یابد و برعکس اگر مقدار r منفی شد یعنی اینکه دو متغیر در جهت عکس هم عمل می کنند یعنی با افزایش مقدار یک متغیر مقادیر متغیر دیگر کاهش می یابد و برعکس.اگر مقدار بدست آمده صفر شد نشان میدهد که هیچ رابطه ای بین دو متغیر وجود ندارد و اگر 1+ شد همبستگی مثبت کامل و اگر 1- شد همبستگی کامل و منفی است.

ضریب کرامر: این ضریب برای تغیین میزان شدت همبستگی بین دو متغیر اسمی مورد استفاده قرارمی گیرد و آن را با (V 2 ) نشان می دهند و مقدار آن نیز همواره بین صفر ویک در نوسان است.هم جدول توافقی بیشتر از 2 در 2 وهم برای مستطیلی بکار می رود .

ضریب همبستگی رتبه ای اسپیرمن : آن را با علامتP نشان می دهند و همواره بین 1+ و 1- می باشد از لحاظ سطح سنجش ترتیبی است.در صورتی که داده های ما به صورت فاصله ای و نسبی باشند می توانیم آنها را به رتبه تبدیل کنیم.مهم نیست کدام متغیر وابسته و کدام متغیر مستقل است.

نکته مهم : اگر ضریب همبستگی صفر باشد نشاندهنده عدم وجود همبستگی است

ضریب همبستگی همواره بین 1+ و 1- در نوسان است

اگر ضریب همبستگی کمتر از صفر باشد همبستگی ناقص و منفی است یعنی با افزایش یک متغیر دیگری کاهش می یابد

اگر ضریب همبستگی بزرگتر از صفر باشد ناقص و مثبت است یعنی با افزایش یک متغیر، دیگری نیز افزایش می یابد

اگر صفر باشد نشاندهنده عدم وجود همبستگی است

کاربرد آزمون های پارامتری و ناپارامتری در علوم رفتاری

مقایسه داده ها در دو یا بیش از دو گروه وابسته و مستقل

تعداد گروههای تحت مطالعه

متغیر مورد مطالعه

گروههای تحت مطالعه

نوع آزمون مورد انتخاب

1

دو گروه

کمی

مستقل

t مستقل

2

دو گروه

رتبه ای

مستقل

من ویتنی

3

دو گروه

اسمی

مستقل

خی دو

4

دو گروه

کمی

وابسته

t وابسته

5

دو گروه

رتبه ای

وابسته

ویلکاکسون آزمون نشانه

ارتباط و ضریب همبستگی Correlation در گراف پد

به دست آوردن اندازه ارتباط و همبستگی بین Variableها از موضوعات مهم در تحلیل‌های آماری به حساب می‌آید. با استفاده از ضریب همبستگی که عددی بین 1- تا 1+ قرار دارد، می‌توان به اندازه اثرگذاری بین کمیت‌ها پرداخت.

در نرم‌افزار گراف پد مثالی با نام Correlation در دسته تحلیل‌های XY و در بخش Correlation & regression linear and nonlinear صفحه ورودی نرم‌افزار گراف پد قرار دارد. فایل مثال را می‌توانید از اینجا دانلود کنید.

وقتی مثال را Create می‌کنیم با داده‌های زیر روبه‌رو می‌شویم. نحوه نوشتن داده‌ها در تحلیل‌های XY همان‌گونه که از نام این تحلیل‌ها برمی‌آید به صورت یک یا چند ستون تحت نام X و Y که قرار است ارتباط بین آن‌ها را به دست آوریم، بیان می‌شود.

در این مثال همان‌گونه که مشاهده می‌کنید، داده‌ها در 153 سطر و چهار ستون آمده‌اند. هر سطر بیانگر یک روز می‌باشد. ستون X نشان‌دهنده‌ی سطح اوزون Ozone level و ستون‌های Y به صورت تابش خورشیدی solar radiation، باد wind و دما temperature آمده‌اند.

هدف ما در این مثال به دست آوردن اندازه ارتباط و اثرگذاری سه شرایط آب و هوایی (تابش، باد و دما) بر روی سطح اوزون است.

به این منظور و جهت مشاهده نتایج به دست آمده در همان شیت داده‌ها، بر روی دکمه Analyze کلیک می‌کنیم. در پنجره Analyze data باز شده، تحلیل Correlation را انتخاب می‌کنیم.

پنجره تنظیمات با نام Parameters: Correlation برای ما به صورت زیر باز می‌شود.

  • Compute correlations between which paires of columns

در این بخش با سه گزینه روبه‌رو هستیم. Compute r for every pair of Y data sets Correlation matrix برای ما ماتریس همبستگی بین Y ها را به دست می‌دهد. یعنی ضریب همبستگی بین هر Y با Y دیگر به دست می‌آید. با انتخاب این گزینه X در ماتریس همبستگی قرار ندارد و ارتباط بین هر Y با X به دست نمی‌آید.

گزینه Compute r for X vs.every Y data set ضریب همبستگی بین X با هر کدام از Yها را به دست می‌آورد.

گزینه Compute r between two selected data sets این امکان را در اختیار ما قرار می‌دهد تا تنها همبستگی بین یک ستون دلخواه با ستون دلخواه دیگری به دست بیاید.

  • Assume data are sampled from Gaussian distribution

نرم‌افزار گراف پد در اینجا سوال مهمی از ما می‌پرسد. آیا توزیع داده‌ها نرمال (گوسین) هستند یا خیر؟ پاسخ مثبت یا منفی به این سوال، نوع ضریب همبستگی ما را متفاوت خواهد کرد. در واقع اگر توزیع داده‌های مورد بررسی نرمال باشند از ضریب همبستگی پیرسن و اگر داده‌ها نرمال نباشند از ضریب همبستگی ناپارامتری اسپیرمن، استفاده خواهیم کرد.

انتخاب یک دامنه‌ای بودن و یا Two-tailed بودن آزمون همبستگی در این بخش انجام می‌شود. توضیح این‌که آزمون همبستگی یک دامنه، بزرگ‌تر از صفر بودن ضریب همبستگی (همبستگی مثبت) و یا کوچکتر از صفر بودن ضریب همبستگی (همبستگی منفی) را بررسی می‌کند. در حالی که آزمون همبستگی Two دامنه، هم بزرگ‌تر از صفر بودن ضریب همبستگی (همبستگی مثبت) و هم کوچکتر از صفر بودن ضریب همبستگی (همبستگی منفی) را بررسی می‌کند.

همچنین در همین بخش و از کادر Confidence interval می‌توان ضریب اطمینان فاصله اطمینان، برای ضریب همبستگی به دست آمده را تعیین کرد.

تعداد رقم‌های اعشار مقدار احتمال P value به دست آمده، در این بخش تعیین می‌شود. همچنین می‌توان درباره نحوه نمایش P value تصمیم‌گیری کرد.

چنانچه در بخش Compute correlations between which paires of columns گزینه Compute r for every pair of Y data sets Correlation matrix را انتخاب کرده باشیم، با انتخاب این گزینه می‌توان Heatmap یا همان نمودار حرارتی ماتریس همبستگی را مشاهده کرد.

بنابراین در ابتدا باید مشخص کنیم که توزیع داده‌های ما در این مثال، نرمال است یا خیر. نحوه بررسی نرمال بودن داده‌ها را می‌نوانید از این لینک مشاهده کنید. در این مثال، بار دیگر نحوه آزمون نرمالیتی را تکرار نمی‌کنیم. تنها نتایج نرم‌افزار را آورده‌ایم. در خروجی زیر از نرم‌افزار گراف پد می‌توانید، نتیجه آزمون نرمالیتی بر داده‌های مثال Correlation را مشاهده کنید.

آن‌چه از جدول بالا به دست می‌آید، بیانگر عدم نرمال بودن داده‌های تابش، باد و دما می‌باشد. بنابراین در این مثال می‌بایست از ضریب همبستگی ناپارامتری اسپیرمن استفاده کنیم.

بنابراین پنجره تنظیمات Parameters: Correlation را به صورت زیر قرار می‌دهیم.

با OK کردن، شیت نتایج با نام Correlation of Ozone correlations در فولدر Results پنجره راهبری سمت چپ نرم‌افزار، ساخته می‌شود.

در این شیت می‌توانید اندازه ضریب همبستگی اسپیرمن بین Ozone با هر کدام از Yها را در سطر با نام r مشاهده کنید. فاصله اطمینان 95 درصد برای ضریب همبستگی اسپیرمن نیز آمده است.

در بخش P value سطح معناداری و مقدار احتمال به دست آمده در هر آزمون همبستگی (بین X و هر Y) آمده است. نتیجه به دست آمده نشان می‌دهد، ارتباط معنادار بین سطح اوزون با هر کدام از شرایط تابش، باد و دما تایید می‌شود.

در سطر Number of XY Paires تعداد روزهای مورد بررسی آمده است. تفاوت در تعداد روزها به دلیل آن بوده است که ما در برخی از روزها فاقد اطلاعات بوده‌ایم و به عبارتی عددی برای ان روز ثبت نشده است.

آنچه در پایان از این شیت به دست می‌آید این است که ارتباط بین اوزون با دما و در مرتبه بعدی با تابش معنادار و مثبت است، به همین ترتیب ارتباط بین اوزون با باد معنادار اما منفی و وارون است.

خوب است به فولدر Graphs نیز برویم و نمودار پراکنش بین Variableها را مشاهده کنیم. در فولدر Graphs شیت با نام Ozone correlation دیده می‌شود. هنگامی که بر روی این شیت کلیک می‌کنیم، پنجره Change Graph Type برای ما باز می‌شود.

از آن‌جا که مثال Correlation در دسته تحلیل‌های XY نرم‌افزار گراف پد قرار دارد، بنابراین به صورت پیش‌فرض Graph family بر روی XY باز می‌شود. انواع نمودارهای متناظر با XY را می‌توانیم در این پنجره مشاهده کنیم. با OK کردن گراف پراکنش زیر برای ما ساخته می‌شود.

این گراف به صورت توام، برهم‌کنش بین اوزون با Solar R، Wind و Temp را شامل می‌شود. با توجه به مقیاس‌ها و اعداد متفاوت اندازه‌گیری Yها، نمودار فوق نیاز به اصلاح و ویرایش دارد. در واقع به منظور مشاهده دقیق نحوه اثر‌گذاری اوزون بر هر Y، باید نمودار جداگانه پراکنش، رسم شود. برای انجام این کار ابتدا بیایید از همین نمودار موجود، چند کپی دیگر بسازیم. برای این کار روی شیت گراف رفته و راست کلیک کنید.

در آن‌جا گزینه Duplicate Current Sheet را انتخاب کنید. این کار را یکبار دیگر نیز تکرار کنید. یعنی در نهایت به تعداد ستون‌های Y که سه تا است، سه شیت گراف شبیه به هم (البته فعلاً تا اینجا) داشته باشید.

هدف ما این است که سه شیت گراف داشته باشیم تا هر کدام از آن‌ها را برای ساختن نمودار پراکنش بین اوزون با هر کدام از Yها (تابش، دما، باد) استفاده کنیم.

در مرحله بعد بر روی نمودار دبل کلیک کنید تا پنجره تنظیمات Format Graph زیر باز شود.

از آنجا بر روی تب Data Sets on Graph بزنید. محیط زیر را مشاهده خواهید کرد.

در کادر Data sets plotted front to back می‌توانید اسامی ستون‌های Y یعنی Wind، Solar R و Temp را مشاهده کنید. از آن‌جا که می‌خواهیم در این مرحله، نمودار پراکنش ما تنها شامل Ozone و مثلاً Solar R باشد، بنابراین بر روی دو سطر Ozone correlation:B:Wind و Ozone correlation:B:temp رفته و دکمه Remove سمت راست را می‌زنیم.

در پایان تب Data Sets on Graph از پنجره Format Graph به شکل زیر خواهد بود.

بنابراین از نرم‌افزار، در این مرحله می‌خواهیم فقط نمودار پراکنش بین اوزون و تابش را رسم کند. با OK کردن، گراف زیر را خواهیم داشت.

برای عنوان محور Y، عبارت Solar R را نوشته‌ایم. همان‌گونه که در خروجی نتایج و ضریب همبستگی اسپیرمن نیز نشان دادیم، ارتباط بین اوزون و تابش مستقیم و معنادار به دست آمده بود. گراف پراکنش بالا نیز ارتباط مثبت را بیان می‌کند. خوب است نام این گراف را به صورت Ozone & Solar R correlations قرار دهیم. برای این کار بر روی شیت Ozone correlations راست کلیک کرده و گزینه Rename Sheet را انتخاب کنید. با این‌کار هر نام دلخواهی که دوست دارید، می‌توانید قرار دهید.

همین فرایند بالا را این‌بار بر روی شیت کپی شده با نام Copy of Ozone correlations انجام داده و این‌بار Yهای Solar R و Temp را حذف کنید تا بتوانید نمودار پراکنش جداگانه بین اوزون و Wind را به دست بیاورید.

این‌بار با OK کردن نمودار پراکنش زیر را خواهیم داشت.

عنوان نمودار و محور Y را خودمان نوشته‌ایم. نام شیت را هم با همان فرایند Rename کردن شیت می‌توانید به صورت Ozone & Wind correlations قرار دهید. گراف بالا بیانگر وجود ارتباط منفی و وارون بین اوزون و Wind است. قبلاً در Results نیز با استفاده از ضریب همبستگی اسپیرمن، معنادار بودن این ارتباط را مشاهده کرده‌ایم.

در پایان تنها رسم نمودار پراکنش بین Ozone و Temp باقی می‌ماند. این کار را نیز با دبل کلیک کردن بر شیت باقیمانده Copy of Ozone correlations انجام می‌دهیم. ویرایش نمودار طبق توضیحات بالا و حذف Yهای Solar R و Wind، گراف زیر را برای ما خواهد ساخت.

در گراف پراکنش بالا، ارتباط مستقیم و مثبت بین اوزون و دما، تایید می‌شود.

اجازه دهید در پایان به یک نکته دیگر نیز اشاره کنیم. در پنجره Parameters: Correlation و گزینه Compute r for every pair of Y data sets Correlation matrix به این موضوع اشاره کردیم که می‌توان صرفنظر از X ارتباط درونی بین Y ها را به صورت یک ماتریس همبستگی و همچنین پلات حرارتی Heatmap، به دست آورد.

بنابراین خوب است یک‌بار دیگر به شیت داده‌ها رفته و از آن‌جا با استفاده از دکمه Analyze به پنجره Parameters: Correlation برویم. تنظیمات را مانند شکل زیر قرار می‌دهیم.

به این ترتیب در فولدر Results شیت جدید دیگری با نام Correlation of Ozone correlations ساخته می‌شود. جالب است این شیت دارای چهار زبانه است.

ماتریس ضریب همبستگی اسپیرمن بین Solar R، Wind و Temp با یکدیگر، مشاهده می‌شود. به عنوان مثال عدد 0.447- نشان می‌دهد، ارتباط بین Wind و Temp وارون و به اندازه 0.447 منفی است.

مقدار احتمال ضریب همبستگی‌ها در این تب بیان شده است. به عنوان مثال همان ارتباط بین Wind و Temp به دلیل کوچک بودن مقدار احتمال آن، معنادار گزارش می‌شود.

در این تب می‌توان به دست آورد که در هر همبستگی، چه تعداد نمونه (هر نمونه بیانگر یک روز بود) وجود داشته است. مثلاً در بررسی ارتباط بین دما و باد، 153 روز مورد بررسی قرار گرفته است. کاهش در تعداد روزها و در همبستگی‌های دیگر به دلیل این است که اطلاعات مربوط به آن روز برای دما یا باد در دسترس نبوده است.

  • Confidence interval of rs

در این تب می‌توانید فاصله اطمینان ضریب همبستگی، به ازای هر کدام از خانه‌های ماتریس همبستگی را مشاهده کنید. به عنوان مثال فاصله اطمینان 95 درصد ضریب همبستگی اسپیرمن برای ارتباط بین Wind و Temp به صورت (0.3055- , 0.5684-) به دست آمده است. منفی بودن هر دو کران بالا و پایین فاصله اطمینان، بیانگر ارتباط معنادار وارون بین دما و باد می‌باشد.

ما در پنجره Parameters: Correlation و بخش Graphing گزینه Create a heatmap of the correlation matrix را نیز انتخاب کرده بودیم. نتیجه این انتخاب را می‌توانید در فولدر Graphs پنجره Navigator نرم‌افزار، مشاهده کنید.

یک شیت جدید با نام Spearman r: Correlation of Ozone correlations در فولدر Graphs ساخته شده است. گراف به دست آمده را می‌توانید در شکل زیر ببینید.

به این نوع نمودارها که با استفاده از شدت رنگ، اندازه‌ها و آماره‌های مختلف را نشان می‌دهند، پلات حرارتی یا Heat Map گفته می‌شود. در Heat Mapها همواره خط کش مدرج‌بندی طیف رنگ، وجود ضریب همبستگی چیست؟ دارد. به عنوان مثال در پلات بالا، رنگ سفید، عدم ارتباط را نشان می‌دهد (بین Solar R و Wind). آبی‌ها از کم‌رنگ تا پررنگ، بیانگر ارتباط قوی مثبت و قرمزها از کم‌رنگ به پررنگ نیز ارتباط قوی منفی را نشان می‌دهند.

چگونه به این مقاله رفرنس دهیم

GraphPad Statistics (2020). Correlation coefficient in GraphPad Prism Software. Statistical tutorials and software guides. Retrieved Month, Day, Year, from https://graphpad.ir/correlation-prism/.php

For example, if you viewed this guide on 12 th January 2022, you would use the following reference

GraphPad Statistics (2020). Correlation coefficient in GraphPad Prism Software. Statistical tutorials and software guides. Retrieved January, 12, 2022, from https://graphpad.ir/correlation-prism/.php

ارایه خدمات تحلیل و مشاوره آماری

گراف پد برای شما خدمات مشاوره و انجام انواع تحلیل‌های آماری را ارایه می‌دهد. جهت دریافت نکات بیشتر ضریب همبستگی چیست؟ بهتر است با ما تماس بگیرید.

سید محمد طباطبایی بافقی

منبع اصلي: کتاب آموزش کاربردي SPSS
تحقيق همبستگي يکي از روش‌هاي تحقيق توصيفي (غيرآزمايشي) است که رابطه ميان متغيرها را براساس هدف تحقيق بررسي مي‌کند. مي‌توان تحقيقات همبستگي را براساس هدف به سه دسته تقسيم کرد: همبستگي دو متغيري، تحليل رگرسيون و تحليل کوواريانس يا ماتريس همبستگي. در اين زمينه در بخش اول قسمت تقسيم‌بندي روش‌هاي تحقيق براساس هدف توضيح لازم ارائه گرديد. بنابراين همبستگي براي بررسي نوع و ميزان رابطه متغيرها استفاده مي‌شود. در حاليکه رگرسيون پيش‌بيني روند آينده يک متغير ملاک (وابسته) براساس يک مجموعه روابط بين متغير ملاک با يک چند متغير پيش‌بين (مستقل) است که در گذشته ثبت و ضبط شده است.
ضريب همبستگي شاخصي است رياضي که جهت و مقدار رابطه ي بين دو متغير را توصيف مي‌کند. ضريب همبستگي درمورد توزيع هاي دويا چند متغيره به کار مي رود. اگر مقادير دو متغير شبيه هم تغيير کند يعني با کم يا زياد شدن يکي ديگري هم کم يا زياد شود به گونه‌اي که بتوان رابطه آنها را به صورت يک معادله بيان کرد گوييم بين اين دو متغيرهمبستگي وجود دارد. ضريب همبستگي پيرسون، ضريب همبستگي اسپيرمن و ضريب همبستگي تاو کندال از مهمترين روش‌هاي محاسبه همبستگي ميان متغيرها هستند. بطور کلي:
1- اگر هر دو متغير با مقياس رتبه‌اي باشند از شاخص تاوکندال استفاده مي‌شود.
2- اگر هر دو متغير با مقياس نسبتي و پيوسته باشند از ضريب همبستگي پيرسون استفاده مي‌شود.
3- اگر هر دو متغير با مقياس نسبتي و گسسته باشند از ضريب همبستگي اسپيرمن استفاده مي‌شود.

- تفسير نتايج ضريب همبستگي برونداد SPSS
براساس يک قاعده کلي براساس مقادير زير مي‌توان درباره ميزان همبستگي متغيرها قضاوت کرد. بخاطر داشته باشيد همين تفسير براي مقادير منفي نيز قابل استفاده است:

ضريب همبستگي تفسير
0.00 - 0.19 خيلي اندک و قابل چشم پوشي
0.20 - 0.39 خيلي اندک تا اندک
0.40 - 0.69 متوسط
0.70 - 0.89 زياد
0.90 - 1.00 خيلي زياد

اين مقادير يک قانون ثابت نيستند و به صورت تجربي بدست آمده است. در برخي متون مانند زير نيز ارائه شده است:

ضريب همبستگي تفسير
0.0 - 0.1 خيلي اندک و قابل چشم پوشي
0.1 - 0.3 اندک
0.3 - 0.5 متوسط
0.5 - 1.0 زياد

همچنين آماره .sig يا همان P-Value مربوط به همبستگي مشاهده شده بايد کوچکتر از سطح خطا باشد. يک قانون کلي وجود دارد و آن اينکه اگر همبستگي بزرگتر از 0.3 باشد مقدار معناداري کوچکتر از سطح خطاي 0.05 خواهد بود. تجربه آماري من نيز هميشه مطابق اين قانون بوده است.


کارل پيرسون

ضريب همبستگي پيرسون
در بررسي همبستگي دو متغير اگر هردو متغير مورد مطالعه در مقياس نسبي و فاصله‌اي باشند از ضريب همبستگي گشتاوري پيرسون استفاده مي‌شود. اگر ضريب همبستگي جامعه ρ و ضريب همبستگي نمونه‌اي به حجم n از جامعه r باشد، ممکن است r تصادفي و اتفاقي بدست آمده باشد. براي اين منظور از آزمون معني داري ضريب همبستگي استفاده مي‌شود. در اين آزمون بررسي مي‌شود آيا دو متغير تصادفي و ضریب همبستگی چیست؟ مستقل هستند يا خير. به عبارت ديگر آيا ضريب همبستگي جامعه صفر است يا خير.
این ضریب میزان همبستگی بین دو متغیر فاصله ای یا نسبی را محاسبه کرده مقدار آن بین 1+ و 1- می باشد اگر مقدار بدست آمده مثبت باشد به معنی این است که تغییرات دو متغیر به طور هم جهت اتفاق می افتد یعنی با افزایش در هر متغیر، متغیر دیگر نیز افزایش می یابد و برعکس اگر مقدار r منفی شد یعنی اینکه دو متغیر در جهت عکس هم عمل می کنند یعنی با افزایش مقدار یک متغیر مقادیر متغیر دیگر کاهش می یابد و برعکس.اگر مقدار بدست آمده صفر شد نشان میدهد که هیچ رابطه ای بین دو متغیر وجود ندارد و اگر 1+ شد همبستگی مثبت کامل و اگر 1- شد همبستگی کامل و منفی است.


چارلز اسپيرمن

ضريب همبستگي اسپيرمن
هرگاه داده‌ها بصورت رتبه‌اي جمع آوري شده باشند يا به رتبه تبديل شده باشند، مي‌توان از همبستگي رتبه‌اي اسپيرمن (rs) كه يكي از روشهاي ناپارامتريك است، استفاده کرد. (بهبوديان، 1383 : 145) يکي از مزيت‌هاي ضريب همبستگي اسپيرمن به ضريب همبستگي پيرسون اين است که اگر يک يا چند داده نسبت به ساير اعداد بسيار بزرگ باشد چون تنها ضریب همبستگی چیست؟ رتبه آنها محسوب مي‌شود، ساير داده‌ها تحت الشعاع قرار نمي‌گيرند.
براي محاسبة ضريب همبستگي رتبه‌اي داده‌هاي زوجي (xi,yi) ابتدا به تمام xها برحسب مقاديرشان رتبه مي‌دهيم و همين كار را نيز براي yها انجام مي‌دهيم، سپس تفاضل بين رتبه‌هاي هر زوج را كه با نشان مي‌دهيم حساب مي‌كنيم. در مرحله بعد توان دوم d‌ها را محاسبه كرده، در نهايت با استفاده از اين فرمول ضريب همبستگي رتبه‌اي را حساب مي‌كنيم.


موريس کندال

ضريب همبستگي کندال
موريس گريگور کندال به سال 1930 به مطالعه در مورد اين ضريب پرداخت. دقت کنيد ضريب هماهنگي کندال با ضريب همبستگي تاو کندال تفاوت دارد. کندال در ضريب همبستگي کندال داراي خواصي نظير ضريب همبستگي ساده است. براي برآورد آن از آماره τ استفاده مي‌شود.
ضريب هماهنگي توافقي کندال
ضريب همبستگي کندال که با نماد w نشان داده ضریب همبستگی چیست؟ مي‌شود يک آزمون ناپارامتريک است و براي تعيين ميزان هماهنگي ميان نظرات استفاده مي‌شود. ضريب کندال بين 0 و 1 متغير است. اگر ضريب کندال صفر باشد يعني عدم توافق کامل و اگر يک باشد يعني توافق کامل وجود دارد. ويژگي‌هاي ضريب کندال يکي از مهمترين کاربردهاي اين آزمون را در مديريت فراهم کرده است. براي پايان راندهاي تکنيک دلفي مي‌توان از ضريب هماهنگي کندال استفاده کرد.

ساير ضرائب همبستگي
ضریب همبستگی چوپروف T : ضریب هبستگی چوپروف به منظور تعیین شدت وابستگی بین متغیرهای مورد مطالعه به کار گرفته می شود و مقدار آن همواره بین صفر ویک در نوسان می باشد زمانی از آن استفاده کرده که هر دو متغیر اسمی و یا یکی اسمی و دیگری ترتیبی باشد. اما نباید تعداد سطر و ستون با هم برابر باشند.یعنی در جدول توافقی 2در2 نمی توان از آن استفاده کرد. در چنین مواردی باید از ضریب فی استفاده کرد.
ضریب همبستگی فی: به منظور بررسی شدت همبستگی بین دو متغیر اسمی که جدول توافقی 2 در 2 می باشد مورد استفاده قرار می گیرد.خی دو سطح معنی دار بودن همبستگی بین دو متغیر را تعیین میکند اما ضریب فی شدت همبستگی آنها را نشان می دهد. مقدار آن همواره بین صفر و یک در نوسان است.
ضریب کرامر: این ضریب برای تغیین میزان شدت همبستگی بین دو متغیر اسمی مورد استفاده قرارمی گیرد و آن را با (V2) نشان می دهند و مقدار آن نیز همواره بین صفر ویک در نوسان است.هم جدول توافقی بیشتر از 2 در 2 وهم برای مستطیلی بکار می رود . http://parsmodir.com/db/research/correlation.php

ضریب همبستگی پیرسون که به نام های ضریب همبستگی گشتاوری ویا ضریب همبستگی مرتبه ی صفر نیز نامیده می شود ، توسط سرکارل پیرسون معرفی شده است. این ضریب به منظور تعیین میزان رابطه، نوع و جهت رابطه ی بین دو متغیر فاصله ای یا نسبی و یا یک متغیر فاصله ای و یک متغیر نسبی به کار برده می شود. چندین روش محاسباتی معادل می توان برای محاسبه ی این ضریب تعریف نمود.

الف) روش محاسبه با استفاده از اعداد خام :

ب) روش محاسبه از طریق نمره های استاندارد شده :

ضریب همبستگی پیرسون بین -1 و 1 تغییر می کند.اگر r=1 بیانگر رابطه ی مستقیم کامل بین دو متغیر است ، رایطه ی مستقیم یا مثبت به این معناست که اگر یکی از متغیرها افزایش (کاهش) یابد، دیگری نیز افزایش (کاهش) می یابد. مانند رابطه ی بین میزان ساعات مطالعه در روز و معدل محصلین.

r=-1 نیز وجود یک رابطه ی معکوس کامل بین دو متغیر را نشان می دهد. رابطه ی معکوس یا منفی نشان می دهد که اگر یک متغیر افزایش یابد متغیردیگر کاهش می یابد و بالعکس.

زمانی که ضریب همبستگی برابر صفر است نشان می دهد که بین دو متغیر رابطه ی خطی وجود ندارد.

1) صفر بودن ضریب همبستگی تنها عدم وجود رابطه ی خطی بین دو متغیر را نشان می دهد ولی نمی توان مستقل بودن دو متغیر را نیز نتیجه گرفت. هنگامی که ضریب همبستگی پیرسون بین دو متغیر صفر باشد، این متغیرها تنها در صورتی مستقل از یکدیگرند که توزیع متغیرها نرمال باشد.

2) همبستگی بین دو متغیر تنها نشان دهنده ی این است که افزایش یا کاهش یک متغیر چه تاثیری بر افزایش یا کاهش متغیر دیگر دارد ولی این همبستگی ضرورتا دال بر رابطه ی علّی بین متغیرها نمی باشد. به طور مثال اگر در یک تحقیق دو متغیر قد و تحصیلات همبستگی مثبت بالایی داشته باشندنمی توانیم نتیجه بگیریم که افراد قد بلندتر دارای تحصیلات بیشتری هستند. بنابراین باید بین مفاهیم همبستگی و رابطه ی علّت و معلولی تفاوت قائل شد. به بیان دیگر ممکن است دو متغیر همبستگی داشته باشند ولی لزومی ندارد که یکی از متغیرها علت و دیگری معلول باشد، علاوه براین عوامل متعدد دیگری نیز می توانند بر ضریب همبستگی اثرگذار باشند.

مثال : سنوات خدمت و میزان درآمد تعدادی کارمنددر دست است ، به کمک نرم افزار spss ضریب همبستگی پیرسون را محاسبه می کنیم.

مقالات مرتبط

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

برو به دکمه بالا