- المفاهيم الإحصائية :Statistical Concepts
- المتغيرات Variables:
- مقاييس النزعة المركزية Measures of Central Tendency:
- خصائص الوسط الحسابي Mean's Characteristics:
- عيوب الوسط الحسابي :Mean's Deficiencies
- خصائص الوسيطMedian's Characteristics
- عيوب الوسيط Median's Deficiencies:
- خصائص المنوالMode's Characteristics :
- * عيوب الانحراف المتوسط Mean Deviation Deficiencies:
مفاهيم أساسية في الإحصاء
إن هذا العصر الذي نحيا به قد أطلِق عليه عصر المعلوماتية؛ لأنه العصر الذي انتشر فيه استخدام تكنولوجيا المعلومات؛ حيث أصبحت المعلومات تمثل الثورة الحقيقية التي انتشرت في حياتنا في العصر الحديث، ودخلت في أعمالنا وبيوتنا بصورة أو بأخرى سواء كان ذلك بإرادتنا أو بدونها؛ لهذا فإنه من الواجب علينا أن نساير التقدم الحادث في جميع الميادين والمجالات ونواكبه.
وبسبب أهمية علم الإحصاء للكثير من الباحثين والطلبة سوف نذكر في هذا المقال بعض المفاهيم الإحصائية التي من الممكِن أن يحتاجوا إليها، وهي:
المفاهيم الإحصائية :Statistical Concepts
-مفهوم الإحصاء Definition Of Statistics:
مجموعة الأساليب العلمية التي تهتم بجمع البيانات، وتصنيفها، وتفسيرها، وتقييمها، وتبويبها، وتلخيصها، والتوصل من خلالها إلى استنتاجات تتعلق بالمجتمع؛ عن طريق اعتماد العينة التي تمثل جزءًا بسيطًا من المجتمع.
- الإحصاء الوصفي Descriptive Statistics:
يُعنى به جمع المعطيات، ووصفها، وتحليلها، وتوضيحها بأسلوب مفهوم وذي دلالة، والتعامل بدون تعميم مع المعطيات الإحصائية، وعرضها من خلال الرسوم البيانية والجداول وغيرها.
-الإحصاء الاستدلالي Inferential Statistics:
هو تحليل الاستنتاجات وتفسيرها، وتقديم استخلاص لها استنادًا إلى عينة بسيطة من مجتمع الدراسة؛ من أجل الوصول إلى قرارات تتعلق بالمجتمع، وهو يعتمد على التنبؤ والتعميم.
-المعطيات الإحصائية Statistical Data:
هي المعلومات والبيانات الإحصائية الخاصة بالظواهر الاجتماعية، والإدارية، والتربوية، وهذه المعطيات تتنوع في طبيعتها ونوعها حسب نوع الظاهرة التي يتم قياسها، وأيضًا وفقًا للأدوات المستخدَمة في البحث، ومنهجيته وأدواته الإحصائية.
-البيانات Data:
تمثل علامات أو مشاهدات أو مقادير يتم التعبير عنها بأرقام.
-البيانات غير المبوَّبة Ungrouped Data:
هي البيانات الأصلية أو الأولية التي تم جمعها ولم يتم تبويبها.
-البيانات المبوبة Grouped Data:
هي البيانات التي تم تبويبها وتفريغها في جداول توزيع تكرارية.
-المعطيات الكمية Quantitative Data:
هي التي تَقوم بوصف ظاهرة محددة بصورة رقمية، على سبيل المثال سعر السلعة وعلامات الطالب.
-المعطيات النوعية Qualitative Data:
هي المعلومات التي تَقوم بوصف ظاهرة محددة بصورة غير رقمية، على سبيل المثال اللون والجنس.
-التوزيع Distribution:
هي مجموعة المشاهدات أيًّا كان عددها.
-المجتمع Population:
عبارة عن مشاهدات أو بيانات أو علامات يَقوم الباحث بتحديد هويته.
- مجتمع العينة Sample Population:
هو المجتمع الذي يَقوم الباحث بسحب العينة منه.
- مجتمع الهدف Target Population:
هو المجتمع الذي سوف يتم تعميم عليه نتائج الدراسة التي تم إجراؤها على مجتمع العينة.
-العينة Sample:
هي عبارة عن جزء من المجتمع.
-المؤشر Index:
يعبِّر عن مقاييس التشتت والنزعة المركزية والعلاقة أي الارتباط سواء كان ذلك محسوبًا لمجتمعات أو لعينات، وهذا المؤشر من الوارد أن يكون لعينة أي إحصائي Statistic؛ حيث يتم استخدامه للعينات, أو قد يكون مؤشرًا لمجتمع أي معلم؛ حيث يتم استخدامه للمجتمع. Parameter.
المتغيرات Variables:
المتغيرات إما أن تكون متغيرات عشوائية أو متغيرات إحصائية، ذلك أن المتغير الإحصائي يعبِّر عن القيم التي تمثل ظاهرة معَينة، والمتغير العشوائي يعبِّر عن ظاهرة كمية أو نوعية يكون التنبؤ بها بصورة مسبَقة غير ممكِنٍ، فالمتغير Variable هو عبارة عن ظاهرة قيمها تكون مختلفة، حيث إن الخاصية إذا كانت مختلفة بين مجموعة من الأفراد حينها نقول عنها إنها متغير، وفي حالة تشابه الأشخاص نوعيًا أو تساويهم كمًا بالنسبة لخاصية محددة تكون هي الثابت.
ويتم تصنيف المتغيرات حسب طبيعة المعلومات التي يتعامل معها القياس إلى:
- المتغيرات الاسمية Nominal Variables:
المتغيرات النوعية ذات أعداد الفئات المعَينة من غير أي وزنٍ لتلك الفئات، وهي يتم استخدامها فقط في التصنيف، كما أن أحدها غير مفضَّلٍ على الآخر.
مثال: متغير الجنس الذي يتم تصنيف المجتمع من خلاله إلى فئتين وهما: الإناث، والذكور؛ حيث إننا إذا أعطينا الذكور رقم (1) وأعطينا الإناث رقم (2)، فالأرقام لا تشير إلى معنى حقيقي؛ حيث لا يمكِن أن يتم إجراء عمليات حسابية عليها.
مثال: إذا تم تقسيم الأشخاص وفقًا للطول إلى قصير وطويل.
مثال: أوجه قطعة النقود التي هي كتابة وصورة.
- المتغيرات الترتيبية Ordinal Variables:
هي متغير نوعي له عدد فئات معَينة يمكِن أن يتم ترتيبها بشكل تنازلي أو تصاعدي، والفروق بين مختلَف القيم لا يمكِن تحديدها بشكل دقيق، مثال: وسط، كبير، صغير.
مثال: في حالة أن العلامة التي حصل عليها خالد في مادة اللغة الانجليزية أعلى من العلامة التي حصل عليها فادي، وأن العلامة التي حصل عليها فادي أعلى من العلامة التي حصل عليها علي، فإننا نتوصل بالتبعية إلى ترتيب الأشخاص فقط.
- المتغيرات الفئوية Interval Variables:
هي المتغيرات الكمية التي نستطيع إجراء عليها العمليات الحسابية، وهذا من غير أن تتأثر المسافة النسبية الموجودة بين قِيَمها، وذلك المتغير يمكِن تمييزه عن طريق القيمة الصفرية التي ليس معناها عدم وجود هذه الصفة.
مثال: في حالة حصول علي على علامة صفر في الامتحان فإن ذلك لا يدل على أن عليًّا لا يفقه أي شيء في اللغة الانجليزية.
- المتغيرات النسبية :Ratio Variables
هي متغيرات كمية لا تختص بفئات معَينة، وهي قريبة الشبه بالمتغيرات الفئوية، ولكن هنا الصفر يشير إلى أن الصفة غير موجودة، مثل: المتغيرات الزمنية.
المقياس | الاستخدام |
| تصنيف |
| تصنيف ترتيب |
| تصنيف ترتيب مسافة صفر افتراضي |
| تصنيف ترتيب مسافة صفر مطلق |
* تصنيف المتغيرات حسب وجود علاقة بين متغيرين إلى:
1- المتغير المستقل Independent Variable: وهو المتغير الذي يكون خاضعًا لسيطرة الباحث أو الإحصائي.
2- المتغير التابع Dependent Variable: وهو المتغير الذي نتمكن من التنبؤ بقيمته عن طريق اطلاعنا على القيم الخاصة بالمتغير المستقل.
مثال: في حالة أن معلمًا يريد أن يحدد تأثير عدد الساعات الدراسية على التحصيل في مبحثٍ محدد، ما هو المتغير التابع هنا؟ وما هو المتغير المستقل؟
المتغير التابع هو: تحصيل الطالب، والمتغير المستقل هو: عدد الساعات الدراسية.
مقاييس النزعة المركزية Measures of Central Tendency:
إن أي بيانات إحصائية لها مجموعة من الخواص التي تعمل على إعطاء مدلول وفكرة عن وضع تلك البيانات، ومن تلك الخصائص التالي:
إحصائيات النزعة المركزية: وتُطلَق عليها المتوسطات، وأبرز تلك المتوسطات هي الوسيط والوسط الحسابي والمنوال، ونستطيع عن طريقها أن نحدد موقع النقطة المتحورة حولها جميع القيم، وكل من هذه الإحصائيات له عيوبه مثلما له مميزاته، ويمكِن استخدام أي من تلك الإحصائيات أو المتوسطات اعتمادًا على مجموعة من الأمور التي من بينها:
- شكل التوزيع: هل هو ملتوٍ أم معتدل؟
- مستوى القياس: هل هو رتبي أم نسبي أم اسمي أم فئوي؟
- إحصائيات التشتت: ويُعنى بها حالة الانتشار التي تكون البيانات عليها حول المتوسط، وأبرز تلك المقاييس هي التباين والمدى والانحراف المعياري.
1- الوسط الحسابي Arithmetic Mean:
يعبِّر الوسط الحسابي عن معدَّل المشاهدات الحادث في التوزيع، أي مجموع قيم المشاهدات مقسومًا على عددها.
* الدلالات الإحصائية للوسط الحسابي Statistical Significance for Mean:
-كلما زادت قيمة الوسط الحسابي الخاص بالعلامات فإن ذلك يشير إلى أداء أفضل، بشرط عدم وجود قيم متطرفة مرتفعة تسببت في زيادة الوسط الحسابي.
- كلما تم توزيع العلامات على جانبي الوسط الحسابي بصورة متساوية ومتماثلة كان التوزيع معتدلًا وموضحًا للفروق الموجودة بين الطلاب بشكل أفضل.
خصائص الوسط الحسابي Mean's Characteristics:
- يستند إلى المشاهدات كافة.
- تفسيره وفهمه يكون سهلًا، كما أن حسابه يتم بسرعة وسهولة.
- التحويلات الخطية تؤثر عليه، واختلاف العينات داخل المجتمع لا تؤثر عليه.
- يعَد هو أفضل مقاييس النزعة عند التعامل مع الإحصاء الاستدلالي.
- أن المجموع الذي يمثله انحرافات القيم عن أوساطاتها الحسابية يعادل الصفر.
عيوب الوسط الحسابي :Mean's Deficiencies
- غير قابل للقياس بالأساليب البيانية.
- إمكانية تأثره بعدد مشاهدات متطرفة قليلة.
- غير قابل للحساب في التوزيع محدود الفئات.
2- الوسيط (Md) Median:
هي المشاهدة التي يكون عندها التوزيع منقسمًا إلى نصفين، بمعنى أن يكون بَعدها 50% من نسبة المشاهدات.
الوسيط: هو المشاهدة الواقعة في منتصف التوزيع.
لحساب الوسيط نَقوم بالآتي:
-نَقوم بترتيب البيانات تنازليًّا أو تصاعديًّا.
-في حالة أن البيانات عددها فردي، فإن المشاهدة الحاصلة على الترتيب(n 1)/2 تكون هي الوسيط.
-في حالة أن البيانات عددها فردي، فإن معدل المشاهدتين الحاصلتين على الترتيب n/2 و(n 1)/2 هما الوسيط.
خصائص الوسيطMedian's Characteristics :
- يمكِن أن يتم احتسابه للجداول غير المغلقة أي المفتوحة.
- يمكِن أن يتم احتسابه عندما تكون بعض القيم مفقودة، بشرط أن ترتيبها يكون معروفًا.
- يمكِن احتسابه بسهولة، كما أن إيجاده بيانيًّا يكون سهلًا.
- يقع في وسط البيانات، ومن ثم فإنه غير قابل للتأثر بالقيم المتطرفة.
- يعتمد على موقع البيانات لا على قيمها.
- قابل للتأثر بالتحويلات الخطية المتمثلة في الطرح والقسمة والجمع والضرب.
عيوب الوسيط Median's Deficiencies:
كونه حساسًا للقيم الوسيطة.
في حالة قلة عدد المشاهدات فإن الوسيط من الممكِن ألا يعكس مركز تجمع المشاهدات بشكل دقيق.
3- المنوال (Mo)Mode :
هو مركز الصفة أو الفئة أو العلامة المقابلة لأعلى تكرار في التوزيع.
القيمة ذات التكرار الأكثر أو الظاهرة ذات الشيوع الأعلى |
خصائص المنوالMode's Characteristics :
-استعماله محدود، بالإضافة إلى أنه دائم التأثر بحجم العينة.
-الإحصائي الوحيد الذي من الممكِن أن يتم استخدامه في حالة أن البيانات الإحصائية في مستوى القياس الاسمي.
-يمكِن أن يتم استخدامه في حالة أن البيانات فئوية أو رتبية أو نسبية.
-اعتماده فقط يكون على القيم المتكررة، ولا يكون على قيم البيانات كافة.
-يمكِن الحصول عليه بيانيًّا، كما أن طول الفئة في التوزيع تؤثر عليه.
-تؤثر فيه التحويلات الخطية مثل الطرح والقسمة والجمع والضرب.
-القيم المتطرفة لا تؤثر فيه.
-التوزيع قد يكون له أكثر من منوال.
-لا يدخل في تحليلات إحصائية كثيرة تكون غير واقعة في نطاق وصف البيانات.
-يمكِن أن يتم احتسابه في الجداول المفتوحة.
-دلالته كمتوسط تكون أقل حينما يكون مدى القيم واسع الانتشار.
-البيانات قد يكون لها ما يزيد عن منوال واحد.
-يمكِن أن يتم حساب المنوال للمتغيرات النوعية والمتغيرات الكمية.
4- المئينات (Pi) :Percentiles
هو عبارة عن مقياس يتم عن طريقه تقسيم البيانات إلى مائة جزء، ومن ثم فإنه هناك تسعة وتسعون مئين، وهو قيمة محددة موجودة في التوزيع تليها أو تَسبقها نسبة مئوية محددة من المشاهدات التي تدخل فيه.
المئين ك: المشاهدة التي يساويها أو يقل عنها ك % من المشاهدات, ويرمز الباحثون عادةً إلى المئين ك بالرمز مك.
3 -مقاييس التشتتMeasure Dispersion or Variation :
يتم استخدام مقاييس التشتت في حالة قياس مدى انتشار قيم المشاهدات الموجودة حول الوسط الحسابي الذي يُعتبر نقطة التركز، ويُقصَد بالاختلاف أو التشتت أنه هو التباعد الذي يوجَد بين المشاهدات التي تتبع متغيرًا معَينًا عن وسطها الحسابي.
في حالة وجود مجموعتين من البيانات ذات الوسط الحسابي نفسه، فمن الوارد أن تكون المجموعتان غير متماثلتي الانتشار حول الوسط الحسابي.
كلما زادت قيم مقاييس التشتت فإن ذلك يشير إلى درجة عالية من التبايُن بين قيم البيانات، وكلما كانت قيم مقاييس التشتت صغيرة دل ذلك على وجود درجة اختلاف قليلة بين قيم البيانات.
لهذا فإن تلك المقاييس تعبِّر عن مدى تجانس البيانات أو اختلافها عن مركزها، كما يشير هذا إلى درجة انتشارها.
وهناك عدة مقاييس للتشتت، وهي:
- المدى Range (R)
- الانحراف Mean Deviation (MD)،
- التباين (62) Variance،
- الانحراف المعياري Standard Deviation (6)،
- معامل الاختلاف Coefficient Variation (CV).
1- المدى Range (R):
مدى مجموعة من البيانات هو الفرق ما بين أكبر وأصغر قيمة لهذه المجموعة، ويتم التعبير عنه بالرمز R.
* المدى للبيانات غير المبوبة Ungrouped Data:
المدى = أكبر قيمة – أصغر قيمة Range = Highest score - Lowest Score |
* المدى للبيانات المبوبة Grouped Data:
بما أن أصغر قيمة وأكبر قيمة يكونان غير معروفين في حالة كون البيانات مبوَّبة، فإن القيمة التقريبية للمدى تكون هي:
المدى للتوزيع = مركز الفئة الأخيرة – مركز الفئة الأولى. = الحد الأعلى للفئة الأخيرة – الحد الأدنى للفئة الأولى. = الحد الأعلى الفعلي للفئة الأخيرة - الحد الأدنى الفعلي للفئة الأولى. |
* عيوب المدى 's Deficiencies :Range:
1- القيم المتطرفة والشاذة تؤثر فيهه.
2- لا يمكِن استخدامه في المعطيات المبوَّبة التي تشتمل على فئات مفتوحة.
* مزايا المدى Range's Characteristics:
1- سهل الفهم.
2- سهل الحساب.
3- يتم استخدامه كثيرًا في الأوساط العامة.
2- الانحراف Mean Deviation (MD):
هو الوسط الحسابي لقيمة الانحراف المطلقة لهذه القيم عن الوسط الحسابي الخاص بها.
* الانحراف المتوسط للبيانات المبوَّبة Grouped Data:
بافتراض أن جميع القيم التي تقع ضمن الفئات تكون عند مركز تلك الفئات، فإن الانحراف المتوسط يكون معبِّرًا عن مجموع الانحرافات لقيم مراكز تلك الفئات عن وسطها الحسابي مضروبةً في تكرارها، وبَعد ذلك قسمة الناتج على مجموع التكرارات.
* عيوب الانحراف المتوسط Mean Deviation Deficiencies:
1- استخدامه نادر كنتيجة لأن عملية احتسابه تَقوم على القيم المطلقة والتي تَقوم بإهمال الإشارة.
2- أن استخدامه يكون غير ممكِن مع الجداول التكرارية التي فئاتها محدودة.
*مزايا الانحراف المتوسط :Mean Deviation Characteristics:
يتم شمول جميع القيم المطلوب معرفة قيمة تشتتها.
3- التباين (62) :Variance:
هو الوسط الحسابي لمربعات انحرافات القيم Xi عن وسطها الحسابي ̅X.
قيم التباين العالية تشير إلى أن الأشياء مختلفة ومتناثرة ومتباعدة وغير متجانسة.
قيم التباين المنخفضة تشير إلى أن الأشياء متقاربة وغير مختلفة ومتجانسة.
4- الانحراف المعياري :Standard Deviation (6):
يعَد الانحراف المعياري من أكثر مقاييس التشتت أهمية وشيوعًا، كما أنه هو يعبِّر عن الجذر التربيعي للتباين، ويُعرَف بأنه الجذر التربيعي لمتوسط مربعات انحرافات القيم عن متوسطها الحسابي.
خصائص الانحراف المعياري Standard Deviation Characteristics:
1- يعَد من أهم مقاييس التشتت وأكثرها استخدامًا.
2- التحويلات الخطية تؤثر فيه.
3- يعتمد على المشاهدات كافة في حسابه.
4- نلاحظ في التوزيعات التي تقترب من التوزيع الطبيعي أن:
- h.27 من البيانات تقع عن المتوسط في مدى انحراف معياري.
- �.45 من البيانات تقع عن المتوسط في مدى انحرافين معياريين.
- �.73 من البيانات تقع عن المتوسط في مدى ثلاثة انحرافات معيارية.
5- معامل الاختلاف Coefficient Variation (CV):
إن معامل الاختلاف يعطي نسبة الانحراف المعياري وغيره من مقاييس التشتت لمقارنة تشتت البيانات بين عدة مجموعات من البيانات.
يعبِّر معامل الاختلاف عن النسبة ما بين الانحراف المعياري إلى الوسط الحسابي، ولأن معامل الاختلاف من المقاييس الخاصة بقياس التغير النسبي في صورة نسبة مئوية، فإننا يمكِننا أن نستخدم معامل التغير من أجل أن نقارن التشتت الموجود في مجموعات من البيانات، حتى في حالة اختلاف وحدات القياس الخاصة بتلك المجموعات.
معامل الاختلاف = (الانحراف المعياري/ الوسط الحسابي) * .0
كلما ازداد معامل التغير كان ذلك دليلًا على وجود اختلاف وتباين بين المشاهدات.