الاختبار أو الامتحان (بشكل غير رسمي أو امتحان أو تقييم) هو تقييم يهدف إلى قياس معرفة أو مهارة أو مهارة أو كفاءة أو لياقة بدنية أو تصنيف للمتقدم للاختبار في العديد من الموضوعات الأخرى (مثل المعتقدات). يمكن إجراء الاختبار شفهيًا أو على الورق أو على جهاز كمبيوتر أو في منطقة محددة مسبقًا تتطلب إجراء اختبار لإثبات أو تنفيذ مجموعة من المهارات. اختبارات تختلف في الاسلوب والدقة والمتطلبات. على سبيل المثال ، في اختبار كتاب مغلق ، عادة ما يُطلب من المتقدم للاختبار الاعتماد على الذاكرة للرد على عناصر محددة بينما في اختبار الكتاب المفتوح ، قد يستخدم المتقدم للاختبار أداة إضافية أو أكثر مثل كتاب مرجعي أو آلة حاسبة عند الرد . يمكن إجراء الاختبار بشكل رسمي أو غير رسمي. مثال على اختبار غير رسمي هو اختبار قراءة يديره أحد الوالدين لطفل. قد يكون الاختبار الرسمي اختبارًا نهائيًا يديره مدرس في فصل دراسي أو اختبار ذكاء يديره طبيب نفساني في عيادة. غالبًا ما يؤدي الاختبار الرسمي إلى درجة أو درجة اختبار. يمكن تفسير نتيجة الاختبار فيما يتعلق بقاعدة أو معيار ، أو في بعض الأحيان على حد سواء. يمكن وضع القاعدة بشكل مستقل ، أو عن طريق التحليل الإحصائي لعدد كبير من المشاركين. يهدف الاختبار إلى اختبار معرفة الشخص أو استعداده لإعطاء الوقت للتلاعب بهذا الموضوع.
الاختبار المعياري هو أي اختبار يُدار ويُحرز بطريقة متسقة لضمان الدفاع القانوني. غالبًا ما تستخدم الاختبارات المعيارية في التعليم ، والشهادة المهنية ، وعلم النفس (على سبيل المثال ، MMPI) ، والجيش ، والعديد من المجالات الأخرى.
عادة ما يكون الاختبار غير المعياري مرنًا في النطاق والشكل ، ومتغيرًا في الصعوبة والأهمية. نظرًا لأن هذه الاختبارات عادةً ما يتم تطويرها بواسطة مدربين فرديين ، فقد لا يتم اعتماد تنسيق هذه الاختبارات وصعوبةها على نطاق واسع أو استخدامها من قبل مدربين أو مؤسسات أخرى. يمكن استخدام اختبار غير قياسي لتحديد مستوى الكفاءة للطلاب ، وتحفيز الطلاب على الدراسة ، وتقديم التغذية الراجعة للطلاب. في بعض الحالات ، قد يقوم المعلم بتطوير اختبارات غير قياسية تشبه الاختبارات الموحدة في النطاق والشكل والصعوبة لغرض إعداد طلابهم لاختبار قياسي قادم. وأخيرًا ، فإن التواتر والإعداد الذي يتم من خلالهما إجراء الاختبارات غير المعيارية متغيران إلى حد كبير وعادة ما يتم تقييدهما بمدة فترة الفصل. قد يقوم مدرس الفصل ، على سبيل المثال ، إجراء اختبار أسبوعيًا أو مرتين فقط في الفصل الدراسي. اعتمادًا على سياسة المعلم أو المؤسسة ، قد تستمر مدة كل اختبار لمدة خمس دقائق فقط إلى فترة الفصل بأكملها.
على النقيض من الاختبارات غير الموحدة ، يتم استخدام الاختبارات الموحدة على نطاق واسع ، ويتم إصلاحها من حيث النطاق والصعوبة والشكل ، وعادة ما تكون مهمة في العواقب. عادةً ما يتم إجراء الاختبارات الموحدة في تواريخ ثابتة على النحو الذي يحدده مطور الاختبار أو المؤسسة التعليمية أو الهيئة الإدارية ، والتي قد يديرها المعلم أو لا يديرها ، أو تعقد داخل الفصل الدراسي ، أو مقيدة بفترة الفصل الدراسي. على الرغم من أن هناك القليل من التباين بين النسخ المختلفة من نفس النوع من الاختبار المعياري (على سبيل المثال ، SAT أو GRE) ، فهناك اختلاف بين الأنواع المختلفة من الاختبارات المعيارية.
يشار إلى أي اختبار له عواقب مهمة بالنسبة للمتقدم للاختبار الفردي على أنه اختبار عالي المخاطر.
يمكن تطوير الاختبار وإدارته من قبل مدرب أو طبيب أو مجلس إدارة أو مقدم اختبار. في بعض الحالات ، قد لا يكون مطور الاختبار مسؤولًا بشكل مباشر عن إدارته. على سبيل المثال ، تقوم خدمة الاختبارات التعليمية (ETS) ، وهي منظمة غير ربحية للاختبار والتقييم التربوي ، بتطوير اختبارات قياسية مثل اختبار SAT ولكن قد لا تشارك بشكل مباشر في إدارة هذه الاختبارات أو مراقبتها. كما هو الحال مع تطوير وإدارة الاختبارات التعليمية ، فإن شكل ومستوى صعوبة الاختبارات نفسها متغيران إلى حد كبير ولا يوجد إجماع عام أو معيار ثابت لأشكال وصعوبة الاختبار. في كثير من الأحيان ، يعتمد شكل وصعوبة الاختبار على الفلسفة التربوية للمعلم ، والموضوع ، وحجم الفصل ، وسياسة المؤسسة التعليمية ، ومتطلبات الاعتماد أو الهيئات الإدارية. بشكل عام ، الاختبارات التي تم تطويرها وإدارتها من قبل مدربين فرديين غير قياسية بينما الاختبارات التي طورتها منظمات الاختبار موحدة.
التاريخ
التاريخ المبكر
كانت الصين القديمة أول دولة في العالم تنفذ اختبارًا موحدًا على مستوى الدولة ، والذي كان يسمى الامتحان الإمبراطوري. كان الغرض الرئيسي من هذا الاختبار هو اختيار المرشحين القادرين لمناصب حكومية محددة. تم إنشاء الامتحان الإمبراطوري من قبل سلالة Sui في عام 605 بعد الميلاد ، وتم إلغاؤه لاحقًا من قبل أسرة تشينغ بعد 1300 عام في عام 1905. وقد اعتمدت إنجلترا نظام الامتحان هذا في عام 1806 لاختيار مرشحين محددين لمناصب في الخدمة المدنية لصاحبة الجلالة ، على غرار الصينيين فحص إمبراطوري. تم تطبيق نظام الفحص هذا فيما بعد على التعليم وبدأ في التأثير على أجزاء أخرى من العالم حيث أصبح معيارًا بارزًا (مثل اللوائح لمنع العلامات من معرفة هوية المرشحين) ، لتقديم اختبارات موحدة.
العصر الحديث
الخدمة المدنية
مع انتقال المهنة إلى نظام التعليم الجماعي الحديث ، أصبح أسلوب الامتحان ثابتًا ، مع الضغط على الأوراق المعيارية التي سيجلس عليها عدد كبير من الطلاب. قادت الطريق في هذا الصدد الخدمة المدنية المزدهرة التي بدأت في التحرك نحو أساس جدير بالاختيار في منتصف القرن التاسع عشر في إنجلترا.
تأثرت الخدمة المدنية البريطانية بنظام الامتحانات الامبراطورية ونظام الجدارة في الصين. جادل توماس تايلور ميدوز ، قنصل بريطانيا في قوانغتشو ، الصين في مذكراته desultory عن حكومة وشعب الصين ، المنشورة في عام 1847 ، أن "" طول فترة الإمبراطورية الصينية يرجع فقط وبشكل كلي إلى الحكومة الجيدة التي تتكون في تقدم الرجال الموهوبين والجدارة فقط ، "" وأنه يجب على البريطانيين إصلاح خدمتهم المدنية بجعل المؤسسة جديرة بالثقة.
في وقت مبكر من عام 1806 ، أنشأت شركة الهند الشرقية شركة كلية بالقرب من لندن لتدريب وفحص مديري أراضي الشركة في الهند. تم إدخال امتحانات الخدمة المدنية الهندية - وهو مصطلح صاغته الشركة - في عام 1829.
في عام 1853 ، قام وزير الخزانة ويليام جلادستون بتكليف السير ستافورد نورثكوت وتشارلز تريفيليان للنظر في تشغيل وتنظيم الخدمة المدنية. تأثرًا بالامتحان الإمبراطوري الصيني القديم ، قدم تقرير Northcote-Trevelyan لعام 1854 أربع توصيات رئيسية: يجب أن يكون التوظيف على أساس الجدارة المحدد من خلال الفحص الكتابي الموحد ، وأن المرشحين يجب أن يكون لديهم تعليم عام قوي لتمكين النقل بين الأقسام ، أن المجندين يجب أن يتم تصنيفهم إلى تسلسل هرمي وأن الترقية يجب أن تتم من خلال الإنجاز ، بدلاً من "التفضيل أو المحسوبية أو الشراء". كما تم إنشاء لجنة الخدمة المدنية في عام 1855 للإشراف على التوظيف المفتوح وإنهاء المحسوبية ، وتم تنفيذ معظم توصيات Northcote-Trevelyan الأخرى على مدى بضع سنوات.
ظل نموذج Northcote-Trevelyan للفحص الجدي مستقراً بشكل أساسي لمائة عام. كان هذا تكريما لنجاحها في القضاء على الفساد ، وتقديم الخدمات العامة (حتى تحت ضغط حربين عالميتين) ، والاستجابة بفعالية للتغيير السياسي. كما كان لها تأثير دولي كبير وتم تكييفها من قبل أعضاء الكومنولث. أنشأ قانون بندلتون لإصلاح الخدمة المدنية نظامًا مشابهًا في الولايات المتحدة.
التعليم
الامتحانات الكتابية لم يسمع بها من قبل 1702 للتعليم الأوروبي. "" تم وصف الامتحانات الصينية مرارًا وتكرارًا في الأدب الغربي عن الصين في القرنين السابع عشر والثامن عشر ". في الولايات المتحدة ، حدث الانتقال تحت تأثير المصلح التربوي هوراس مان. ساعد هذا التحول بشكل حاسم على نقل التعليم إلى العصر الحديث ، من خلال توحيد معايير المناهج في العلوم والعلوم الإنسانية ، وخلق طريقة منطقية لتقييم المعلمين والمؤسسات وخلق أساس لتدفق الطلاب وفقًا لقدراتهم.
أثبتت الحرب العالمية الأولى والحرب العالمية الثانية ضرورة الاختبار الموحد والفوائد المرتبطة بهذه الاختبارات. تم استخدام الاختبارات لتحديد الكفاءة العقلية للمجندين في الجيش. استخدم الجيش الأمريكي مقياس ستانفورد-بينيه للمخابرات لاختبار معدل الذكاء للجنود.
بعد الحرب ، بدأت الصناعة في استخدام الاختبارات لتقييم المتقدمين للوظائف المختلفة بناءً على الأداء. في عام 1952 ، تم إجراء أول اختبار تحديد المستوى المتقدم (AP) لبدء سد الفجوة بين المدارس الثانوية والكليات.
الاستخدام الحديث
التعليم
تتطلب بعض البلدان مثل المملكة المتحدة وفرنسا من جميع طلاب المدارس الثانوية إجراء اختبار موحد على المواد الفردية مثل الشهادة العامة للتعليم الثانوي (GCSE) (في إنجلترا) و Baccalauréat على التوالي كشرط للتخرج. تُستخدم هذه الاختبارات بشكل أساسي لتقييم كفاءة الطالب في موضوعات محددة مثل الرياضيات أو العلوم أو الأدب. في المقابل ، قد لا يُطلب من طلاب المدارس الثانوية في دول أخرى مثل الولايات المتحدة الخضوع لاختبار معياري للتخرج. علاوة على ذلك ، عادةً ما يخضع الطلاب في هذه البلدان لاختبارات موحدة فقط للتقدم لوظيفة في برنامج جامعي ويتم إعطاؤهم عادةً خيار إجراء اختبارات موحدة مختلفة مثل ACT أو SAT ، والتي تُستخدم بشكل أساسي لقياس مهارة التفكير لدى الطالب. يمكن أيضًا لطلاب المدارس الثانوية في الولايات المتحدة الخضوع لاختبارات تحديد المستوى المتقدم لمواضيع محددة لتحقيق الائتمان على مستوى الجامعة. اعتمادًا على سياسات صانع الاختبار أو البلد ، يمكن إجراء الاختبارات المعيارية في قاعة كبيرة أو غرفة صف أو مركز اختبار. قد يتواجد المراقب أو المراقب أثناء فترة الاختبار لتقديم التعليمات أو للإجابة على الأسئلة أو لمنع الغش.
يمكن للجامعات أيضًا استخدام الدرجات أو درجات الاختبار من الاختبار القياسي لتحديد ما إذا كان يجب قبول الطالب في أحد برامجها الأكاديمية أو المهنية. على سبيل المثال ، تقبل الجامعات في المملكة المتحدة المتقدمين في برامجهم الجامعية بناءً بشكل أساسي أو حصريًا على درجات المتقدم في مؤهلات ما قبل الجامعة مثل مستويات GCE A أو Cambridge Pre-U. في المقابل ، تستخدم الجامعات في الولايات المتحدة درجة اختبار مقدم الطلب في اختبار SAT أو ACT كواحد فقط من معايير القبول العديدة لتحديد ما إذا كان يجب قبول مقدم الطلب في أحد برامجها الجامعية. قد تشمل المعايير الأخرى في هذه الحالة درجات المتقدم من المدرسة الثانوية والأنشطة اللامنهجية والبيان الشخصي وخطابات التوصيات. اعترف مرة واحدة ،
تستخدم دول معينة الاختبارات المعيارية أحيانًا لإدارة جودة مؤسساتها التعليمية. على سبيل المثال ، يتطلب قانون عدم ترك أي طفل في الولايات المتحدة من الولايات الفردية تطوير تقييمات للطلاب في درجات معينة. من الناحية العملية ، تظهر هذه التقييمات بشكل نموذجي في شكل اختبارات موحدة. يتم بعد ذلك استخدام درجات اختبار الطلاب في درجات معينة من مؤسسة تعليمية لتحديد حالة تلك المؤسسة التعليمية ، أي ما إذا كان ينبغي السماح لها بمواصلة العمل بنفس الطريقة أو تلقي التمويل.
أخيرًا ، تُستخدم الاختبارات المعيارية في بعض الأحيان لمقارنة كفاءات الطلاب من مؤسسات أو دول مختلفة. على سبيل المثال ، تستخدم منظمة التعاون الاقتصادي والتنمية (OECD) برنامج تقييم الطلاب الدوليين (PISA) لتقييم مهارات ومعارف معينة للطلاب من مختلف البلدان المشاركة.
الترخيص والتصديق
تستخدم هيئات معيّنة الاختبارات المعيارية في بعض الأحيان لتحديد ما إذا كان يسمح للمتقدم للاختبار بممارسة مهنة ما ، أو استخدام مسمى وظيفي معين ، أو المطالبة بالكفاءة في مجموعة معينة من المهارات. على سبيل المثال ، عادة ما يُطلب من المتقدم للوظيفة المتقدم للاختبار الذي ينوي أن يصبح محامياً أن ينجح في امتحان نقابة المحامين.
الهجرة والتجنس
تُستخدم الاختبارات المعيارية أيضًا في بعض البلدان لتنظيم الهجرة. على سبيل المثال ، يُطلب من المهاجرين المقصودين إلى أستراليا قانونًا اجتياز اختبار المواطنة كجزء من عملية التجنس في ذلك البلد.
اختبار اللغة في عملية التجنس
عند تحليلها في سياق الرسائل النصية في عمليات التجنيس ، يمكن العثور على الأيديولوجية من نقطتين متميزتين لكن قريبتين تقريبًا. يشير الأول إلى بناء وتفكيك العناصر المكونة للأمة التي تصنع هويتها الخاصة ، في حين أن الثاني لديه وجهة نظر أكثر تقييدًا لمفهوم لغة وإيديولوجيات محددة قد تخدم في غرض محدد.
حاصل الذكاء
مسابقات
تُستخدم الاختبارات أحيانًا كأداة للاختيار للمشاركين الذين لديهم إمكانية النجاح في مسابقة مثل حدث رياضي. على سبيل المثال ، يجب على المتزلجين الجديين الذين يرغبون في المشاركة في مسابقات التزلج على الجليد في الولايات المتحدة اجتياز اختبارات التزلج على الجليد الأمريكية الرسمية للتأهل فقط.
أعضاء المجموعة
تستخدم المجموعة أحيانًا الاختبارات لتحديد أنواع معينة من الأفراد للانضمام إلى المجموعة. على سبيل المثال ، تعد Mensa International مجتمعًا عالي الذكاء يتطلب من الأفراد أن يسجلوا عند النسبة المئوية 98 أو أعلى في اختبار معدل الذكاء القياسي الخاضع للإشراف.
أنواع
تشمل أنواع التقييم:
- التقييمات التكوينية هي اختبارات رسمية وغير رسمية يتم إجراؤها أثناء عملية التعلم. تعدل هذه التقييمات أنشطة التعلم اللاحقة ، لتحسين تحصيل الطلاب. إنها تحدد نقاط القوة والضعف وتساعد في استهداف المناطق التي تحتاج إلى عمل.
- تقوم التقييمات الإجمالية بتقييم الكفاءة في نهاية الوحدة التعليمية. تسمح الاختبارات النهائية للمقيّمين بتحديد ما إذا كان المرشح قد استوعب المعرفة أو المهارات للمعيار المطلوب.
- تقارن الاختبارات ذات المرجع المعياري أداء الطالب مقابل مجموعة "وطنية" وطنية أو أخرى.
- تتطلب التقييمات القائمة على الأداء من الطلاب حل مشكلات العالم الحقيقي أو إنتاج شيء باستخدام تطبيق العالم الحقيقي. تسمح هذه التقييمات للمعلم بتمييز مدى تفكير الطلاب النقدي والتحليلي.
- التقييم الأصيل هو قياس الإنجازات التي تستحق مقارنةً بالاختبارات المعيارية متعددة الخيارات.
- تم تصميم الاختبارات المرجعية بمعيار لقياس أداء الطلاب مقابل مجموعة ثابتة من المعايير أو معايير التعلم.
نماذج التقييم
اختبارات مكتوبة
الاختبارات الكتابية هي الاختبارات التي تتم على الورق أو على جهاز الكمبيوتر (ك eExam). يمكن للمتقدم للاختبار الذي يأخذ اختبارًا مكتوبًا الرد على عناصر محددة عن طريق الكتابة أو الكتابة ضمن مساحة معينة من الاختبار أو في نموذج أو مستند منفصل.
في بعض الاختبارات ؛ حيث يلزم معرفة العديد من الثوابت أو المصطلحات التقنية للإجابة على الأسئلة بشكل فعال ، مثل الكيمياء أو علم الأحياء - قد يسمح مطور الاختبار لكل متقدم للاختبار بجلب ورقة غش معهم.
عادةً ما يكون اختيار مطور الاختبار للنمط أو التنسيق الذي يجب استخدامه عند تطوير اختبار كتابي أمرًا تعسفيًا نظرًا لعدم وجود معيار ثابت واحد للاختبار. ومع ذلك ، فقد أصبحت بعض أنماط وشكل الاختبار مستخدمة على نطاق واسع أكثر من غيرها. فيما يلي قائمة بتنسيقات عناصر الاختبار التي يتم استخدامها على نطاق واسع من قبل المعلمين ومطوري الاختبار لإنشاء اختبارات الورق أو الكمبيوتر. ونتيجة لذلك ، قد تتكون هذه الاختبارات من نوع واحد فقط من تنسيق عنصر الاختبار (على سبيل المثال ، اختبار الاختيار من متعدد ، اختبار مقال) أو قد تحتوي على مجموعة من تنسيقات عناصر الاختبار المختلفة (على سبيل المثال ، الاختبار الذي يحتوي على عناصر الاختيار من متعدد والمواد)
متعدد الخيارات
في الاختبار الذي يحتوي على عناصر تم تنسيقها على أنها أسئلة متعددة الخيارات ، سيحصل المرشح على عدد من الإجابات المحددة لكل سؤال ، ويجب على المرشح اختيار الإجابة أو مجموعة الإجابات الصحيحة. هناك مجموعتان من الأسئلة متعددة الخيارات. تُعرف الأسرة الأولى باسم السؤال الصواب / الخطأ ويتطلب من المتقدم للاختبار اختيار جميع الإجابات المناسبة. تُعرف الأسرة الثانية باسم سؤال واحد من أفضل الإجابات ويتطلب من المتقدم للاختبار الإجابة على واحد فقط من قائمة الإجابات.
هناك عدة أسباب لاستخدام أسئلة الاختيار من متعدد في الاختبارات. فيما يتعلق بالإدارة ، تتطلب أسئلة الاختيار من متعدد عادةً وقتًا أقل للإجابة على المتقدمين للاختبار ، ويسهل تسجيلهم وتقييمهم ، وتوفير تغطية أكبر للمواد ، ويسمح بمجموعة كبيرة من الصعوبة ، ويمكن بسهولة تشخيص صعوبة اختبار المتقدم بمفاهيم معينة . كأداة تعليمية ، تختبر عناصر الاختيار من متعدد مستويات متعددة من التعلم بالإضافة إلى قدرة المتقدم للاختبار على دمج المعلومات ، كما أنها توفر ملاحظات للمتقدم للاختبار حول سبب خطأ المشتتات ولماذا كانت الإجابات الصحيحة صحيحة. ومع ذلك ، هناك صعوبات مرتبطة باستخدام أسئلة الاختيار من متعدد. من الناحية الإدارية ، عادةً ما تستغرق العناصر متعددة الاختيارات الفعالة وقتًا طويلاً في البناء. كأداة تعليمية ، لا تسمح عناصر الاختيار من متعدد للمتقدمين للاختبار بإثبات المعرفة بخلاف الاختيارات المتاحة وقد تشجع حتى التخمين أو التقريب بسبب وجود إجابة صحيحة واحدة على الأقل. على سبيل المثال ، قد لا يعمل المتقدم للاختبار بشكل صريح
، سيختارون إجابة قريبة من 48. علاوة على ذلك ، قد يخطئ المتقدمون في الاختبار في تفسير هذه العناصر وفي هذه العملية ، يدركون أن هذه العناصر صعبة أو صعبة الإرضاء. أخيرًا ، لا تختبر عناصر الاختيار من متعدد مواقف متقدم الاختبار تجاه التعلم لأنه يمكن تزوير الاستجابات الصحيحة بسهولة.
استجابة بديلة
تقدم أسئلة الصواب / الخطأ خيارًا ثنائيًا للمرشحين - العبارة إما صحيحة أو خاطئة. تعرض هذه الطريقة مشكلات ، حيث أنه اعتمادًا على عدد الأسئلة ، يمكن أن يحصل عدد كبير من المرشحين على 100٪ فقط عن طريق التخمين ، وينبغي أن يحصل في المتوسط على 50٪.
نوع المطابقة
العنصر المطابق هو عنصر يوفر مصطلحًا محددًا ويتطلب إجراء اختبار لمطابقة الخصائص المحددة مع المصطلح الصحيح.
نوع الإكمال
يوفر عنصر ملء الفراغ للمتقدم للاختبار خصائص مميزة ويتطلب من المتقدم للاختبار استدعاء المصطلح الصحيح. هناك نوعان من اختبارات ملء الفراغات. يوفر الإصدار الأسهل مجموعة كلمات تحتوي على كلمات محتملة ستملأ الفراغات. بالنسبة لبعض الاختبارات ، يتم استخدام جميع الكلمات في بنك الكلمات مرة واحدة بالضبط. إذا أراد المعلم إنشاء اختبار متوسط الصعوبة ، فسيقدم اختبارًا مع بنك الكلمات ، ولكن قد يتم استخدام بعض الكلمات أكثر من مرة والبعض الآخر على الإطلاق. أصعب تنوع في هذا الاختبار هو اختبار ملء الفراغ الذي لا يتم فيه توفير أي بنك كلمات على الإطلاق. يتطلب هذا بشكل عام مستوى أعلى من الفهم والذاكرة من اختبار الاختيار من متعدد. وبسبب هذا ، غالبًا ما يخشى الطلاب اختبارات ملء الفراغ [بدون بنك الكلمات].
مقال
تتطلب عناصر مثل إجابة قصيرة أو مقال عادةً متقدم اختبار لكتابة رد للوفاء بمتطلبات العنصر. من الناحية الإدارية ، تستغرق عناصر المقالة وقتًا أقل في البناء. كأداة تقييم ، يمكن لعناصر المقالة اختبار أهداف التعلم المعقدة وكذلك العمليات المستخدمة للإجابة على السؤال. يمكن أن توفر العناصر أيضًا مهمة أكثر واقعية وتعميمًا للاختبار. أخيرًا ، تجعل هذه العناصر من الصعب على المتقدمين للاختبار تخمين الإجابات الصحيحة ويطلبون من المتقدمين للاختبار إظهار مهاراتهم في الكتابة بالإضافة إلى التهجئة والنحو الصحيحين.
الصعوبات المتعلقة بعناصر المقالة هي في المقام الأول إدارية: على سبيل المثال ، يتطلب المتقدمون للاختبار وقتًا كافيًا لتكوين إجاباتهم. عندما يتم الرد على هذه الأسئلة ، عادة ما تكون الإجابات نفسها مكتوبة بشكل سيئ لأن المتقدمين للاختبار قد لا يكون لديهم الوقت لتنظيم وتصحيح إجاباتهم. في المقابل ، يستغرق تسجيل هذه العناصر أو تصنيفها وقتًا أطول. عندما يتم تسجيل هذه العناصر أو تقديرها ، تصبح عملية التقدير بحد ذاتها ذاتية حيث قد تؤثر المعلومات غير المتعلقة بالاختبار على العملية. وبالتالي ، هناك حاجة إلى جهد كبير لتقليل ذاتية عملية الدرجات. أخيرًا ، كأداة تقييم ، قد تكون الأسئلة المقالية غير موثوقة في تقييم المحتوى الكامل للموضوع.
تعتمد تعليمات المتقدمين للامتحان على استخدام كلمات الأمر التي توجه المفحوص للرد بطريقة معينة ، على سبيل المثال من خلال وصف أو تعريف مفهوم ، ومقارنة ومقارنة سيناريوهين أو حدثين أو أكثر. في المملكة المتحدة ، تحتفظ Ofqual بقائمة رسمية من كلمات القيادة التي توضح معناها.
الإختبارات
الاختبار عبارة عن تقييم موجز قد يغطي كمية صغيرة من المواد التي تم إعطاؤها في الفصل. يغطي بعضها محاضرتين إلى ثلاث محاضرات ألقيت في فترة من الأوقات كقسم قراءة أو تمرين معين حيث كان أهم جزء من الفصل هو التلخيص. ومع ذلك ، لا يحسب الاختبار البسيط عادةً كثيرًا ، ويقدم المدرسون عادةً هذا النوع من الاختبار كتقييم تكويني للمساعدة في تحديد ما إذا كان الطالب يتعلم المادة. بالإضافة إلى ذلك ، فإن القيام بذلك في الوقت الذي قام فيه المعلم بجمع كل شيء يمكن أن يشكل جزءًا مهمًا من درجة الدورة النهائية.
أسئلة رياضية
تستخدم معظم أسئلة الرياضيات ، أو أسئلة الحساب من مواضيع مثل الكيمياء أو الفيزياء أو الاقتصاد أسلوبًا لا يقع في أي من الفئات المذكورة أعلاه ، على الرغم من أن بعض الأوراق ، لا سيما أوراق تحدي الرياضيات في المملكة المتحدة تستخدم خيارات متعددة. بدلاً من ذلك ، تشير معظم أسئلة الرياضيات إلى مشكلة رياضية أو ممارسة تتطلب من الطالب كتابة رد حر. يتم إعطاء العلامات للخطوات التي تم اتخاذها أكثر من الإجابة الصحيحة. إذا كان السؤال يحتوي على أجزاء متعددة ، فقد تستخدم الأجزاء اللاحقة إجابات من الأقسام السابقة ، وقد يتم منح علامات إذا تم استخدام إجابة غير صحيحة في وقت سابق ولكن تم اتباع الطريقة الصحيحة ، وتم إرجاع إجابة صحيحة (نظرًا للإدخال غير الصحيح).
قد تتضمن الأوراق الرياضية ذات المستوى الأعلى اختلافات في الصواب / الخطأ ، حيث يتم إعطاء المرشح بيانًا ويطلب منه التحقق من صحته من خلال الإثبات المباشر أو ذكر مثال مضاد.
اختبارات الملاحظات المفتوحة
على الرغم من أنها ليست شائعة مثل اختبار الملاحظات المغلقة ، إلا أن اختبارات الملاحظات المفتوحة تزداد شعبية ببطء. يسمح اختبار الملاحظات المفتوحة للمتقدم للاختبار بإحضار جميع ملاحظاتهم واستخدامها أثناء إجراء الاختبار. عادةً ما تكون الأسئلة التي يتم طرحها في اختبارات الملاحظات المفتوحة أكثر استفزازًا وفكريًا من الأسئلة في اختبار الملاحظات المغلقة. بدلاً من اختبار الحقائق التي تعرفها ، تجبرك اختبارات الملاحظات المفتوحة على تطبيق الحقائق على سؤال أوسع. الفائدة الرئيسية التي يمكن رؤيتها من اختبارات الملاحظات المفتوحة هي أنها إعداد أفضل للعالم الحقيقي حيث لا يتعين عليك حفظه ولديك أي شيء تحتاجه تحت تصرفك.
اختبارات شفوية
الاختبار الشفوي هو اختبار يتم الرد عليه شفهيًا (شفهيًا). سيطرح المعلم أو مقيِّم الاختبار الشفوي سؤالًا شفهيًا على الطالب ، ثم يجيب عليه باستخدام الكلمات.
اختبارات اللياقة البدنية
اختبار اللياقة البدنية هو اختبار مصمم لقياس القوة البدنية والرشاقة والتحمل. يتم توظيفهم عادة في المؤسسات التعليمية كجزء من منهج التربية البدنية ، وفي الطب كجزء من الاختبارات التشخيصية ، وكمتطلبات الأهلية في المجالات التي تركز على القدرة البدنية مثل الجيش أو الشرطة. طوال القرن العشرين ، ظهرت أدلة علمية تثبت فائدة تدريب القوة والتمارين الهوائية في الحفاظ على الصحة العامة ، وبدأت المزيد من الوكالات في دمج اختبارات اللياقة البدنية الموحدة. في الولايات المتحدة ، تأسس مجلس الرئيس حول لياقة الشباب في عام 1956 كوسيلة لتشجيع ومراقبة اللياقة البدنية في أطفال المدارس.
تتضمن الاختبارات الشائعة الجري الموقوت أو اختبار اللياقة البدنية متعدد المراحل (المعروف باسم "" اختبار الصفارة "") ، وأعداد تمارين الضغط ، والبطن / تمارين البطن والعضلات التي يمكن للفرد إجراؤها. يمكن استخدام اختبارات أكثر تخصصًا لاختبار القدرة على أداء وظيفة أو دور معين. لدى العديد من الصالات الرياضية والمنظمات الخاصة ومنظمي الأحداث اختبارات اللياقة البدنية الخاصة بهم. باستخدام التقنيات العسكرية التي طورها الجيش البريطاني واختبار حديث مثل إلينوي أجيليتي ران واختبار كوبر.
كان توقيت التوقف عن المشاهدة هو المعيار حتى السنوات الأخيرة عندما ثبت أن توقيت اليد غير دقيق وغير متناسق. التوقيت الإلكتروني هو المعيار الجديد من أجل تعزيز الدقة والاتساق وتقليل التحيز.
اختبارات الأداء
اختبار الأداء هو تقييم يتطلب من الممتحن أداء مهمة أو نشاط فعليًا ، بدلاً من الإجابة على الأسئلة التي تشير إلى أجزاء محددة. والغرض من ذلك هو ضمان دقة أكبر لما يتم اختباره.
مثال على ذلك هو اختبار القيادة خلف عجلة القيادة للحصول على رخصة القيادة. بدلاً من الإجابة فقط على العناصر البسيطة متعددة الاختيارات فيما يتعلق بقيادة السيارة ، يُطلب من الطالب قيادة واحدة أثناء التقييم.
تُستخدم اختبارات الأداء بشكل شائع في مكان العمل والتطبيقات المهنية ، مثل الشهادات المهنية والترخيص. عند استخدامها لاختيار الموظفين ، يمكن الإشارة إلى الاختبارات كعينة عمل. على سبيل المثال ، سيطلب من خبراء التجميل إظهار قصة شعر أو مانيكير على شخص حي. اختبار Group-Bourdon هو واحد من عدد من الاختبارات النفسية التي يتعين على سائقي قطار المتدربين في المملكة المتحدة اجتيازها.
بعض اختبارات الأداء هي محاكاة. على سبيل المثال ، يشمل التقييم للحصول على شهادة كفني طب العيون مكونين ، فحص متعدد الخيارات ومحاكاة المهارات المحوسبة. يجب أن يثبت الممتحن القدرة على إتمام سبع مهام يتم إجراؤها بشكل شائع في الوظيفة ، مثل تنظير الشبكية ، والتي تتم محاكاتها على جهاز الكمبيوتر.
الاستعدادات
من منظور مطور الاختبار ، هناك تنوع كبير فيما يتعلق بالوقت والجهد اللازمين لإعداد الاختبار. وبالمثل ، من منظور المتقدم للاختبار ، هناك أيضًا تنوع كبير فيما يتعلق بالوقت والمطلوب للحصول على الدرجة أو الدرجة المطلوبة في أي اختبار معين. عندما يقوم مطور الاختبار بإنشاء اختبار ، يعتمد مقدار الوقت والجهد على أهمية الاختبار نفسه ، وإتقان المتقدم للاختبار ، وشكل الاختبار ، وحجم الفصل ، والموعد النهائي للاختبار ، وتجربة مطور الاختبار .
لقد تم دعم عملية بناء الاختبار بعدة طرق. أولاً ، كان العديد من مطوري الاختبارات هم أنفسهم طلابًا في وقت واحد ، وبالتالي يمكنهم تعديل الأسئلة أو اعتمادها من اختباراتهم السابقة. في بعض البلدان ، غالبًا ما يقدم ناشرو الكتب حزمًا تعليمية تتضمن بنوك اختبار لمدرسي الجامعات الذين يتبنون كتبهم المنشورة في دوراتهم. قد تحتوي بنوك الاختبار هذه على ما يصل إلى أربعة آلاف عينة من أسئلة الاختبار التي تمت مراجعتها من قِبل النظراء واختبار الوقت. سيتعين على المعلم الذي يختار استخدام بنك الاختبار هذا فقط تحديد عدد ثابت من أسئلة الاختبار من بنك الاختبار هذا لإنشاء اختبار.
كما هو الحال مع إنشاءات الاختبار ، يعتمد الوقت الذي يحتاجه متقدم الاختبار للتحضير للاختبار على تواتر الاختبار ومطور الاختبار وأهمية الاختبار. بشكل عام ، لا تتطلب الاختبارات غير المعيارية القصيرة والمتكررة والتي لا تشكل جزءًا رئيسيًا من الدرجة أو الدرجة الإجمالية للمتقدم للاختبار أن يقضي المتقدم وقتًا طويلاً في التحضير للاختبار. على العكس من ذلك ، تتطلب الاختبارات غير المعيارية الطويلة وغير النادرة والتي تشكل جزءًا كبيرًا من الدرجة أو الدرجة الإجمالية للمتقدم للاختبار عادةً ما يتطلب من المتقدمين للاختبار قضاء وقت طويل في التحضير للاختبار. للتحضير لاختبار غير قياسي ، قد يعتمد المتقدمون للاختبار على كتبهم المرجعية وملاحظات الصف أو المحاضرة والإنترنت والخبرة السابقة. قد يستخدم المتقدمون للاختبار أيضًا وسائل تعليمية مختلفة للدراسة لإجراء اختبارات مثل البطاقات التعليمية وعلم الإستذكار. يمكن للمتقدمين للاختبار حتى تعيين مدرسين لتدريبهم خلال العملية حتى يتمكنوا من زيادة احتمالية الحصول على درجة أو درجة اختبار مرغوبة. في دول مثل المملكة المتحدة ، ازداد الطلب على الرسوم الدراسية الخاصة بشكل ملحوظ في السنوات الأخيرة. أخيرًا ، قد يعتمد المتقدمون للاختبار على النسخ السابقة من اختبار السنوات السابقة أو الفصول الدراسية للدراسة للاختبار المستقبلي. يمكن تقديم هذه الاختبارات السابقة من قبل صديق أو مجموعة لديها نسخ من الاختبارات السابقة أو من قبل المدرسين ومؤسساتهم ، أو من قبل مقدم الاختبار (مثل لوحة الامتحان) نفسه. في دول مثل المملكة المتحدة ، ازداد الطلب على الرسوم الدراسية الخاصة بشكل ملحوظ في السنوات الأخيرة. أخيرًا ، قد يعتمد المتقدمون للاختبار على النسخ السابقة من اختبار السنوات السابقة أو الفصول الدراسية للدراسة للاختبار المستقبلي. يمكن تقديم هذه الاختبارات السابقة من قبل صديق أو مجموعة لديها نسخ من الاختبارات السابقة أو من قبل المدرسين ومؤسساتهم ، أو من قبل مقدم الاختبار (مثل لوحة الامتحان) نفسه. في دول مثل المملكة المتحدة ، ازداد الطلب على الرسوم الدراسية الخاصة بشكل ملحوظ في السنوات الأخيرة. أخيرًا ، قد يعتمد المتقدمون للاختبار على النسخ السابقة من اختبار السنوات السابقة أو الفصول الدراسية للدراسة للاختبار المستقبلي. قد يتم توفير هذه الاختبارات السابقة من قبل صديق أو مجموعة لديها نسخ من الاختبارات السابقة أو من قبل المدرسين ومؤسساتهم ، أو من قبل مقدم الاختبار (مثل لوحة الامتحان) نفسه.
على عكس الاختبار غير المعياري ، فإن الوقت الذي يحتاجه المتقدمون للاختبار للتحضير للاختبارات الموحدة أقل تغيرًا وعادة ما يكون كبيرًا. وذلك لأن الاختبارات المعيارية عادة ما تكون موحدة في النطاق والشكل والصعوبة وغالباً ما تكون لها عواقب مهمة فيما يتعلق بمستقبل المتقدم للاختبار مثل أهلية المتقدمين للاختبار لحضور برنامج جامعي معين أو الدخول في مهنة مرغوبة. ليس من غير المعتاد للمتقدمين للاختبار الاستعداد للاختبارات الموحدة من خلال الاعتماد على الكتب المتاحة تجاريًا التي توفر تغطية متعمقة للاختبار الموحد أو مجموعات الاختبارات السابقة (على سبيل المثال ، سلسلة 10 سنوات في سنغافورة). في العديد من البلدان ، حتى أن المتقدمين للاختبار يلتحقون بمراكز التحضير للاختبار أو المدارس المكشوفة التي توفر تعليمات مكثفة أو تكميلية للمتقدمين للاختبار لمساعدتهم على الاستعداد بشكل أفضل لاختبار معياري. في هونغ كونغ ، تم اقتراح أن المعلمين الذين يديرون مثل هذه المراكز هم من المشاهير في حد ذاتها. وقد أدى ذلك إلى أن يكون التعليم الخاص خيارًا مهنيًا شائعًا للخريجين الجدد في الاقتصادات المتقدمة. وأخيرًا ، لعب المعلمون ومؤسساتهم في بعض البلدان دورًا مهمًا أيضًا في إعداد المتقدمين للاختبار لاختبار معياري.
الغش
الغش في الاختبار هو عملية استخدام وسائل أو طرق غير مصرح بها لغرض الحصول على درجة أو درجة اختبار مرغوبة. قد يتراوح هذا من إحضار واستخدام الملاحظات أثناء فحص كتاب مغلق ، إلى نسخ إجابة متقدم اختبار آخر أو اختيار الإجابات أثناء اختبار فردي ، إلى إرسال وكيل مدفوع لإجراء الاختبار.
تم استخدام عدة طرق شائعة لمكافحة الغش. وهي تشمل استخدام العديد من المراقبين أو المحرضين خلال فترة الاختبار لرصد المتقدمين للاختبار. قد يقوم مطورو الاختبارات ببناء متغيرات متعددة من نفس الاختبار ليتم إدارتها إلى متقدمين مختلفين للاختبار في نفس الوقت ، أو كتابة اختبارات مع عدد قليل من الخيارات متعددة الخيارات ، استنادًا إلى النظرية التي يصعب تقليد الإجابات التي تعمل بشكل كامل. في بعض الحالات ، قد لا يقوم المدرسون أنفسهم بإجراء اختباراتهم الخاصة ولكنهم سيتركون المهمة إلى مدربين أو مراقبين آخرين ، مما قد يعني أن المراقبين لا يعرفون المرشحين ، وبالتالي قد يكون هناك حاجة إلى شكل من أشكال تحديد الهوية. طريقة أخرى هي أنه إذا أظهر الطالب العديد من الاختبارات الفاشلة عند مستويات ألوان معينة ، فيجب على الطلاب البدء مرة أخرى في العمل من خلال بناة مهارات إضافية ، في هذا المستوى ، يختار الطالب إسقاط مستوى اللون أو الحصول على مهارات أساسية مفقودة. لذلك ، إذا اجتاز الطالب العدد المطلوب من الاختبار بدون مستوى اللون ، فسيعمل الطالب على تلوين اسمه باسمها مخطط حائط كبير يوفر حالة الفصل بأكمله. أخيرًا ، قد يقارن المدرسون أو مقدمو الاختبارات إجابات الغشاشين المشتبه بهم في الاختبار بأنفسهم لتحديد ما إذا كان الغش قد حدث.
الدعم والنقد
على الرغم من استخدامها على نطاق واسع ، فقد استمرت صحة أو جودة أو استخدام الاختبارات ، خاصة الاختبارات المعيارية في التعليم ، مدعومة أو منتقدة على نطاق واسع. مثل الاختبارات نفسها ، غالبًا ما تكون دعامات وانتقادات الاختبارات متنوعة وقد تأتي من مجموعة متنوعة من المصادر مثل الآباء أو المتقدمين للاختبار أو المدرسين أو مجموعات الأعمال أو الجامعات أو هيئات المراقبة الحكومية.
غالبًا ما يقدم مؤيدو الاختبارات المعيارية في التعليم الأسباب التالية لتعزيز الاختبار في التعليم:
- التغذية الراجعة أو تشخيص أداء المتقدم للاختبار
- عادل وفعال
- يعزز المساءلة
- التنبؤ والاختيار
- يحسن الأداء
غالبًا ما يقدم منتقدو الاختبارات المعيارية في التعليم الأسباب التالية لمراجعة أو إزالة الاختبارات المعيارية في التعليم:
- يضيق شكل المناهج ويشجع التدريس للاختبار.
- جودة تنبؤية سيئة.
- تضخم درجات درجات الاختبار أو الدرجات.
- متحيز ثقافيا أو اجتماعيا واقتصاديا.
أنواع أخرى من الاختبارات والمصطلحات الأخرى ذات الصلة
- امتحان عادي: امتحان يتم إجراؤه أثناء الدورة المقابلة ؛
- امتحان الاكتفاء أو امتحان للحصول على الائتمان: امتحان يجب أن يؤخذ كوسيلة للحصول على الاعتمادات الرسمية من المؤسسة الأكاديمية ؛
- اختبار إعادة التحقق من الصحة أو امتحان التكافؤ: تقديم قيمة لامتحان سبق إجراؤه في مؤسسة أخرى ؛
- امتحان غير عادي: امتحان يتم بعد فترة الامتحانات العادية المقابلة للدورة.
تعليقات
إرسال تعليق