Effectiveness of A Training Program on Oral Performance Assessment: The Analysis of Tasks Using the Multifaceted Rasch Analysis

Document Type: Research Paper


Islamic Azad University, Zanjan Branch, Zanjan, Iran


The current popularity of second/foreign language oral performance assessment has led to a growing interest in tasks as a tool for assessing language learners’ oral abilities. However, most oral assessment studies so far have investigated tasks separately; therefore, any possible relationship among them has remained unexplored. Twenty English as a foreign language (EFL) teachers rated the oral performances produced by 200 EFL learners before and after a rater training program using description, narration, summarizing, role-play, and exposition tasks. The findings demonstrated the usefulness of multifaceted Rasch measurement (MFRM) in detecting rater effects and demonstrating the consistency and variability in rater behavior aiming to evaluate the quality of rating. The outcomes indicated that test difficulty identification is complex, difficult, and at the same time multidimensional. On the other hand test takers’ ability is a more determining factor in their score variation than other intervening variables. The outcomes displayed no relationship between task difficulty and raters’ interrater reliability measures. The findings suggest that tasks have various effects on oral performance assessment tests and most importantly, performance conditions in estimating the oral ability of test takers. Since various groups of raters have biases to different tasks in use, the findings indicated that training programs can reduce raters’ biases and increase their consistency measures. The findings imply that decision makers had better not be concerned about raters’ expertise in oral assessment, whereas they should establish better rater training programs for raters to increase assessment reliability.


Article Title [Persian]

برسی تاثیر برنامه ی آموزشی در سنجش مهارت گفتاری: تحلیل ارزیابی تسک ها با استفاده از مدل چند وجهی راش

Author [Persian]

  • هومن بیژنی
دانشگاه آزاد اسلامی واحد زنجان
Abstract [Persian]

محبوبیت فعلی سنجش مهارت گفتاری در زبان دوم و یا خارجی منجر به علافقه مندی فزاینده در استفاده از تسک ها بعنوان ابزاری در سنجش مهارت زبان آموزان شده است. اما در بیشتر نحقیقاتی که تاکنون انجام شده اند، تسک ها بصورت جداگانه مورد برسی قرار گرفته اند لذا هیچ برسی در راستای هر گونه رابطه ی ممکن میان آنها انجام نشده است. همچنین مفهوم سختی تسک ها و میزان رابطه ی آن با زیرفاکتور های فصاحت، صحت و پیچیدگی در شرایط متفاوت بطور کامل مورد برسی قرار نگرفته است. از طرف دیگر شواهد ناچیزی در مورد آنکه کدام یک از تسک ها برای تست شوندگان با سطح توانایی های متفاوت مناسب تر هستند وجود دارد. تعداد 20 مدرس زبان انگلیسی عملکرد زبان گفتاری تولید شده توسط 200 زبان آموز را در دو مرحله ی قبل و بعد از برنامه ی آموزشی مصححان مورد سنجش قرار دادند. نتایج نشان دهنده ی مفید بودن استفاده از روش چند وجهی راش در شناسایی میزان تاثیر مصححین در رابطه با هماهنگی و گوناگونی عملکرد ایشان در ارزیابی کیفیت سنجش است. نتایج همچنین نشان دهنده ی رابطه ی معنادار میان درک مصححین و میزان واقعی دشواری تسک ها در رابطه با ابعاد برنامه ریزی زبانی، چشم انداز و فوریت تسک بودند. این نتایج حاکی از آن بودند که تعیین میزان دشواری یک آزمون پروسه ای پیچیده، سخت و در عین حال چند بعدی است. نتایج همچنین هیچ رابطه ای میان میزان دشواری تسک ها و پایایی مصححین نشان ندادند. علاوه بر این، میزان درک تست شوندگان می تواند بعنوان یک فاکتور قابل اعتماد برای تعیین میزان دشواری تسک ها بکار رود. این تحقیق نشان داد که سنجش تسک های مهارت گفتاری مختص شرایط خاص می باشد که خود نشان دهنده ی این است که ماهیت ساختاری زبان گفتاری ثابت نیست. نهایتا، در سنجش مهارت گفتاری لحاظ کردن تاثیر ویژگیهای تسک ها و بخصوص شرایط اجرای آن تسک ها در سنجش مهارت گفتاری زبان آموزان مهم است.

Keywords [Persian]

  • سوگیری
  • پایایی مصححان
  • مقیاس چند بعدی
  • مدل چند وجهی راش
  • تسک های گفتاری
  • سختگیری/آسانگیری
