انواع اعتبار سنجی چیست؟ آن چیست؟ پاسخ این سوالات و سوالات دیگر را در مقاله خواهید یافت. اعتبار ذاتاً یک ویژگی واحد است که از یک سو شامل داده هایی در مورد اینکه آیا فناوری برای اندازه گیری آنچه که برای آن توسعه یافته است مناسب است یا خیر، و از سوی دیگر، اثربخشی، سودمندی عملی و کارایی آن چیست. بررسی اعتبار یک فناوری را اعتبار سنجی می نامند. ما آن را با جزئیات بیشتر در زیر بررسی خواهیم کرد.
بازدید
بسیاری از مردم می پرسند: "اعتبار چیست؟" می گویند ذهن تصفیه شده حد و مرزی ندارد. به نظر می رسد روش شناسان با یکدیگر رقابت می کنند که چه کسی انواع و اقسام اعتبار بیشتری را کشف یا ابداع خواهد کرد. چیزی که اخیراً فقط نامی بر زبان نیامده است! معلوم است وجود دارد:
- روایی خارجی و داخلی؛
- همگرا؛
- متمیز;
- بدیهی؛
- factorial;
- پیش بینی;
- سازنده;
- معیار;
- معنادار و غیره.
هیچ راهی برای درک، و حتی بیشتر از آن برای تشخیص معقول یک تغییر از دیگری وجود ندارد. سردرگمی در تعاریف و طبقه بندی ها منجر به این واقعیت می شود که نویسندگان مختلف روش های کاملاً متفاوتی برای بهبود آن را به یک شکل اعتبار نسبت می دهند.
معیارهای خارجی
برای انجام اعتبارسنجی عملی روش، یعنی برای ارزیابی اهمیت عملی، اثربخشی، کارایی آن، معمولاً از یک معیار مستقل خارجی استفاده می شود - شاخصی برای نشان دادن کیفیت مورد مطالعه در زندگی روزمره. چنین معیاری می تواند دستاوردهای تولیدی (برای فناوری های گرایش حرفه ای) و عملکرد تحصیلی (برای آزمون های هوش، دستاوردها یا توانایی های یادگیری) و اثربخشی فعالیت های واقعی - مدل سازی، ترسیم و غیره (برای آزمون های مهارتهای ویژه)، ارزیابیهای شخصی (برای تأیید هویت).
انواع معیارهای اعتبارسنجی خارجی به شرح زیر است:
- اندازهگیریهای عملکرد (اینها ممکن است شامل میزان کار اجرا شده، زمان صرف شده برای آموزش، عملکرد تحصیلی، نرخ رشد مدارک و موارد مشابه باشد)؛
- علائم فیزیولوژیکی (در هنگام مطالعه تأثیر محیط و سایر متغیرهای موقعیتی بر روان و بدن انسان استفاده می شود)؛
- فشار خون، ضربان نبض، علائم خستگی، مقاومت الکتریکی پوست و غیره اندازه گیری می شود.بعدی;
- معیارهای ذهنی (شامل انواع مختلفی از پاسخ هایی است که منعکس کننده نگرش فرد نسبت به کسی یا چیزی، دیدگاه ها، نظرات، ترجیحات او است؛ به عنوان یک قاعده، چنین معیارهایی با استفاده از پرسشنامه، پرسشنامه، مصاحبه به دست می آیند)؛
- علائم حوادث (در مواردی استفاده می شود که هدف مطالعه به عنوان مثال به مشکل انتخاب افراد برای کار مربوط می شود که کمتر در معرض تصادف هستند).
روایی تجربی. در مورد چیست؟
تعداد کمی از مردم می دانند اعتبار تجربی چیست. در مورد اعتبار محتوا، آزمون توسط کارشناسان (تعیین انطباق وظایف آزمون با محتوای موضوع اندازه گیری) ارزیابی می شود. و تجربی همیشه با استفاده از همبستگی آماری اندازهگیری میشود: همبستگی دو نوع مقدار محاسبه میشود - نمرات آزمون و شاخصها برای یک پارامتر خارجی که به عنوان معیار قابلیت اطمینان انتخاب شده است.
سازنده
همه انواع روش های اعتبار سنجی را نمی دانند. روایی سازه چیست؟ این به خود ساختار نظری مربوط می شود و شامل جستجوی عواملی است که رفتار عملکرد آزمون را توضیح می دهد.
به عنوان یک نوع خاص، اعتبار سازه در مقاله ای توسط میل و کرونباخ (1955) مشروعیت یافته است. با استفاده از این شکل از اعتبار، نویسندگان تمام نظرسنجیهای آزمایشی را که مستقیماً با هدف پیشبینی برخی معیارهای مهم نبودند، ارزیابی کردند. این تحقیق حاوی اطلاعاتی در مورد سازه های روانشناختی بود.
اعتبار محتوا
تو هنوزشما می پرسید: "تأیید - آن چیست." اعتبار محتوا را در نظر بگیرید. این مستلزم آن است که هر مشکل، سؤال یا تکلیف متعلق به یک منطقه خاص شانس یکسانی برای تبدیل شدن به یک مورد آزمایشی داشته باشد.
Content Validity تناسب موجودیت آزمایشی را برای ناحیه اندازه گیری شده رفتار ارزیابی می کند. راستیآزماییهای ایجاد شده توسط دو گروه از توسعهدهندگان بر روی نمونهای از کسانی که بررسی میشوند انجام میشود. پایایی آزمون ها با تقسیم سؤالات به دو منطقه محاسبه می شود و در نتیجه شاخص اعتبار محتوا به دست می آید.
پیش بینی
ما همچنان به بررسی روش های اعتبار سنجی ادامه می دهیم. اعتبار پیش بینی نیز با یک معیار خارجی و نسبتاً قابل اعتماد ایجاد می شود. اما اطلاعات مربوط به او مدتی پس از تأیید جمعآوری میشود.
معیار خارجی معمولاً حرفه یک فرد است که در هر ارزیابی نشان داده می شود، برای نوع شغلی که او بر اساس نتایج آزمایشات تشخیصی برای آن انتخاب شده است.
اگرچه این روش برای کار ابزارهای تشخیصی - پیش بینی موفقیت آینده - بسیار مناسب است، اما اعمال آن بسیار دشوار است. دقت پیش بینی به طور معکوس به زمان تعیین شده برای چنین پیش بینی بستگی دارد. هر چه زمان بیشتری پس از اندازه گیری بگذرد، هنگام ارزیابی ارزش پیش بینی فناوری باید عوامل بیشتری را در نظر گرفت. با این حال، تقریباً غیرممکن است که همه عواملی را که بر پیشبینی تأثیر میگذارند در نظر بگیریم.
گذشته نگر
موافقم، اعتبارسنجی فرآیندی بسیار پیچیده است. مشخص است که اعتبار گذشته نگر بر اساس این معیار آشکار می شود،منعکس کننده وضعیت یک کیفیت یا رویداد در گذشته. می توان از آن برای به دست آوردن فوری منابع فناوری پیش بینی استفاده کرد. بنابراین، به منظور بازنگری در میزان مطابقت نتایج خوب یک آزمون مهارت با یادگیری سریع، می توان نظرات کارشناسان قبلی، ارزیابی عملکرد و موارد دیگر را در افرادی با شاخص های تشخیصی پایین و بالا در حال حاضر مقایسه کرد..
متمایز و همگرا
انواع اعتبار سنجی برای بسیاری جالب است. بیایید دریابیم که اعتبار تمایز و همگرا چیست. استراتژی وارد کردن آیتمهای تعیینشده در آزمون بستگی به این دارد که چگونه روانشناس ساختار تشخیصی را آشکار میکند. اگر آیزنک کیفیت «رواننژندی» را مستقل از درونگرایی-برونگرایی تعریف کند، این بدان معناست که پرسشنامه او باید به طور مساوی موقعیتهایی را نشان دهد که توسط برونگراها و درونگرایان روانرنجور تأیید میشود.
اگر در عمل معلوم شود که اقلام از ربع «درونگرایی- روان رنجورخویی» در کار غلبه دارند، از موضع نظریه آیزنک، این بدان معناست که شاخص « روان رنجورخویی» با یک شاخص نامربوط بار می شود. - "درونگرایی". یک اثر یکسان زمانی ظاهر می شود که یک سوگیری در نمونه وجود داشته باشد - اگر تعداد درونگراهای روان رنجور در آن بیشتر از همان برونگراها باشد.
برای جلوگیری از چنین پیچیدگیهایی، روانشناسان مایلند با موارد تجربی که فقط در مورد یک عامل اطلاعاتی را نشان میدهند، بپردازند. اما در واقع این الزام هرگز برآورده نمی شود: معلوم می شود که هر شاخص تجربی مشخص نمی شودفقط با عاملی که ما به آن نیاز داریم، بلکه توسط دیگران - بی ربط به مشکل اندازه گیری.
بنابراین، برای عواملی که از نظر مفهومی به عنوان متعامد با اندازه گیری شده تعریف می شوند (در همه ترکیب ها اتفاق می افتد)، ایجاد کننده آزمون موظف است هنگام انتخاب موارد، از استراتژی تعادل غیراصیل استفاده کند.
تطابق نقاط با شاخص اندازه گیری شده اعتبار همگرای آزمون را تضمین می کند. سازگاری اقلام با توجه به منابع نامربوط اعتبار متمایز را فراهم می کند. از نظر تجربی، خود را در غیاب همبستگی معنیدار با آزمون نشان میدهد که کیفیت مفهومی منحصربهفرد را اندازهگیری میکند.
کیت ابزار
در مجموعه کلی روشهای اعتبارسنجی، نویسندگان معمولاً عبارتند از:
- غیر رسمی (از ترفندهای ساده برای بررسی دقیق لیست گزینه های موجود در پرسشنامه تا روش های پیچیده تر برای تجزیه و تحلیل گام به گام نظری)؛
- رسمی، که شامل رویهها و فناوریهای آمار ریاضی است: آزمون فرضیههای آماری، محاسبه برآوردها، تحلیل همبستگی، ساخت فواصل اطمینان، ارزیابی روابط بین متغیرها، پراکندگی، فاکتوریل، رگرسیون و تحلیلهای ساختاری و غیره. در.
ایجاد ابزار
و با این حال، اعتبارسنجی چیست؟ ابزارهای اعتبار سنجی پیچیده ابتدا توسط روانشناسان ایجاد شد. در سال 1959، یک تکنیک خاص توسط D. Fiske و D. Campbell (ایالات متحده آمریکا) توسعه یافت. او برای انگلیسی کاملاً طبیعی بود، اما غیرقابل ترجمهزبان ما، نام: ماتریس چند روشی-چند لعنتی (MTMM). این ماتریس جدولی از همبستگی ها بود. این شامل دو اختراع بسیار جذاب بود که یکی از آنها برای آشکار کردن حقیقت همگرا بود و دیگری برای حقیقت متمایز.
نویسندگان آن استدلال کردند که هر کسی می تواند مقبولیت داخلی را ثابت کند اگر:
- مقادیر بین آنها که سطح بالایی از ارتباط نظری فرض می شود، سطح یکسانی را در تجربی (همگرایی) پیدا می کند؛
- مقادیری که از لحاظ نظری به هم مرتبط نیستند، پس از اجرای آزمون (تبعیض) از نظر تجربی نامرتبط هستند.
به طور کلی، روایی همگرا باید بیان کند که شباهت بین دو تیم از کارمندان، به عنوان مثال، کارگران ساختمانی و کارگران خط مونتاژ، از نظر شانس در بازار کار بسیار بیشتر از بین مالکان و کارمندان است. اگر رابطه مورد نظر نظری به صورت تجربی یافت شود، نمونه شما معتبر است.
روایی تمایز میزان شناسایی پدیده های مختلف را نشان می دهد. برای در نظر گرفتن مثال مشابهی از بازار کار، می توان انتظار داشت که یک نظریه به خوبی شکل گرفته می تواند به وسیله آن، بین فرصت های صاحبان و کارمندان در بازار کار تمایز قائل شود. شما نمی توانید آنها را اشتباه بگیرید، و نظریه شما می تواند آنها را از هم جدا کند.
اگر مقیاسی ایجاد کرده اید که توانایی های ریاضی را اندازه گیری می کند، در صورت اعتبار شاخص های همگرای استعدادهای ریاضی باید به خوبی با مهارت های عمومی یک فرد همبستگی داشته باشد، اگر در سطح نظری چنین رابطه ای وجود دارد.وجود دارد، و بد است - با تواناییهای زیباییشناختی که مستلزم استعدادهای کاملاً متفاوت از یک فرد نسبت به مهارتهای شمارش است، البته اگر نظریه شما همبستگی پایینی را اعلام کند.
انواع
اعتبار سنجی فرآیند تنظیم، بهبود روش های تشخیص روانی ایجاد شده است. وظیفه اصلی آن این است که اطمینان حاصل شود که فناوری دقیقاً آنچه را که توسعه دهنده نیاز دارد تشخیص می دهد. بین اعتبار سنجی نظری و عملی تمایز قائل شد.
برای نوع اول، مشکل اساسی رابطه بین پدیده های ذهنی و شاخص های آنهاست که به کمک آن این پدیده ها سعی در شناختن آنها دارند. نشان می دهد که نتایج روش شناسی و قصد انتزاعی نویسنده یکسان است.
برای ایجاد اعتبار انتزاعی، یافتن معیار مستقلی که خارج از روش شناسی باشد بسیار دشوار است. بنابراین، در تاریخچه تشخیص روانی در مراحل اولیه، تکیه بر این مفهوم غریزی بود که آزمون اندازه گیری می کند:
- یک روشاگر به سادگی "بدیهی" بود معتبر تلقی می شد.
- اثبات اعتبار مبتنی بر این باور کاوشگر بود که فناوری او می تواند "آزموده را درک کند".
- این طرح فقط معتبر در نظر گرفته شد زیرا نظریه پشت این فناوری "بسیار خوب" بود.
بعد جستجو برای شواهدی که توسط علم توجیه شده بود آغاز شد. در اینجا لازم به ذکر است که انباشت نامحسوس زرادخانه ای از فناوری ها با اثبات شده و شناخته شدهاعتبار. اگر یک روانشناس طرحی برای ارزیابی کیفیت ایجاد کند و مشخص شود که سایر فناوریهای معتبر برای ارزیابی یکسان هستند، میتوانید همبستگی را مطالعه کنید، نتایج را بر اساس روش شخص دیگری و خودتان مقایسه کنید.
اگر ضریب همبستگی بیش از حد بالا باشد، پس طرح تولید شده دارای اعتبار انتزاعی چشمگیر است. اگر در مورد اینکه یک فناوری دقیقاً چه چیزی را ارزیابی می کند شک دارید، نتایج مربوط به آن را با نتایج طرح های معتبر شخص دیگری که ویژگی های مجاور (مشکوک) را تشخیص می دهد، مقایسه کنید. اگر مقادیر همبستگی به طور غیرمنتظره ای بزرگ باشد، می توان نتیجه گرفت که روش آن چیزی را که انتظار می رفت تخمین نمی زند.
بنابراین، اگر قبلاً طرحهای دیگری با هدف اندازهگیری دقیقاً همان هنجارها یا موارد مرتبط وجود داشته باشد، میتوانیم اعتبار متمایز و همگرا را تعیین کنیم.
Nuances
بنابراین، اعتبارسنجی چیست؟ به عبارت ساده، این یک تجدید نظر در محصول است تا ببینید چگونه با ویژگی های اعلام شده مطابقت دارد. به این معنا که هیچ اعتبارسنجی گوشی هوشمند تا آن زمان نمیگذرد. تا زمانی که مشتریان مطمئن شوند که دوربین و فضای ذخیرهسازی را دارد که حاضرند برای آن هزینه بپردازند.
معیار اعتبارسنجی معیاری از کیفیت ذهنی است که مستقل و مستقیم از آزمونی است که اعتبار سنجی میشود، و طرح روانتشخیصی آن را هدف قرار میدهد.
روایی کنونی - یکی از ویژگیهای آزمون، که توانایی آن را در تمایز بین آزمودنیها بر اساس یک ویژگی تشخیصی که هدف مطالعه در این آزمون است، منعکس میکند.روش.
روایی رقابتی از طریق همبستگی آزمون ایجاد شده با آزمون های دیگر برآورد می شود که اعتبار آن نسبت به پارامتر اندازه گیری شده تعیین می شود. اعتبار افتراقی را می توان با مثالی از آزمون های علاقه توضیح داد.