تحلیل یادگیری بر روی سامانههای یادگیری دانشگاه تهران به کمک هوش ماشین |
کد مقاله : 1056-NEXT |
نویسندگان |
محمد علی صدرایی جواهری1، سیدامید فاطمی *2 1دانشجوی کارشناسی رشته مهندس کامپیوتر دانشکده برق و کامپیوتر دانشگاه تهران 2رئیس مرکز فناوری های دیجیتالی دانشگاه تهران |
چکیده مقاله |
با گسترش روز افزون فناوریهای دیجیتال، استفاده از تکنولوژی در آموزش روز به روز افزایش پیدا میکند. این اتفاق سبب شده است که بتوان به دادههای زیادی از روند یادگیری دسترسی پیدا کرد. ولی متاسفانه استفاده مفیدی از اکثر این دادهها نمیشود و به علت حجم زیاد آن نمیتوان از روشهای سنتی برای تحلیل آن استفاده کرد. همچنین این دادهها به شکل منظم در یک جا جمع نیستند و جمعآوری و مرتبط سازی تمام این دادهها کاری دشوار است. با تحلیل هوشمندانه این دادهها میتوان مشکلات موجود در یادگیری را شناسایی و برای رفع آنها اقدام کرد. در این پژوهش ما تلاش کردیم که دادههای سامانههای مختلف دانشگاه تهران را به هم متصل کنیم و بر اساس دادههای آنها بتوانیم رفتار دانشجویان را تحلیل و آینده را پیشبینی کنیم. ۱-اهمیت مساله تحلیل یادگیری موضوعی است که در دهه گذشته توجه محققین بسیاری رو به خود جلب کرده است. از قدیم تحلیل آموزشی موضوعی کاربردی و جذابی برای محققین بوده است ولی به علت ناکافی بودن دادهها، در گذشته خیلی نمیشد روی آن کاری انجام داد. ولی اخیرا با پیشرفت تکنولوژی و همهگیری بیماری کرونا افراد بیشتری به استفاده از سیستمهای مدیریت یادگیری روی آوردند که این موضوع باعث میشود دادههای زیادی برای تحقیق و بررسی در اختیار قرار گیرد. تحلیل یادگیری این امکان را میدهد که بتوان درباره وضعیت فعلی افراد اطلاعات بسیار بیشتری داشت و همچنین بتوان وضعیت آینده آنها را پیشبینی کرد. خروجی این تحلیلها به استاد، دانشجو و استاد راهنما کمک میکند که از اتفاقات آینده با خبر شوند و با انجام کارهایی آن را تغییر دهند. این کارها نیز میتواند به طور هوشمندانه توسط سیستم پیشنهاد شود. تغییر آینده در نهایت میتواند باعث افزایش بهرهوری در آموزش میشود. ۲-بیان مساله دادههای موجود مرتبط با یادگیری در دانشگاه تهران متاسفانه در یک سامانه جمع نیستند. همچنین استفاده اساتید مختلف از سامانههای آموزشی دانشگاه تهران مشابه یکدیگر نیست و میتوان گفت که از اکثر امکانات موجود به طور مناسب استفاده نمیشود. این موضوع کار تحلیل و جمعآوری این دادهها را دشوار میکند. از طرف دیگر روشهای کلاسیک و دستی تحلیل داده بر روی این حجم زیاد موثر نیستند و به ابزارهای مدرنتری برای این کار نیاز است. سامانه یادگیری الکترونیکی دانشگاه تهران که با نام elearn نیز شناخته میشود، یک سامانه مبتنی بر پلتفرم متنباز مودل میباشد. این سامانه حاوی اطلاعات فعالیت دروس در طول ترم است. اطلاعاتی از قبیل آپلود تکالیف، نمرات کوییزهای آنلاین، تاریخچه وارد شدن به صفحات درس و اطلاعات مفید دیگری است که برای هر دانشجو در آن ذخیره میشود. این پلتفرم خود ابزارهایی برای انجام تحلیل یادگیری دارد. اما متاسفانه دادههای مهم زیادی از هر دانشجو وجود دارد که این سامانه از آن بیاطلاع است پس نیاز است برای تحیل یادگیری بهتر این سامانه بتواند به اطلاعات موجود در سایر سامانهها متصل شود. مشکلی که در اینجا وجود دارد این است که این اتصال تا قبل از این انجام نشده است و باید به طور ویژه برای سامانههای دانشگاه تهران توسعه داده شود. همانطور که گفته شد پلتفرم مودل ابزارهایی برای انجام تحلیل یادگیری دارد. پس لازم است که ما متصلکنندههایی برای مودل پیادهسازی کنیم که مودل را به سامانههای حاوی دادههای مهم متصل کند. سوالی که مطرح میشود این است که چه سامانههایی حاوی اطلاعات مفیدی برای ما هستند. سامانه کلاس زنده برخط دانشگاه تهران این امکان را به اساتید میدهد که کلاسهای خود را در آن برگزار کنند. این سامانه که مبتنی بر پلتفرم Adobe Connect است اطلاعات تمام کلاسهای برگزار شده را در خود را ذخیره میکند. این اطلاعات شامل ساعت ورود خروج هر فرد به کلاس و میزان مشارکت وی میباشد. در دوران همهگیری کرونا خیلی از اساتید کلاسهای خود را در این سامانه برگزار میکنند و برای همین دادههای مفید بسیاری در این سامانه وجود دارد. سامانه مدیریت آموزش که مبتنی بر پلتفرم گلستان است نتیجه عملکرد هر فرد را در آخر ترم را دارد. این اطلاعات مکمل اطلاعات دو سامانه قبل است و در واقع سرانجام هر دانشجو در آن ذخیره شده است. چون امکان اتصال مستقیم به سامانه گلستان نداشت دادههای موجود در آن در یک سامانه دیگر قرار گرفت. این سامانه آموزش فرضی با استفاده از پایتون به کمک تکنولوژیهای فلاسک و پستگرس پیادهسازی شده است. اطلاعات این سه سامانه در کنار هم زمینه استفاده از الگوریتمهای تشخیص الگو را فراهم میآورد. الگوریتمهای تشخیص الگو با یادگیری الگوی رفتار دانشجویان در ترمهای گذشته، رفتار آنان را در ترم آتی پیشبینی میکند. در این پژوهش سعی شده است که اطلاعات این سه سامانه کنار هم جمعآوری شود و با استفاده از این اطلاعات بتوان اتفاقات آینده را پیشبینی و در جهت جلوگیری از آنها توصیه کرد. ۳-روش انجام ابزار سامانه مودل دارای معماری زیر برای مدلهای هوش مصنوعی خود است. در این معماری، هر مدل یک هدف و تعدادی شاخص دارد. بعد از اجرای مدل براساس نتیجه، تعدادی بینش تولید میشود که میتوان برای آنها اعلان و عمل متناظری تعریف کرد. علاوه بر آن هر مدل موقع تعریف شدن نیازمند آن است که دو پارامتر دیگر برایش مشخص شود. اولین پارامتر پردازشگر یادگیری ماشین و دومین پارامتر تقسیمبندی زمانی آن است. در این پژوهش برای پارامتر اول، از پردازشگر یادگیری ماشین Tensorflow استفاده شده است. تقسیمبندی زمانی تعیین کننده آن است که اطلاعات موجود در درس را به چه تعداد بازه تقسیم کنیم و همینطور شروع و پایان این بازهها به چه شکل باشد. در شکل 3 دو تقسیم بندی زمانی آخرین ربع و تمام ربعهای پیشین مشاهده میشود. تعداد بازهها برای هر دو حالت یکی است و مهمترین تفاوتشان زمان شروع بازه برای فیلتر کردن داده است. مدل هوش مصنوعی خود را به شکل زیر تعریف میکنیم. دقت شود که نشانگر بر روی بازه زمانی تعریف میشود. برای مثال نشانگر اول میانگین درصد حضور در کلاس در یک بازه زمانی است. ۴-یافتهها حال باید عملکرد مدل بالا را با استفاده از دادههای موجود بررسی کنیم. برای بررسی عملکرد از دیتاست ترم پاییز ۱۳۹۹ استفاده شده است. به علت حجم عظیم این دیتاست، تعلیم و تست مدل فقط بر روی دروس عمومی این دیتاست انجام شده است. دادهها را به دو بخش برای تعلیم و تست تقسیم میکنیم. بخش تحلیل یادگیری پلتفرم مودل خود دارای یک امکان برای ارزیابی مدل است. این امکان بر اساس دادههای یادگیری امتیازی از عملکرد مدل به ما میدهد. خروجی ارزیابی مدل مطابق جدول زیر است. ارزیابی در دو حالت مختلف تقسیمبندی زمانی انجام شده است. دقت مدل در هر دو روش تقسیم بندی زمانی نزدیک به ۸۰ درصد است. این دقت نشاندهنده آن است که این مدل برای استفاده در شرایط واقعی مناسب است. با این که درصد دقت مدل در هر دو حالت به هم نزدیک است اما خروجی آنها در خیلی از دروس با هم تفاوت میکند. جدول 3 مقایسه خروجی مدل با واقعیت در یکی از دروس است. در این جدول، یک به معنای یکی از حالات هدف جدول 1 است. عملکرد ضعیف دانشجویان ۹ تا ۱۲ توسط هیچ کدام از مدلها پیشبینی نشده است. البته این دانشجویان نمرهای نزدیک به مرز هدف دارند. چون مرز هدف نمره ۱۱ است و اینان نمره ۱۰ در درس گرفتهاند. پس میتوان از این خطا چشم پوشی کرد. برای سایر دانشجویان، مدل آخرین ربع دارای ۵ جواب مثبت کاذب است و مدل تمام ربعهای پیشین دارای یک جواب منفی کاذب است. در واقع مدل آخرین ربع به اتفاقات ربع آخر ترم زیادی حساس هست و اگر دانشجویی در کل ترم فعالیت کرده باشد اما ربع آخر درس کار زیادی نکرده باشد توسط این مدل مشکوک شناخته میشود. برای همین است که جواب مثبت کاذب تولید میشود. از طرف دیگر مدل تمام ربعهای پیشین چون در بازه چهارم تمام بازههای قبل را نظر میگیرد عملکرد ضعیف آخر ترم یک نفر تاثیرش کمتر میشود که این باعث میشود مانند دانشجو ۳ جواب منفی کاذب به وجود بیاید. |
کلیدواژه ها |
تحلیل یادگیری، هوش ماشین، پلتفرم مودل، آموزش الکترونیک |
وضعیت: چکیده برای ارائه شفاهی پذیرفته شده است |