تحلیل یادگیری بر روی سامانه‌های یادگیری دانشگاه تهران به کمک هوش ماشین
کد مقاله : 1056-NEXT
نویسندگان:
محمد علی صدرایی جواهری1، سیدامید فاطمی *2
1دانشجوی کارشناسی رشته مهندس کامپیوتر دانشکده برق و کامپیوتر دانشگاه تهران
2رئیس مرکز فناوری های دیجیتالی دانشگاه تهران
چکیده مقاله:
با گسترش روز افزون فناوری‌های دیجیتال، استفاده از تکنولوژی در آموزش روز به روز افزایش پیدا می‌کند. این اتفاق سبب شده است که بتوان به داده‌های زیادی از روند یادگیری دسترسی پیدا کرد. ولی متاسفانه استفاده مفیدی از اکثر این داده‌ها نمی‌شود و به علت حجم زیاد آن نمی‌توان از روش‌های سنتی برای تحلیل آن استفاده کرد. همچنین این داده‌ها به شکل منظم در یک جا جمع نیستند و جمع‌آوری و مرتبط سازی تمام این داده‌ها کاری دشوار است.
با تحلیل هوشمندانه این داده‌ها می‌توان مشکلات موجود در یادگیری را شناسایی و برای رفع آن‌ها اقدام کرد. در این پژوهش ما تلاش کردیم که داده‌های سامانه‌های مختلف دانشگاه تهران را به هم متصل کنیم و بر اساس داده‌های آن‌ها بتوانیم رفتار دانشجویان را تحلیل و آینده را پیش‌بینی کنیم.
۱-اهمیت مساله
تحلیل یادگیری موضوعی است که در دهه گذشته توجه محققین بسیاری رو به خود جلب کرده است. از قدیم تحلیل آموزشی موضوعی کاربردی و جذابی برای محققین بوده است ولی به علت ناکافی بودن داده‌ها، در گذشته خیلی نمی‌شد روی آن کاری انجام داد. ولی اخیرا با پیشرفت تکنولوژی و همه‌گیری بیماری کرونا افراد بیشتری به استفاده از سیستم‌های مدیریت یادگیری روی آوردند که این موضوع باعث می‌شود داده‌های زیادی برای تحقیق و بررسی در اختیار قرار گیرد.
تحلیل یادگیری این امکان را می‌دهد که بتوان درباره وضعیت فعلی افراد اطلاعات بسیار بیشتری داشت و همچنین بتوان وضعیت آینده آن‌ها را پیش‌بینی کرد. خروجی این تحلیل‌ها به استاد، دانشجو و استاد راهنما کمک می‌کند که از اتفاقات آینده با خبر شوند و با انجام کارهایی آن را تغییر دهند. این کارها نیز می‌تواند به طور هوشمندانه توسط سیستم پیشنهاد شود. تغییر آینده در نهایت می‌تواند باعث افزایش بهره‌وری در آموزش می‌شود.
۲-بیان مساله
داده‌های موجود مرتبط با یادگیری در دانشگاه تهران متاسفانه در یک سامانه جمع نیستند. همچنین استفاده اساتید مختلف از سامانه‌های آموزشی دانشگاه تهران مشابه یکدیگر نیست و می‌توان گفت که از اکثر امکانات موجود به طور مناسب استفاده نمی‌شود. این موضوع کار تحلیل و جمع‌آوری این داده‌ها را دشوار می‌کند. از طرف دیگر روش‌های کلاسیک و دستی تحلیل داده بر روی این حجم زیاد موثر نیستند و به ابزار‌های مدرن‌تری برای این کار نیاز است.
سامانه یادگیری الکترونیکی دانشگاه تهران که با نام elearn نیز شناخته می‌شود، یک سامانه مبتنی بر پلتفرم متن‌باز مودل می‌باشد. این سامانه حاوی اطلاعات فعالیت دروس در طول ترم است. اطلاعاتی از قبیل آپلود تکالیف، نمرات کوییز‌های آنلاین، تاریخچه وارد شدن به صفحات درس و اطلاعات مفید دیگری است که برای هر دانشجو در آن ذخیره می‌شود. این پلتفرم خود ابزارهایی برای انجام تحلیل یادگیری دارد. اما متاسفانه داده‌های مهم زیادی از هر دانشجو وجود دارد که این سامانه از آن بی‌اطلاع است پس نیاز است برای تحیل یادگیری بهتر این سامانه بتواند به اطلاعات موجود در سایر سامانه‌ها متصل شود. مشکلی که در اینجا وجود دارد این است که این اتصال تا قبل از این انجام نشده است و باید به طور ویژه برای سامانه‌های دانشگاه تهران توسعه داده شود.
همانطور که گفته شد پلتفرم مودل ابزار‌هایی برای انجام تحلیل یادگیری دارد. پس لازم است که ما متصل‌کننده‌هایی برای مودل پیاده‌سازی کنیم که مودل را به سامانه‌های حاوی داده‌های مهم متصل کند. سوالی که مطرح می‌شود این است که چه سامانه‌هایی حاوی اطلاعات مفیدی برای ما هستند.
سامانه کلاس زنده برخط دانشگاه تهران این امکان را به اساتید می‌دهد که کلاس‌های خود را در آن برگزار کنند. این سامانه که مبتنی بر پلتفرم Adobe Connect است اطلاعات تمام کلاس‌های برگزار شده را در خود را ذخیره می‌کند. این اطلاعات شامل ساعت ورود خروج هر فرد به کلاس و میزان مشارکت وی می‌باشد. در دوران همه‌گیری کرونا خیلی از اساتید کلاس‌های خود را در این سامانه برگزار می‌کنند و برای همین داده‌های مفید بسیاری در این سامانه وجود دارد.
سامانه مدیریت آموزش که مبتنی بر پلتفرم گلستان است نتیجه عملکرد هر فرد را در آخر ترم را دارد. این اطلاعات مکمل اطلاعات دو سامانه قبل است و در واقع سر‌انجام هر دانشجو در آن ذخیره شده است. چون امکان اتصال مستقیم به سامانه گلستان نداشت داده‌های موجود در آن در یک سامانه دیگر قرار گرفت. این سامانه آموزش فرضی با استفاده از پایتون به کمک تکنولوژی‌های فلاسک و پستگرس پیاده‌سازی شده است.
اطلاعات این سه سامانه در کنار هم زمینه استفاده از الگوریتم‌های تشخیص الگو را فراهم می‌آورد. الگوریتم‌های تشخیص الگو با یادگیری الگوی رفتار دانشجویان در ترم‌های گذشته، رفتار آنان را در ترم آتی پیش‌بینی می‌کند.
در این پژوهش سعی شده است که اطلاعات این سه سامانه کنار هم جمع‌آوری شود و با استفاده از این اطلاعات بتوان اتفاقات آینده را پیش‌بینی و در جهت جلوگیری از آن‌ها توصیه کرد.
۳-روش انجام
ابزار سامانه مودل دارای معماری زیر برای مدل‌های هوش مصنوعی خود است.
در این معماری، هر مدل یک هدف و تعدادی شاخص دارد. بعد از اجرای مدل براساس نتیجه، تعدادی بینش تولید می‌شود که می‌توان برای آن‌ها اعلان و عمل متناظری تعریف کرد.
علاوه بر آن هر مدل موقع تعریف شدن نیازمند آن است که دو پارامتر دیگر برایش مشخص شود. اولین پارامتر پردازشگر یادگیری ماشین و دومین پارامتر تقسیم‌بندی زمانی آن است. در این پژوهش برای پارامتر اول، از پردازشگر یادگیری ماشین Tensorflow استفاده شده است.
تقسیم‌بندی زمانی تعیین کننده آن است که اطلاعات موجود در درس را به چه تعداد بازه تقسیم کنیم و همینطور شروع و پایان این بازه‌ها به چه شکل باشد. در شکل 3 دو تقسیم بندی زمانی آخرین ربع و تمام ربع‌های پیشین مشاهده می‌شود. تعداد بازه‌ها برای هر دو حالت یکی است و مهم‌ترین تفاوتشان زمان شروع بازه برای فیلتر کردن داده است.
مدل هوش مصنوعی خود را به شکل زیر تعریف می‌کنیم. دقت شود که نشانگر بر روی بازه زمانی تعریف می‌شود. برای مثال نشانگر اول میانگین درصد حضور در کلاس در یک بازه زمانی است.
۴-یافته‌ها
حال باید عملکرد مدل بالا را با استفاده از داده‌های موجود بررسی کنیم. برای بررسی عملکرد از دیتاست ترم پاییز ۱۳۹۹ استفاده شده است. به علت حجم عظیم این دیتاست، تعلیم و تست مدل فقط بر روی دروس عمومی این دیتاست انجام شده است. داده‌ها را به دو بخش برای تعلیم و تست تقسیم می‌کنیم. بخش تحلیل یادگیری پلتفرم مودل خود دارای یک امکان برای ارزیابی مدل است. این امکان بر اساس داده‌های یادگیری امتیازی از عملکرد مدل به ما می‌دهد.
خروجی ارزیابی مدل مطابق جدول زیر است. ارزیابی در دو حالت مختلف تقسیم‌بندی زمانی انجام شده است.
دقت مدل در هر دو روش تقسیم بندی زمانی نزدیک به ۸۰ درصد است. این دقت نشان‌دهنده آن است که این مدل برای استفاده در شرایط واقعی مناسب است.
با این که درصد دقت مدل در هر دو حالت به هم نزدیک است اما خروجی آن‌ها در خیلی از دروس با هم تفاوت می‌کند. جدول 3 مقایسه خروجی مدل با واقعیت در یکی از دروس است. در این جدول، یک به معنای یکی از حالات هدف جدول 1 است.
عملکرد ضعیف دانشجویان ۹ تا ۱۲ توسط هیچ کدام از مدل‌ها پیش‌بینی نشده است. البته این دانشجویان نمره‌ای نزدیک به مرز هدف دارند. چون مرز هدف نمره ۱۱ است و اینان نمره ۱۰ در درس گرفته‌اند. پس می‌توان از این خطا چشم پوشی کرد.
برای سایر دانشجویان، مدل آخرین ربع دارای ۵ جواب مثبت کاذب است و مدل تمام ربع‌های پیشین دارای یک جواب منفی کاذب است. در واقع مدل آخرین ربع به اتفاقات ربع آخر ترم زیادی حساس هست و اگر دانشجویی در کل ترم فعالیت کرده باشد اما ربع آخر درس کار زیادی نکرده باشد توسط این مدل مشکوک شناخته می‌شود. برای همین است که جواب مثبت کاذب تولید می‌شود. از طرف دیگر مدل تمام ربع‌های پیشین چون در بازه چهارم تمام بازه‌های قبل را نظر می‌گیرد عملکرد ضعیف آخر ترم یک نفر تاثیرش کمتر می‌شود که این باعث می‌شود مانند دانشجو ۳ جواب منفی کاذب به وجود بیاید.
کلیدواژه ها:
تحلیل یادگیری، هوش ماشین، پلتفرم مودل، آموزش الکترونیک
وضعیت : چکیده برای ارائه شفاهی پذیرفته شده است