مقدمه
یادگیری عمیق حوزه‌های مختلف یادگیری ماشین که به صورت عام در رسانه‌ها به نام «هوش مصنوعی» شناخته می‌شود، را ارتقا بخشیده است. اما این مدل‌ها معمولا با داده‌های برچسب خورده کار می‌کنند، که یادگیری با ناظر نامیده می‌شود و افزایش حجم این داده‌ها، به افزایش کیفیت مدل یادگرفته شده ختم می‌شود. چیزی که در زمینه توسعه دادن یادگیری با ناظر در زمینه‌های مختلف مشکل‌ساز است، هزینه برچسب زدن داده‌هاست. این مشکل هزینه، بر روی مساله‌هایی که نیاز به یک متخصص برای برچسب گذاری دارند، تشدید هم می‌شود. برای مثال برچسب گذاری تصاویر پزشکی که وجود سرطان را مشخص کنند نیاز به نیروی متخصص حوزه پزشکی دارد، و تولید حجم بالای دادگان برچسب خورده پزشکی در زمان مناسب و حجم بالا امکان‌پذیر نیست. یادگیری نیمه‌نظارتی سعی می‌کند از دادگان بدون برچسب در کنار دادگان برچسب خورده، استفاده کرده و کیفیت نهایی مدل را افزایش دهد. در ادامه به بررسی مقاله FixMatch گوگل و نحوه رسیدن آن به کیفیت هیجان‌انگیز ۸۸ درصدی روی دیتاست CIFAR10 تنها با ۴۰ نمونه آموزشی می‌پردازیم.


نمونه تصاویر از کلاس‌های مختلف CIFAR-10

 

ادامه مطلب