مقدمه
یادگیری عمیق حوزههای مختلف یادگیری ماشین که به صورت عام در رسانهها به نام «هوش مصنوعی» شناخته میشود، را ارتقا بخشیده است. اما این مدلها معمولا با دادههای برچسب خورده کار میکنند، که یادگیری با ناظر نامیده میشود و افزایش حجم این دادهها، به افزایش کیفیت مدل یادگرفته شده ختم میشود. چیزی که در زمینه توسعه دادن یادگیری با ناظر در زمینههای مختلف مشکلساز است، هزینه برچسب زدن دادههاست. این مشکل هزینه، بر روی مسالههایی که نیاز به یک متخصص برای برچسب گذاری دارند، تشدید هم میشود. برای مثال برچسب گذاری تصاویر پزشکی که وجود سرطان را مشخص کنند نیاز به نیروی متخصص حوزه پزشکی دارد، و تولید حجم بالای دادگان برچسب خورده پزشکی در زمان مناسب و حجم بالا امکانپذیر نیست. یادگیری نیمهنظارتی سعی میکند از دادگان بدون برچسب در کنار دادگان برچسب خورده، استفاده کرده و کیفیت نهایی مدل را افزایش دهد. در ادامه به بررسی مقاله FixMatch گوگل و نحوه رسیدن آن به کیفیت هیجانانگیز ۸۸ درصدی روی دیتاست CIFAR10 تنها با ۴۰ نمونه آموزشی میپردازیم.
نمونه تصاویر از کلاسهای مختلف CIFAR-10
ادامه مطلب