یکی از مسئله‌هایی که در ساخت مدل های مبتنی بر یادگیری ماشین مشکل‌ساز می‌شود نبود دیتای کافی است. برای ساخت این مدل‌ها به دیتای زیادی نیاز است و برای اینکه بتوان این حجم از دیتا را در موضوع مورد نظر جمع آوری کرد باید هزینه بالایی برای برچسب گذاری دیتا توسط افراد پرداخت شود. این هزینه به قدری است که گاهی پروژه به خاطر نبود دیتا در مسئله شروع نمی‌شود.


مسئله‌ طبقه بندی، این بار بدون دیتا

ادامه مطلب

قسمت چهارم پادکست دموورژن با عنوان «داستان ماشین مترجم» در پخش کننده‌های پادکست نظیر CastBox و کانال تلگرام پادکست منتشر شد.

توی قسمت چهارم پاکست دمورژن سراغ مساله جا افتاده ماشین ترجمه رفتیم که ترند تغییراتی که در هفتاد سال گذشته داشته رو ببینیم. ایده‌ها و مشکلات مطرح در سه نسل مختلف ماشین‌های ترجمه رو با هم بررسی کردیم و توانایی‌ها و محدودیت‌هاشون رو دیدیم. مساله ماشین ترجمه، یا ترجمه اتوماتیک توسط کامپیوتر مساله‌ی مهمی هست که پیشرفت در اون به صورت مستقیم به کاربر نهایی سود می‌رسونه و اطلاعات قابل دسترسش رو بیشتر می‌کنه. اینکه چی بوده و چی هست و چی می‌تونه بشه رو توی این پادکست بررسی می‌کنیم.

ادامه مطلب

یکی از مواردی که می‌توان پیشرفت هوش مصنوعی را در آن دید، خلاقیت‌هایی‌ست که معمولا از کامپیوتر و ماشین انتظار نداریم. پیش از این در پست «گیت‌های منطقی که هنرمند هستند» به موضوع خلاقیت‌های هنری که توسط یادگیری ماشین امکان‌پذیر می‌شود پرداخته بودیم، این مقاله مربوط به استفاده از یادگیری ماشین در فرآیند داستان نویسی است. فعالیتی که پیچیده بوده و با خلاقانه و غیرقابل پیشبینی بودن، مسئله سختی برای یک سیستم کامپیوتری محسوب می‌شود. این مقاله ترجمه و بازنویسی از مقاله «Precursors to a Digital Muse» گوگل می‌باشد.


نویسنده خلید ورسان، در فستیوال نویسندگان نوظهور

ادامه مطلب

مقدمه
یادگیری عمیق حوزه‌های مختلف یادگیری ماشین که به صورت عام در رسانه‌ها به نام «هوش مصنوعی» شناخته می‌شود، را ارتقا بخشیده است. اما این مدل‌ها معمولا با داده‌های برچسب خورده کار می‌کنند، که یادگیری با ناظر نامیده می‌شود و افزایش حجم این داده‌ها، به افزایش کیفیت مدل یادگرفته شده ختم می‌شود. چیزی که در زمینه توسعه دادن یادگیری با ناظر در زمینه‌های مختلف مشکل‌ساز است، هزینه برچسب زدن داده‌هاست. این مشکل هزینه، بر روی مساله‌هایی که نیاز به یک متخصص برای برچسب گذاری دارند، تشدید هم می‌شود. برای مثال برچسب گذاری تصاویر پزشکی که وجود سرطان را مشخص کنند نیاز به نیروی متخصص حوزه پزشکی دارد، و تولید حجم بالای دادگان برچسب خورده پزشکی در زمان مناسب و حجم بالا امکان‌پذیر نیست. یادگیری نیمه‌نظارتی سعی می‌کند از دادگان بدون برچسب در کنار دادگان برچسب خورده، استفاده کرده و کیفیت نهایی مدل را افزایش دهد. در ادامه به بررسی مقاله FixMatch گوگل و نحوه رسیدن آن به کیفیت هیجان‌انگیز ۸۸ درصدی روی دیتاست CIFAR10 تنها با ۴۰ نمونه آموزشی می‌پردازیم.


نمونه تصاویر از کلاس‌های مختلف CIFAR-10

 

ادامه مطلب

کمتر از یک ماه گذشته یک اپیزود در پادکست This Week In Machine Learning & AI منتشر شد که در قالب مصاحبه با آقای پرشانت واریر بود. آقای واریر که بنیانگذار شرکت Qure.ai در هند هست که در زمینه پردازش تصاویر اسکن‌های پزشکی بوسیله هوش مصنوعی فعالیت دارد. قبل از افتتاح این شرکت آقای واریر دکترای Computer Science رو از Georgia Institute of Technology از آمریکا می‌گیرند و بعد به هند برمی‌گردند. واریر در این مصاحبه به برخی تفاوت‌ها بین یک مقاله علمی و ساخت یک سرویس برای دنیای واقعی اشاره دارد که در نوع خودش جالب هست. می‌توانید در ادامه خلاصه مطالب گفته شده را بخوانید یا خود پادکست که به زبان انگلیسی هست را گوش بدهید.

ادامه مطلب

همانطور که در قسمت اول پادکست DemoVersion اشاره کردیم مسابقه Alexa Prize یک مسابقه چند میلیون دلاری است که هر ساله آمازون به امید ساخت یک گفتگوی مشابه انسان آن را برگزار می‌کند.  در سال سال گذشته تیم دانشگاه واشنگتن توانست یک Chatbot بسازد که به صورت میانگین گفتگوهای موفقیت آمیزی بالای ده دقیقه داشت. این پست وبلاگ به صورت خلاصه از مطالبی که در گزارش Verge آمده گرفته شده و همچنین در بخش‌هایی تالیف شده است.

ادامه مطلب

شبکه‌های عصبی که انواعی از آنها با نام یادگیری ژرف نیز شناخته می‌شوند توانسته‌اند در زمینه‌های مختلف برای شناسایی الگو و طبقه‌بندی بهترین نتایج را کسب کنند. این مدل‌ها از واحد‌های کوچکی به نام نورون ساخته می‌شوند که ساده شده سلول‌های نورونی مغز هستند و با دریافت ورودی تا حد مشخصی بر اساس یک تابع فعال ساز فعال شده و به نورون‌های بعدی سیگنال می‌فرستند. این مدل‌ها از میلیون‌ها متغیر ساخته شده‌اند که بر اساس داده‌های آموزشی و الگوریتم‌هایی مانند backpropagation مقدار دهی می‌شوند.  این شبکه‌ها حتی توانستند در مواردی مانند یک نتیجه از DeepMind گوگل از انسان هم بهتر رابطه بین اشیا در تصاویر را تشخیص دهند. اما این به معنای کامل بودن مدل‌های شبکه عصبی نیست.


ادامه مطلب

یک نکته خوب که در نرم‌افزار و ارتباط با کامپیوتر وجود دارد این است که بمرور انجام کارهای سخت و تخصصی برای اکثریت افراد امکان پذیر می‌شود. همین چندسال قبل بود که طراحی یک وبسایت زیبا بسیار و واکنشگرا زمانبر و تخصصی محسوب می‌شد. و سازنده می‌بایست به HTML و CSS و تا حدی Java Script مسلط می‌بود اما بعد از آن کتابخانه‌های زیادی مانند Bootstrap بوجود آمدند که انجام اینکار را برای سازنده ساده کنند همچنین وبسایت‌هایی مانند wix.com هم ساخت یک وبسایت را به راحتی Drag & Drop چند ایتم رساندند. این موضوع در مورد یادگیری ماشین نیز صادق است کتابخانه‌های خوبی مانند Theano و Tensorflow و Torch بوجود آمدند که در کار با شبکه‌های عصبی کاربر نیاز به دانستن جزئیات پیاده‌سازی مدل‌ها روی GPU نباشد سپس کتابخانه‌هایی مانند Keras برپایه Tensorflow و Torch ساخته شد که در سطح انتزاعی بالاتری کار می‌کرد و کار با آن ساده بود به تازگی گوگل پروژه‌ای به نام Teachable Machine را ساخته است که به کاربران عادی کامپیوتر تجربه ساخت و استفاده از یک مدل توسط دوربین کامپیوترشان و بدون نیاز به برنامه نویسی می‌دهد. از پروژه‌های مشابه می‌توان به Azure Machine Learning Studio که توسط مایکروسافت ساخته شده است اشاره کرد که توانایی ساخت یک مدل طبقه‌بند یا Classification ، درونیاب یا Regression و خوشه‌بند یا Clustering را به کاربر نهایی بدون برنامه نویسی و با چند Drag & Drop ساده می‌دهد. همچنین بعد از ساخت این مدل مایکروسافت این امکان را فراهم می‌کند که به صورت Web Service از این مدل ساخته شده در نرم‌افزارهایی که مورد نیاز است استفاده شود.

اهمیت موضوع

به مرور الگوریتم‌های یادگیری ماشین و که در خط مقدم هوش مصنوعی قرار دارند در حال افزایش تاثیرشان در زندگی روزمره کاربران هستند. می‌توان در این میان به سیستم‌های ترجمه ماشینی و پیشنهاد موسیقی مورد علاقه اشاره کرد. هرچند این سیستم‌ها برای کاربران نهایی ارزشمند هستند اما این کاربران نمی‌توانند متوجه چگونگی کارکرد این سیستم‌ها شوند، درک این موضوع برای کاربران نهایی باعث می‌شود با دانستن واقعیات و بدور از توقعات غیرواقعی بتوانند رابطه بهتری با این سیستم‌ها برقرار نمایند. پروژه Teachable Machine یا ماشین یادگیرنده گوگل به منظور تجربه ساخت یک تجربه از پردازش تصویر توسط کاربران ساخته شده است.

ادامه مطلب