یکی از مسئله‌هایی که در ساخت مدل های مبتنی بر یادگیری ماشین مشکل‌ساز می‌شود نبود دیتای کافی است. برای ساخت این مدل‌ها به دیتای زیادی نیاز است و برای اینکه بتوان این حجم از دیتا را در موضوع مورد نظر جمع آوری کرد باید هزینه بالایی برای برچسب گذاری دیتا توسط افراد پرداخت شود. این هزینه به قدری است که گاهی پروژه به خاطر نبود دیتا در مسئله شروع نمی‌شود.


مسئله‌ طبقه بندی، این بار بدون دیتا

ادامه مطلب

قسمت چهارم پادکست دموورژن با عنوان «داستان ماشین مترجم» در پخش کننده‌های پادکست نظیر CastBox و کانال تلگرام پادکست منتشر شد.

توی قسمت چهارم پاکست دمورژن سراغ مساله جا افتاده ماشین ترجمه رفتیم که ترند تغییراتی که در هفتاد سال گذشته داشته رو ببینیم. ایده‌ها و مشکلات مطرح در سه نسل مختلف ماشین‌های ترجمه رو با هم بررسی کردیم و توانایی‌ها و محدودیت‌هاشون رو دیدیم. مساله ماشین ترجمه، یا ترجمه اتوماتیک توسط کامپیوتر مساله‌ی مهمی هست که پیشرفت در اون به صورت مستقیم به کاربر نهایی سود می‌رسونه و اطلاعات قابل دسترسش رو بیشتر می‌کنه. اینکه چی بوده و چی هست و چی می‌تونه بشه رو توی این پادکست بررسی می‌کنیم.

ادامه مطلب

یکی از مواردی که می‌توان پیشرفت هوش مصنوعی را در آن دید، خلاقیت‌هایی‌ست که معمولا از کامپیوتر و ماشین انتظار نداریم. پیش از این در پست «گیت‌های منطقی که هنرمند هستند» به موضوع خلاقیت‌های هنری که توسط یادگیری ماشین امکان‌پذیر می‌شود پرداخته بودیم، این مقاله مربوط به استفاده از یادگیری ماشین در فرآیند داستان نویسی است. فعالیتی که پیچیده بوده و با خلاقانه و غیرقابل پیشبینی بودن، مسئله سختی برای یک سیستم کامپیوتری محسوب می‌شود. این مقاله ترجمه و بازنویسی از مقاله «Precursors to a Digital Muse» گوگل می‌باشد.


نویسنده خلید ورسان، در فستیوال نویسندگان نوظهور

ادامه مطلب

مقدمه
یادگیری عمیق حوزه‌های مختلف یادگیری ماشین که به صورت عام در رسانه‌ها به نام «هوش مصنوعی» شناخته می‌شود، را ارتقا بخشیده است. اما این مدل‌ها معمولا با داده‌های برچسب خورده کار می‌کنند، که یادگیری با ناظر نامیده می‌شود و افزایش حجم این داده‌ها، به افزایش کیفیت مدل یادگرفته شده ختم می‌شود. چیزی که در زمینه توسعه دادن یادگیری با ناظر در زمینه‌های مختلف مشکل‌ساز است، هزینه برچسب زدن داده‌هاست. این مشکل هزینه، بر روی مساله‌هایی که نیاز به یک متخصص برای برچسب گذاری دارند، تشدید هم می‌شود. برای مثال برچسب گذاری تصاویر پزشکی که وجود سرطان را مشخص کنند نیاز به نیروی متخصص حوزه پزشکی دارد، و تولید حجم بالای دادگان برچسب خورده پزشکی در زمان مناسب و حجم بالا امکان‌پذیر نیست. یادگیری نیمه‌نظارتی سعی می‌کند از دادگان بدون برچسب در کنار دادگان برچسب خورده، استفاده کرده و کیفیت نهایی مدل را افزایش دهد. در ادامه به بررسی مقاله FixMatch گوگل و نحوه رسیدن آن به کیفیت هیجان‌انگیز ۸۸ درصدی روی دیتاست CIFAR10 تنها با ۴۰ نمونه آموزشی می‌پردازیم.


نمونه تصاویر از کلاس‌های مختلف CIFAR-10

 

ادامه مطلب

متن پیشرو قسمت دوم در مورد هنرمولد است که از پست آقای جیسون بایلی که در این رابطه منتشر کرده ترجمه و خلاصه‌سازی شده است. توصیه می‌شود مطلب قبلی «چرا به هنر مولد عشق بورزیم؟ مقدمه هنرهای مرتبط قرن بیستم» را پیش از خواندن این متن بخوانید. اما مطالب مطرح شده به تنهایی نیز قابل درک هستند.


Path - Casey Reas, 2001

یکی از تعاریف ساده اما کاربردی هنر مولد این است که هنر مولدی هنری است که توسط کامپیوتر برنامه‌نویسی و تولید شده و در ذات تولید اثر هنری تصادفی بودن را دارد. این معمولا دو تصور اشتباه را برمی‌انگیزد که افراد را از تحسین زیبایی و ظرافت های هنر مولد باز می‌دارد.

ادامه مطلب

مقدمه

یکی از موضوعاتی که قبل از این هم به آن در پست «گیت‌های منطقی که هنرمند هستند» اشاره شد هنر بواسته هوش مصنوعی یا به طور کلی به کمک الگوریتم‌های کامپیوتری است. به تازگی مطلب جدیدی را آقای جیسون بایلی در این رابطه منتشر کرده که چرا باید این نوع هنر عشق بورزیم. به علت اینکه دیدگاه کاملا هنری و تاریخی به این موضوع داشته و همچنین از مثال‌های زیبایی استفاده کرده من تصمیم گرفتم که این مطلب رو به صورت خلاصه یا ترجمه فارسی در وبلاگ منتشر کنم، سعی کنم اصالت متن رو رعایت کنم این مطلب به علت اینکه از مقدار معمولی پست‌های وبلاگ حجم بیشتری داشت در قالب چند پست وبلاگ منتشر می‌شود.

ادامه مطلب

کمتر از یک ماه گذشته یک اپیزود در پادکست This Week In Machine Learning & AI منتشر شد که در قالب مصاحبه با آقای پرشانت واریر بود. آقای واریر که بنیانگذار شرکت Qure.ai در هند هست که در زمینه پردازش تصاویر اسکن‌های پزشکی بوسیله هوش مصنوعی فعالیت دارد. قبل از افتتاح این شرکت آقای واریر دکترای Computer Science رو از Georgia Institute of Technology از آمریکا می‌گیرند و بعد به هند برمی‌گردند. واریر در این مصاحبه به برخی تفاوت‌ها بین یک مقاله علمی و ساخت یک سرویس برای دنیای واقعی اشاره دارد که در نوع خودش جالب هست. می‌توانید در ادامه خلاصه مطالب گفته شده را بخوانید یا خود پادکست که به زبان انگلیسی هست را گوش بدهید.

ادامه مطلب

همانطور که در قسمت اول پادکست DemoVersion اشاره کردیم مسابقه Alexa Prize یک مسابقه چند میلیون دلاری است که هر ساله آمازون به امید ساخت یک گفتگوی مشابه انسان آن را برگزار می‌کند.  در سال سال گذشته تیم دانشگاه واشنگتن توانست یک Chatbot بسازد که به صورت میانگین گفتگوهای موفقیت آمیزی بالای ده دقیقه داشت. این پست وبلاگ به صورت خلاصه از مطالبی که در گزارش Verge آمده گرفته شده و همچنین در بخش‌هایی تالیف شده است.

ادامه مطلب

قسمت اول پادکست دموورژن با عنوان «خاموش کردن پشتیبان حیات» در کانال تلگرام پادکست منتشر شد.
بمرور پادکست روی iTunes و دیگر پلتفرم‌ها هم قرار می‌گیره.
توی این قسمت پادکست ابتدا یه مقدمه‌ای در مورد هوش مصنوعی داریم، بعدش در مورد یک خواننده که از هوش مصنوعی کمک می‌گیره تا آهنگسازی آهنگش رو انجام بده صحبت می‌کنیم، بعدش Demo جنجالی Duplex گوگل توی کنفرانس IO رو با جزئیات بیشتری بررسی می‌کنیم.

خوراک بیشتر

خبر بیکار شدن ۳۰ درصد آمریکایی‌ها تا ۲۰۳۰ بخاطر عواملی از جمله هوش‌مصنوعی

ویدیوی Break Free از Taryn Southern

ویدیوی Life Support از Taryn Southern

معرفی Google Duplex در وبلاگ Google AI

نقد Google Duplex در وبسایت VanityFair

بازی Semantris ساخته شده توسط Google AI

شبکه‌های عصبی که انواعی از آنها با نام یادگیری ژرف نیز شناخته می‌شوند توانسته‌اند در زمینه‌های مختلف برای شناسایی الگو و طبقه‌بندی بهترین نتایج را کسب کنند. این مدل‌ها از واحد‌های کوچکی به نام نورون ساخته می‌شوند که ساده شده سلول‌های نورونی مغز هستند و با دریافت ورودی تا حد مشخصی بر اساس یک تابع فعال ساز فعال شده و به نورون‌های بعدی سیگنال می‌فرستند. این مدل‌ها از میلیون‌ها متغیر ساخته شده‌اند که بر اساس داده‌های آموزشی و الگوریتم‌هایی مانند backpropagation مقدار دهی می‌شوند.  این شبکه‌ها حتی توانستند در مواردی مانند یک نتیجه از DeepMind گوگل از انسان هم بهتر رابطه بین اشیا در تصاویر را تشخیص دهند. اما این به معنای کامل بودن مدل‌های شبکه عصبی نیست.


ادامه مطلب