همانطور که در قسمت اول پادکست DemoVersion اشاره کردیم مسابقه Alexa Prize یک مسابقه چند میلیون دلاری است که هر ساله آمازون به امید ساخت یک گفتگوی مشابه انسان آن را برگزار میکند. در سال سال گذشته تیم دانشگاه واشنگتن توانست یک Chatbot بسازد که به صورت میانگین گفتگوهای موفقیت آمیزی بالای ده دقیقه داشت. این پست وبلاگ به صورت خلاصه از مطالبی که در گزارش Verge آمده گرفته شده و همچنین در بخشهایی تالیف شده است.
تیمها به صورت کلی از دو روش مختلف برای Chatbotها استفاده میکنند اولین روش استفاده از یادگیری ماشین و به صورت ویژه یادگیری عمیق است که با حجم انبوهی از داده که به نحو مختلفی به دست میآید آموزش میبینند و کار میکند. اما تیمها به این عقیده هستند که این غیرعملیاتیترین روش است و هرکسی با یادگیری ماشین شروع میکند و همه متوجه میشوند که این در عمل کار نمیکند. علیرغم پیشرفتی که یادگیری ماشین در امور مختلف داشته اما هنوز یک مکالمه در انگلیسی مدرن برای آن بسیار پیچیدهتر از آن هست که از داده یاد بگیرد.
روش دوم استفاده از handcrafting یا hardcoding است در این روش درختهایی از مکالمه تشکیل شده و تقریبا تمام مکالمه از پیش توسط یک تیم برنامه ریزی میشود. مثلا وقتی کاربر در سوالش عبارت «تیم مورد علاقه» باشد. chatbot در جواب در مکالمه به دنبال این میگردد که ببیند از چه ورزشی نام برده شده و یک تیم در آن ورزش را به عنوان تیم مورد علاقه خودش میگوید. همچنین عضوی از تیم دیگر هم گفت که علایق این chatbotها را از بررسی علایق تعداد زیادی سلبریتی انتخاب میکنیم. هدف این است که این باتها علایق جالب و جذابی داشته باشند.
همچنین تیمها درحال ترکیب خلاقیتهایی که یادگیری ماشین میتواند داشته باشد و ساختارهای فرمالی که با hardcoding ساخته میشود نیز هستند. نکته دیگری که در این مقاله بهش اشاره شده بود استفاده از بردار طیفی کلمات یا Word Embeddingها است. Word Embedding یک کلمه را به به تعداد مشخص عدد اعشاری تبدیل میکند. کلیت این قضیه بر اساس این است که میتوان معنای یک کلمه را بر اساس مکانهایی که در آن رخ میدهد(کلمات اطراف) فهمید. این اعداد اعشاری که بدست میآیند قابلیتهای جالبی دارند مثلا فاصله کسینوسی دو کلمه مشابه مثل شغل و کار در آنها زیاد است. یا قابلیت دیگری که اگر از بردار king بردار man را کم کنیم به بردار queen میرسیم. این قابلیت باعث میشود که سیستم بتواند درکی از کلماتی که کمتر دیده است نیز داشته باشد و با داشتن یک ساختارهای فرمالی که با hardcoding ساخته شدهاند برای بقیه جلمات و کلماتی که در این ساختار گنجانده نشده هم قابل استفاده باشد.
همچنین یک تیم به Verge گفت که از Amazon Mechanical Turk در سیستمشان استفاده کرده است. سرویس Mechanical Turk به این صورت است که یک API برنامه نویسی در اختیار شرکتها قرار میدهد که در سمت دیگر آن تعدادی کارمند به صورت 24 ساعته در تمامی روزهای هفته در حال انجام کارهایی هستند که نیاز به هوش انسان دارند. برای مثال این کارها میتواند نام گذاری یک تصویر باشد یا تبدیل صوت به متن باشد یا ترجمه ماشینی باشد. این تیم در صورتی که chatbot قادر به پاسخگویی نبود پاسخ را به Mechanical Turk واگذار میکند و سپس از جوابی که به این پیغام داده شده برای بهبود سیستم خودش استفاده میکند.
از جهات مختلف استراتژی آمازون در دستیارهای صوتی مثل استراتژی این کمپانی در سرویس AWS است که توان محاسباتی و ذخیره سازی را در اختیار کمپانیهای دیگر قرار میدهد. با Alexa آمازون یک رابط کاربری صوتی را میتواند در اختیار شرکتها قرار دهد. اگر هوش محدودهای در آینده مورد توجه بیشتری قرار گیرد Alexa سیستم عامل برتر آن خواهد بود به نوعی مانند سیستم عامل Windows برای پردازش صدا میشود.
تیمهای حاضر در Alexa Prize در حال رویاپردازیهای بسیار بزرگتر از سیستم فعلی هستند. به دنبال این هستند که بتوانیم با کامپیوترهایمان صحبت کنیم و مکالمه داشته باشیم و نه اینکه فقط دستور بدهیم. کامپیوتری را تصور کنید که مثل یک انسان صحبت میکند اما به اندازه کل اینترنت دانایی دارد و صبر و انعطافپذیری یک ماشین را نیز دارا هست. تصور کنید صدایی شبیه سلبریتی مورد علاقه یا کسی که میشناختید و دوستش داشتید داشته باشد. تصور کنید چقدر زمان شما میتوانید با همچین دستگاهی سپری کنید.
محققین میگویند ممکن است در امسال جایزه 1.5 میلیون دلاری را تیمی برنده شود اما همگی توافق دارند که یک مکالمه واقعی همچنان یک چشم انداز طولانی مدت است. چالش اصلیای که اعضای تیم Sounding Board در ساخت یک مکالمه خوب مطرح میکنند عمق مکالمه، درک و خرد ماشین است. هاوو فانگ در این رابطه میگوید: «ما نمیتوانیم مکالمات عمیقتری داشته باشیم زیرا نمیتوانیم هرچیزی را که کاربر میگوید بفهمیم. و همچنین نمیتوانیم از داده آموزشی که در حال یادگیری آن هستیم همه چیز را بفهمیم.»
تکنیکهای استفاده شده توسط تیمهای شرکت کننده در Alexa Prize هوشمندانه و شایسته تحسین است، اما chatbotها هنوز مسیر طولانیای را تا پر کردن اختلافشان با استعداد انسان در مکالمه دارند.