همانطور که در قسمت اول پادکست DemoVersion اشاره کردیم مسابقه Alexa Prize یک مسابقه چند میلیون دلاری است که هر ساله آمازون به امید ساخت یک گفتگوی مشابه انسان آن را برگزار می‌کند.  در سال سال گذشته تیم دانشگاه واشنگتن توانست یک Chatbot بسازد که به صورت میانگین گفتگوهای موفقیت آمیزی بالای ده دقیقه داشت. این پست وبلاگ به صورت خلاصه از مطالبی که در گزارش Verge آمده گرفته شده و همچنین در بخش‌هایی تالیف شده است.

تیم‌ها به صورت کلی از دو روش مختلف برای Chatbotها استفاده می‌کنند اولین روش استفاده از یادگیری ماشین و به صورت ویژه یادگیری عمیق است که با حجم انبوهی از داده که به نحو مختلفی به دست می‌آید آموزش می‌بینند و کار می‌کند. اما تیم‌ها به این عقیده هستند که این غیرعملیاتی‌ترین روش است و هرکسی با یادگیری ماشین شروع می‌کند و همه متوجه می‌شوند که این در عمل کار نمی‌کند. علیرغم پیشرفتی که یادگیری ماشین در امور مختلف داشته اما هنوز یک مکالمه در انگلیسی مدرن برای آن بسیار پیچیده‌تر از آن هست که از داده یاد بگیرد.
روش دوم استفاده از handcrafting یا hardcoding است در این روش درخت‌هایی از مکالمه تشکیل شده و تقریبا تمام مکالمه از پیش توسط یک تیم برنامه ریزی می‌شود. مثلا وقتی کاربر در سوالش عبارت «تیم مورد علاقه» باشد. chatbot در جواب در مکالمه به دنبال این می‌گردد که ببیند از چه ورزشی نام برده شده و یک تیم در آن ورزش را به عنوان تیم مورد علاقه خودش می‌گوید. همچنین عضوی از تیم دیگر هم گفت که علایق این chatbotها را از بررسی علایق تعداد زیادی سلبریتی انتخاب می‌کنیم. هدف این است که این بات‌ها علایق جالب و جذابی داشته باشند.
همچنین تیم‌ها درحال ترکیب خلاقیت‌هایی که یادگیری ماشین می‌تواند داشته باشد‌ و ساختارهای فرمالی که با hardcoding ساخته می‌شود نیز هستند. نکته دیگری که در این مقاله بهش اشاره شده بود استفاده از بردار طیفی کلمات یا Word Embeddingها است. Word Embedding یک کلمه را به به تعداد مشخص عدد اعشاری تبدیل می‌کند. کلیت این قضیه بر اساس این است که می‌توان معنای یک کلمه را بر اساس مکان‌هایی که در آن رخ می‌دهد(کلمات اطراف) فهمید. این اعداد اعشاری که بدست می‌آیند قابلیت‌های جالبی دارند مثلا فاصله کسینوسی دو کلمه مشابه مثل شغل و کار در آنها زیاد است. یا قابلیت دیگری که اگر از بردار king بردار man را کم کنیم به بردار queen می‌رسیم. این قابلیت باعث می‌شود که سیستم بتواند درکی از کلماتی که کمتر دیده است نیز داشته باشد و با داشتن یک ساختارهای فرمالی که با hardcoding ساخته شده‌اند برای بقیه جلمات و کلماتی که در این ساختار گنجانده نشده هم قابل استفاده باشد.
همچنین یک تیم به Verge گفت که از Amazon Mechanical Turk در سیستم‌شان استفاده کرده است. سرویس Mechanical Turk به این صورت است که یک API برنامه نویسی در اختیار شرکت‌ها قرار می‌دهد که در سمت دیگر آن تعدادی کارمند به صورت 24 ساعته در تمامی روزهای هفته در حال انجام کارهایی هستند که نیاز به هوش انسان دارند. برای مثال این کارها می‌تواند نام گذاری یک تصویر باشد یا تبدیل صوت به متن باشد یا ترجمه ماشینی باشد. این تیم در صورتی که chatbot قادر به پاسخگویی نبود پاسخ را به Mechanical Turk واگذار می‌کند و سپس از جوابی که به این پیغام داده شده برای بهبود سیستم خودش استفاده می‌کند.
از جهات مختلف استراتژی آمازون در دستیارهای صوتی مثل استراتژی این کمپانی در سرویس AWS است که توان محاسباتی و ذخیره سازی را در اختیار کمپانی‌های دیگر قرار می‌دهد. با Alexa آمازون یک رابط کاربری صوتی را می‌تواند در اختیار شرکت‌ها قرار دهد. اگر هوش محدوده‌ای در آینده مورد توجه بیشتری قرار گیرد Alexa سیستم عامل برتر آن خواهد بود به نوعی مانند سیستم عامل Windows برای پردازش صدا می‌شود.
تیم‌های حاضر در Alexa Prize در حال رویاپردازی‌های بسیار بزرگتر از سیستم فعلی هستند. به دنبال این هستند که بتوانیم با کامپیوتر‌هایمان صحبت کنیم و مکالمه داشته باشیم و نه اینکه فقط دستور بدهیم. کامپیوتری را تصور کنید که مثل یک انسان صحبت می‌کند اما به اندازه کل اینترنت دانایی دارد و صبر و انعطاف‌پذیری یک ماشین را نیز دارا هست. تصور کنید صدایی شبیه سلبریتی مورد علاقه یا کسی که می‌شناختید و دوستش داشتید داشته باشد. تصور کنید چقدر زمان شما می‌توانید با همچین دستگاهی سپری کنید.
محققین می‌گویند ممکن است در امسال جایزه 1.5 میلیون دلاری را تیمی برنده شود اما همگی توافق دارند که یک مکالمه واقعی همچنان یک چشم انداز طولانی مدت است. چالش اصلی‌ای که اعضای تیم Sounding Board در ساخت یک مکالمه خوب مطرح می‌کنند عمق مکالمه، درک و خرد ماشین است. هاوو فانگ در این رابطه می‌گوید:‌ «ما نمی‌توانیم مکالمات عمیقتری داشته باشیم زیرا نمی‌توانیم هرچیزی را که کاربر می‌گوید بفهمیم. و همچنین نمی‌توانیم از داده آموزشی که در حال یادگیری آن هستیم همه چیز را بفهمیم.»
تکنیک‌های استفاده شده توسط تیم‌های شرکت کننده در Alexa Prize هوشمندانه و شایسته تحسین است، اما chatbotها هنوز مسیر طولانی‌ای را تا پر کردن اختلافشان با استعداد انسان در مکالمه دارند.