گپ با هوش‌مصنوعی به لهجه‌های شیرین فارسی

داستان استارتاپ ایرانی ساکن «استیشن اف» که یک دستیار صوتی مشابه «الکسا» و «سیری» ساخته‌ است، ‌با این تفاوت که زبان فارسی و حتی لهجه‌های مختلف را می‌فهمد و به حرف‌های کاربر جواب می‌دهد.

گپ با هوش‌مصنوعی به لهجه‌های شیرین فارسی

از بچگی عاشق کارهای عجیب و غریب بود؛‌ عاشق ساختن روبات‌ و بعدتر برنامه‌نویسی، اما دست‌آخر زبان‌شناس و در نهایت زبان‌شناس کامپیوتری شد. سرنوشت، بازی بامزه‌ای را با سمیه باقربیگی شروع کرده بود. او را یک دور، بین تمام چیزهایی که دوست داشت، گرداند و بعد تمام آنچه در این سال‌ها آموخته بود، از زبان‌شناسی گرفته تا برنامه‌نویسی و... به کارش آمد تا بتواند آن را در یکی از پروژه‌های خاص در حوزه هوش مصنوعی ایران به‌کار بگیرد؛ ‌پروژه‌ای که زندگی او را از نظر حرفه‌ای و البته شخصی کاملا تغییر داد. سمیه باقربیگی و همسرش اکنون استارتاپ «های‌برینی» را که سال‌ها در ایران فعال بود، به فرانسه برده‌اند تا در استیشن‌ اف، بزرگ‌ترین مجتمع استارتاپی جهان در مقیاس جهانی، کارشان را پیش ببرند. این داستان زندگی سمیه باقربیگی و استارتاپ خاصی است که محصولاتی در حوزه پردازش متن، گفتار و تصویر ارائه می‌کند. جالب‌ترین آنها که توجه زیادی را در دنیا به‌خودش جلب کرده و به قول باقربیگی باعث شده سرمایه‌گذارهای خارجی با گفتن WOW ابراز تعجب کنند، دستیار شخصی «پارسی» است؛ سامانه‌ای شبیه دستیارهای صوتی خارجی مثل الکسا و سیری اما به زبان فارسی؛ سامانه‌ای که خودشان می‌گویند از رقبای خارجی بهتر کار می‌کند، لهجه‌های مختلف را می‌فهمد و بعد از درک آنچه کاربر می‌گوید، جواب مناسب را برایش ارائه می‌کند. سمیه باقر‌بیگی در گفت‌وگو با همشهری از جزئیات و فراز و نشیب‌های فعالیت استارتاپی تا رسیدن به نقطه کنونی گفته است.

داستان یک سفر علمی

تولید دستیار صوتی یک‌شبه اتفاق نمی‌افتد. سمیه باقربیگی هم بعد از تحصیل در رشته‌های مختلف ازجمله زبان‌شناسی و برنامه‌نویسی، چند سالی در آزمایشگاه‌های مرتبط مشغول فعالیت بود تا بتواند رسما و به‌طور مستقل روی ساخت نرم‌افزارهایی هوشمند کار کند که تازه بازارشان در ایران رو به رشد بود.

اولین نرم‌افزار مستقل

اولین پروژه مستقل سمیه باقربیگی و همسرش، مهدی گلزارنیا، سامانه‌ای بود که بعدها به نام «اولین موتور صوتی فارسی تلفن‌همراه» مشهور شد. بازار هدف این محصول ابتدا افراد کم‌بینا و نابینا بود. این برنامه می‌توانست برایشان متن پیامک یا هرچیزی که به‌صورت نوشتاری در صفحه گوشی ظاهر می‌شد را بخواند. از آنجا که عمده بازار ایران در آن زمان در دست نوکیا بود، این برنامه برای موبایل‌های آن شرکت تهیه شده بود. سمیه باقربیگی می‌گوید: «برخوردها با ما در سازمان بهزیستی به‌شدت بد و غیرحرفه‌ای بود. تا جایی که به‌خودم قول دادم، هرگز به آنجا برنگردم، ‌حتی اگر به باختم منجر شود». جامعه هدف کوچک و برخوردهای نامناسب در بعضی سازمان‌ها باعث شد، کم‌کم به فکر بازارهای دیگری بیفتند.

تلاش برای فهمیدن لهجه‌های ایرانی

مدتی بعد، هردو تصمیم گرفتند سامانه تبدیل متن به گفتار تلفنی را برای سامانه‌های تلفنی تولید کنند؛ سامانه‌ای که می‌توانست روی تلفن‌بانک، منشی تلفنی و... کار کند. این ماژول می‌توانست مشتری‌های بزرگی مثل بانک‌ها و شرکت‌های بزرگ را هم جلب کند. واقعا هم همین‌طور شد. چند بانک و سازمان از این سامانه روی تلفنبانک و سامانه‌های تلفنی خود استفاده کردند. برای توسعه پروژه‌ها و به‌دست‌آوردن سهم بزرگ‌تری از بازار، ‌تصمیم‌ گرفتند روی محصولات دیگری در حوزه هوش مصنوعی کار کنند؛ در نتیجه سامانه‌های جدید تشخیص چهره، نویسه‌خوان نوری، چت‌بات و سامانه‌های بازشناسی گفتار را راه‌اندازی کردند. باقربیگی می‌گوید: «یکی از جالب‌ترین پروژه‌‌ها، سامانه دستیار صوتی بود؛ چیزی شبیه سیری در آیفون که در آن کاربر می‌تواند دستوراتش را به‌صورت صوتی ارائه کند و دستگاه براساس الگوهایی که برایش تعریف شده، پاسخ‌هایی مناسب دهد. این سامانه می‌تواند لهجه‌های مختلف را شناسایی کرده و پاسخ مناسب ارائه کند». برای اینکه سامانه، دستورهای کاربر را دقیق‌تر و بهتر تشخیص بدهد، ‌باید پیکره گفتاری بزرگی درست می‌کردند. یکی از بهترین راه‌ها این بود که بایگانی صداهای آدم‌های واقعی که کلمات خاصی را تلفظ می‌کنند در اختیار داشته باشند و بتوانند از طریق آن، به دستگاه آموزش دهند. گروه با ایده جمع‌سپاری توانستند نزدیک به 2هزار ساعت گفتار از لهجه‌های مختلف را جمع‌آوری کنند، برچسب بزنند و الگوریتم‌های خود را با این دیتا آموزش دهند.

بومی‌سازی در ایران، توسعه در جهان

چت‌بات‌های فارسی الان هم وجود دارند اما از آنجا که برای تشخیص گفتار از سرویس‌های گوگل استفاده می‌کنند، عملکردشان در بعضی موارد نقص دارد. برای پوشاندن این نقطه ضعف، سمیه باقربیگی و همکارانش صفر تا صد ماجرا را خودشان انجام دادند و الگوریتم‌های یادگیری ماشینی خودشان را تولید کردند و همین باعث می‌شود امکان شخصی‌سازی خدمات براساس درخواست مشتری فراهم باشد. ضمن اینکه چون گواهی تمام خدمات در شرکت تولید شده است، می‌توانند سرویس‌ها را روی سرور مشتری ارائه کنند، ‌بدون اینکه به اتصال به سرورهای واسطه‌ای مثل سرویس‌های گوگل نیاز باشد. با این روش، امنیت سرویس بهتر تامین می‌شود؛‌ مسئله‌ای که به‌خصوص برای بانک‌ها اهمیت زیادی دارد. شرکت حالا و در میانه مسیر، 5سامانه مختلف را از صفر تا صد طراحی، پیاده‌سازی و تولید کرده است.
این محصولات به‌صــورت Web API و Offline SDK برای برنامه‌نویسان ارائه می‌شود. با این حساب، برنامه‌نویسان می‌توانند با استفاده از API تشخیص چهره یا بازشناسی گفتار در برنامه‌های خودشان استفاده کنند. اکنون پلتفرم این استارتاپ، زبان فارسی را پشتیبانی می‌کند و برنامه آینده‌شان این است که زبان انگلیسی و فرانسه را نیز به پلتفرم خود اضافه کنند.

پژوهش در یک آزمایشگاه حرفه‌ای
چند سالی که از ورود به دانشگاه گذشت، فهمید علایق دیگری هم دارد. سمیه باقربیگی عاشق فلسفه، روانشناسی و زبان‌شناسی شده بود. کارشناسی‌ارشد رشته زبان‌شناسی را هم گذراند اما در همان سال‌ها اتفاق عجیبی در دانشگاه شهیدبهشتی رخ داد؛ آن‌هم ساخت یک آزمایشگاه خاص بود که زبان را با رایانه مرتبط می‌کرد؛ آزمایشگاه پردازش زبان طبیعی به سرپرستی دکتر شمس فرد. خودش دراین‌باره می‌گوید: «تز فوق‌لیسانس من ساخت نیمه‌خودکار شبکه واژگانی افعال بود. در این پروژه دکتر شمس فرد استاد راهنمای من بودند و دکتر دبیرمقدم، رئیس گروه زبان‌شناسی دانشگاه علامه نیز مشاورم». کارکردن روی این پروژه خیلی بیشتر از آنچه تصور می‌کرد، زمان برد و برای پیشبرد آن، باید از همه مهارت‌هایش استفاده می‌کرد. همزمان به‌صورت پاره وقت در شرکت نرم‌افزاری‌ای کار می‌کرد که در همان جا، سمیه با همسر فعلی‌اش مهدی گلزارنیا آشنا شد؛ مردی که از همان زمان به او کمک کرد بتواند تزش را به شکل مناسبی ارائه کند. او و مهدی با هم ساختار جدیدی را شکل دادند که حالا به پایتخت فرانسه رسیده است.

گپ با هوش‌مصنوعی به لهجه‌های شیرین فارسی

مهاجرت استارتاپ‌ها فرار مغزها نیست

با وجود موفقیت‌های شرکت، به‌دلیل تحریم‌ها عملا امکان سرمایه‌گذاری خارجی و توسعه فعالیت برای آنها وجود نداشت. به همین دلیل، آنها تصمیم گرفتند، برای دسترسی بهتر به بازارهای جهانی در استیشن اف حضور داشته باشند. از این طریق، شرکت امکان تعامل با سازمان‌های مشابه و شرکت‌های بین‌المللی بزرگ را به دست می‌آورد. سمیه باقربیگی می‌گوید: «هدفمان توسعه سامانه‌های ایرانی در یک بازار بین‌المللی است و این امکانات در فضایی مثل استیشن اف به خوبی فراهم شده است». ‌ او درباره اینکه رفتن استارتاپ‌ها از کشور به فرار مغزها تشبیه می‌شود، چندان خوشحال نیست و می‌گوید: «شرکت‌های استارتاپی برای توسعه بازارشان ناچار به تعامل با جهان و ارائه سرویس‌های خود به بازار جهانی هستند اما به‌دلیل تحریم‌ها و مشکلات مشابه، عملا از داخل ایران چنین امکانی فراهم نیست. ما بارها به نمایشگاه‌های مختلف خارجی رفته و توانستیم تا پای قرارداد هم پیش برویم اما صرفا به‌دلیل تحریم‌ها و مسائل بانکی نتوانستیم قراردادمان را امضا کنیم. همه ما دوست داریم کارمان را در ایران ادامه بدهیم و تجربه‌هایمان قطعا برای کشور مفید خواهد بود اما زمانی این موضوع به نتیجه می‌رسد که سایه سنگین فشار از سر ما برداشته شود».

گپ با هوش‌مصنوعی به لهجه‌های شیرین فارسی
رؤیای فارسی حرف‌زدن با روبات‌ها
سمیه باقربیگی از همان کودکی ساختن روبات و انجام کارهای عجیب را دوست داشت. این داستان سال‌های اولیه زندگی اوست که از روبات‌سازی شروع می‌شود و تا نخستین پله‌های شناخت زبان آدم‌آهنی‌ها پیش می‌رود.
شاگرد درس‌خوان بود اما خجالتی. اهل شلوغ‌بازی نبود اما زیاد مطالعه می‌کرد و فکرهای بزرگی از سرش می‌گذشت. یکی از عجیب‌ترین‌هایشان شاید ساخت یک آدم‌آهنی بود؛ ایده‌ای که در اواسط دهه60 کمتر ذهن بچه‌ها را مشغول می‌کرد. سمیه باقربیگی اما نه‌تنها به این موضوع فکر می‌کرد بلکه خیال داشت تصمیمش را هرطور هست عملی کند. اوایل تابستان 10سالگی تصمیم گرفت واقعا روبات بسازد و تمام 3ماه تابستان را در زیرزمین خانه گذراند تا تصمیمش را عملی کند. خودش می‌گوید: «روبات که نه، ‌بیشتر شبیه عروسکی بود که به آن وسایل الکترونیکی و محاسباتی مثل ماشین‌حساب وصل کرده باشند. خودم می‌دانستم کار نمی‌کند اما این آخرین حد توانم بود. می‌دانستم یک‌جای کار می‌لنگد اما نمی‌دانستم کجاست. دست‌آخر رفتم پیش مادرم تا از او بپرسم مشکل کجاست و چطور باید حلش کنم. می‌دانستم تقریبا شکست خورده‌ام. اما چهره مادر وقتی عروسک‌ روباتیک مرا دید، هیچ‌وقت یادم نمی‌رود. طوری برخورد کرد انگار واقعا بهترین روبات دنیا را درست کرده‌ام و هر دستوری که بدهیم اجرا می‌کند. تا مدت‌ها بعد همین عروسک ماشین‌حسابی را به همه نشان می‌داد و با خوشحالی می‌گفت، دخترم مهندس روبات است! حال من را در آن مواقع تصور هم نمی‌توانید بکنید؛ روی ابرها بودم».
مدتی بعد سمیه نوجوان فهمید، یکی از دلایلی که عروسک ماشین‌حسابی‌اش کار نکرده، این بوده که «برنامه‌» نداشته است. برای همین به فکرش رسید که برنامه‌نویسی یاد بگیرد. او می‌گوید: «بچه که بودم، رایانه‌های رومیزی کومودور تازه به بازار آمده بودند و پدرم بابت جایزه شاگرد اولی یکی برایم خرید. از طرفی، کلاس‌های برنامه‌نویسی جالبی در دانشگاه شهید بهشتی برگزار می‌شد که می‌توانستم در آنها به‌صورت آزاد شرکت کنم. بهتر از این نمی‌شد، هم کلاس می‌رفتم و برنامه‌نویسی تئوری یاد می‌گرفتم، هم در عمل روی کامپیوترم که آن زمان پدیده مهمی بود، همه‌چیز را تمرین می‌کردم». او در دورانی کنکور داد که همه بر سر مهندسی برق و کامپیوتر رقابت می‌کردند. اما او سراغ چیزی رفت که دوست داشت؛ «مهندسی نرم‌افزار در تمام شهرهای ایران را انتخاب کردم و دست آخر، در همین رشته‌ای که دوست داشتم پذیرفته شدم.» علایق او اما همچنان در حال تغییرکردن است. انگار هرچند سال یک‌بار، ‌سمیه باقربیگی بخش‌های جدیدی از شخصیت خودش را کشف می‌کند.

منبع: همشهری

24

شبکه‌های اجتماعی
دیدگاهتان را بنویسید

اخبار مرتبط سایر رسانه ها

    اخبار سایر رسانه ها