به گزارش مشرق به نقل از مهر، تاکنون به این مسئله فکر کرده اید که اگر می توانستید به زبان چینی، فرانسوی یا زبانی که به آن آشنایی ندارید صحبت کنید چه صدایی داشتید؟ محققان با طراحی یک نرم افزار جدید این امکان را فراهم کرده اند.
شرکت مایکروسافت برنامه ای طراحی کرده است که می تواند صدای ترجمه شده را به صدای خود فرد پخش کند.
ریک رشید محقق مایکروسافت درباره این نرم افزار اظهار داشته است که ضرورتی ندارد که تا قرن بیست و دوم صبر کنیم تا مترجمهایی چون فیلمهای علمی تخیلی ترجمه ها را میسر کنند، درحال حاضر این نرم افزار می تواند به نحو چشمگیری ترجمه ها را بهبود بخشد.
وی افزود: ممکن است نتایج اندکی خنده دار به نظر برسند اما فناوری همواره می تواند بهترین گزینه باشد.
رشید هنگام معرفی این نرم افزارطی یک کنفرانس در چین به صورت آزمایشی اظهارت خود را به زبان رسمی چینی ترجمه کرد. در ویدئو منتشر شده از این کنفرانس، صدای چینی نرم افزار دقیقا شبیه صدای رشید است اما یک لحن کلی دارد.
گفته می شود که یکی از بزرگترین چالش در ساخت این نرم افزار تشخیص گفتار کاربر است. دانشمندان علوم رایانه ای از زمان اختراع رایانه روی این مشکل کار کرده اند و ماحصل این تحقیقات در سیستمهای خودکاری است که در بانکها برای صدا کردن شماره مشتری استفاده می شود. در این سیستمها، تشخیص دهنده صدا تنها علایم و برخی از گزینه های مشخص شده را درک می کند.
براساس اظهارات رشید، برای رایانه ها دشوار است که صحبتهای فی البداهه درک کنند. اگرچه اخیرا برخی از برنامه های تشخیص گفتار می توانند 75 تا 80 درصد واژگان را که یک فرد ممکن است در طول گفتار استفاده کند را درک کند.
بخش تحقیقات مایکروسافت برای بهبود این نرخ فعالیتهای بسیاری انجام داده است، کارشناسان این بخش از برنامه های شبکه های عمیق عصبی که شبکه های متصل از پردازشگرهای رایانه ای هستند که شبیه ارتباطهای میان سلولهای مغز انسان کار می کنند، استفاده کرده است.
گوگل تابستان امسال از همین تکنیک برای ساخت رایانه ای استفاده کرده که می تواند تصاویر گربه ها را در اینترنت تشخیص دهد.
برنامه تشخیص گفتار مایکروسافت درحال حاضر می تواند به درستی 86 تا 88 درصد واژگان را در گفتار فی البداهه تشخیص دهد اما هنوز هم این میزان از گفتار بی نقص برنامه فاصله دارد.
در نرم افزار کنونی پس از تشخیص هر آنچه که کاربر به انگلیسی می گوید، نرم افزار مترجم معادل واژه آن را به زبان چینی یافته و کلمات را از نظر دستور گرامری به زبان چینی تصحیح کرده و با صدای کاربر به زبان چینی بیان می کند اما پیش از آن کاربرد باید صدای خود را برای نرم افزار ضبط کند تا امکان تقلید صدا وجود داشته باشد.
شرکت مایکروسافت اقدام به ارائه نرم افزاری کرده که می تواند هنگام صحبت کاربر ترجمه همزمان صحبتهای وی را به یک زبان دیگر اما با صدای خودش ارائه کند.