کد خبر 160593
تاریخ انتشار: ۱۵ مهر ۱۳۹۱ - ۱۴:۳۲

در تابستانی که گذشت گوگل با نرم افزار مغز مجازی خود یک نقطه تحول جدید در حوزه هوش مصنوعی ایجاد کرد.

به گزارش مشرق، نرم‌افزاری که می‌تواند با تماشا کردن ویدیوهای یوتوب، گربه‌ها، چهره آدم‌ها و سایر چیزها را تشخیص دهد. این تکنولوژی که بر اساس طرز کار سلول‌های مغز طرح‌ریزی شده، حالا به کار افتاده تا محصولات گوگل را هوشمندتر از قبل کند و تشخیص گفتار اولین سرویس گوگل است که از آن بهره می‌برد.

نارنی نوشت؛ نرم‌افزار خودآموز گوگل بر اساس گروه‌های مجازی از سلول‌های به هم پیوسته مغز مصنوعی کار می‌کند، آنها با یکدیگر تماس بر قرار کرده و در این ضمن بر یکدیگر تأثیر می‌گذارند. وقتی این شبکه عصبی در معرض داده‌ها قرار می‌گیرد، ارتباط بین عصب‌های مختلف تغییر می‌کند و این باعث می‌شود که کل شبکه قابلیت نشان دادن واکنش‌های معین به داده‌های دریافتی از یک نوع خاص را از خود بروز دهد و به قول معروف، چیز یاد بگیرد.



شبکه‌های عصبی مجازی سال‌ها است که در زمینه ماشین‌های دارای قدرت یادگیری به کار می‌روند، مثلاً نرم‌افزار شطرنج‌باز یا نرم‌افزارهای تشخیص چهره. و حالا مهندسین گوگل راهی را پیدا کرده‌اند تا قدرت رایانشی را پشت این رویکرد تکنولوژیک قرار دهند و با بردن آن به ورای مرزها قبلی، شبکه‌های عصبی دارای قدرت یادگیری "بدون کمک انسان" را بسازند و نتیجه کارشان آنقدر قوی شده که می‌تواند به صورت تجاری هم مورد استفاده قرار بگیرد.

شبکه‌های عصبی شاغل در گوگل به جای پرسیدن از انسان، می‌توانند برای خودشان تصمیم بگیرند که برای شناسایی اشیا، به چه داده‌هایی توجه نشان داده و کدام الگوها، رنگ‌ها و اَشکال را بررسی کنند.

گوگل اکنون از این شبکه‌های عصبی مجازی برای تشخیص بهتر گفتار استفاده می‌کند و علت نیز در اهمیت روز افزون دستیارهای صوتی بر روی تلفن‌های هوشمند است که به زمینه‌ای مهم برای رقابت کمپانی‌ها تبدیل شده‌اند. وینسنت وان‌هوک از مدیران بخش تشخیص گفتار در گوگل می‌گوید: «ما در زمینه تشخیص کلماتی که اشتباه هستند، بین 20 تا 25 درصد پیشرفت کرده‌ایم، این یعنی تعداد بیشتر از افراد تجربه‌ای بدون اشکال را خواهند داشت.» شبکه عصبی فعلاً فقط برای زبان انگلیسی با تلفظ امریکایی کار می‌کند ولی وان‌هوک می‌گوید که پیشرفت‌های مشابه، بعد از عرضه این تکنولوژی برای سایر زبان‌ها، میسر خواهد بود.

با کمک تکنولوژی جدید، سایر محصولات گوگل نیز به مرور پیشرفت خواهند کرد. برای مثال ابزار جستجوی تصاویر قادر خواهد شد که عکس‌ها را بدون استناد به متن مربوط به آنها، شناسایی کند. همین‌طور اتومبیل‌های بدون راننده گوگل و پروژه گوگل گلس نیز از این تکنولوژی هوش مصنوعی برای درک بهتر دنیای پیرامون خود بهره خواهند برد.

تکنولوژی جدید گوگل زمانی به تیتر خبرها تبدیل شد که مهندسین این کمپانی نتایج آزمایش شناسایی اشیا و جاندارن بر روی 10 میلیون عکس گرفته شده از ویدیوهای یوتوب را ارائه کردند؛ آزمایشی که طی 10 روز کاری مداوم و با استفاده از 1000 کامپیوتر با 16 هزار پردازنده به دست آمده بودند.

جف دین، یکی از مهندسینی که آن تجربه را هدایت می‌کرد، می‌گوید: «اکثر محققین مدل‌های خودشان را روی یک دستگاه اجرا می‌کنند ولی ما می‌خواستیم تجربه را روی شبکه‌های وسیع عصبی انجام دهیم. اگر شما هم اندازه مدل و هم حجم داده‌های اجرا شده در آن را افزایش دهید، قادر به ایجاد برتری‌های آشکار و قابلیت‌های پیچیده‌تر خواهید شد.»

شبکه‌های عصبی به دست آمده از آن فرآیند، منعطف‌تر هستند. آقای دین می‌گوید: «به طور نمونه این مدل‌ها می‌توانند متن‌های بسیار بزرگتری را دریافت کنند.» او یک مثال از تشخیص گفتار می‌دهد. برای مثال، سیستم گوگل یاد گرفته که اگر کسی گفت «من میخوام یه سرخ‌آلو بخورم» ولی کلمه "سرخ‌آلو" را بد تلفظ کرد، خودش بر اساس تجربه‌های قبلی که از شنیدن جمله‌ها به دست آمده، تردید خود را بر طرف کند زیرا سرخ‌آلو یک میوه است و از لحاظ متنی با سیب یا پرتقال یکی به شمار می‌رود.

آقای دین می‌گوید که گروهش در حال تست کردن مدل‌هایی است که تصویر و متن را هم می‌فهمند:‌ «شما بهش کلمه گراز ماهی را می‌دهید و آن هم به شما تصاویری از آن می‌دهد. یا اگر تصویر گراز ماهی را نشانش دهید، برای شما کلمه گراز ماهی را می‌نویسد.»

کار گوگل می‌تواند ما را یک گام به رسیدن به یکی از اهداف هوش مصنوعی نزدیک کند؛ یعنی ساختن نرم‌افزاری که بتواند با هوش حیوانات یا حتی انسان‌ها برابر کند. یوشائو بنجیو که از اساتید دانشگاه مونترئال است و روی تکنیک‌های هوش مصنوعی کار می‌کند، می‌گوید: «این است مسیر درستی که به ساخت هوش مصنوعی در مقیاس عام منتج می‌شود. اگر نتوانید انبوه اطلاعات در حجم وسیع را ارائه کنید راهی برای ساخت شبکه هوش مصنوعی وجود ندارد. ما فهمیده‌ایم که شبکه‌های خودآموز عصبی که [توسط گوگل] استفاده می‌شوند از روش‌هایی درست مشابه یافتن اشیا واقعی توسط مغز انسان، بهره می‌برند.»

آقای دین با محافظه‌کاری سعی می‌کند در حرف‌هایش به نزدیک بودن عملکرد شبکه مصنوعی به مغز انسان اشاره‌ای نکند ولی نمی‌تواند جلوی خودش را بگیرد و می‌گوید که اگر مسیر درست را طی کنند، شبکه گوگل سرانجام می‌تواند مغز انسان را شکست دهد.

او می‌گوید: «در برخی زمینه‌های بصری عملکرد شبکه مصنوعی بهتر از مغز انسان است» و برای مثال به برچسب زدن پلاک خانه‌ها در تصاویر استریت ویو نقشه‌های گوگل اشاره می‌کند: «شروع کرده‌ایم به استفاده از شبکه‌های عصبی برای تشخیص اینکه یک عدد در عکس‌ها، پلاک خانه است یا چیز دیگر» و مشخص شده که نتایج بهتر از نتایج انسانی هستند.

این یک پیروزی کوچک است و با آنکه هنوز هوش مصنوعی از هوش انسانی عقب است ولی این طلیعه آنها را به آینده کارشان امیدوار کرده.