ترجمه ماشینی عصبی

ترجمه ماشینی عصبی چیست؟

ترجمه ماشینی عصبی (NMT) رویکردی در ترجمه‌ی ماشینی است که در آن شبکه‌ی عصبی بزرگی توسط تکنیک‌های یادگیریِ ژرف آموزش داده می‌شود. این رویکرد بسیار متفاوت از رویکرد‌های ترجمه‌ی آماریِ مبتنی بر عبارت می‌باشد. گوگل و مایکروسافت در یک روز در نوامبر ۲۰۱۶ اعلام کردند که از این تکنولوژی استفاده می‌کنند. گوگل از ترجمه ماشینی عصبی گوگل (GNMT) استفاده می‌کند و متدهای آماری پیشین خود را منسوخ می‌داند. مایکروسافت نیز از تکنولوژی ترجمه ماشینیِ مشابهی برای تمام ترجمه‌های گفتاری‌اش در زبان‌های پشتیبانی شده استفاده می‌کند.

برای بررسی بیشتر این موضوع ابتدا باید نحوه‌ی کار دو تکنولوژی ترجمه ماشینی مبتنی بر قانون، و ترجمه‌ی ماشینیِ مبتنی بر عبارت را به صورت خلاصه بررسی کنیم. سپس چند مثال و مقایسه از هر سه تکنولوژی را مشاهده می‌کنیم تا درک عمیق‌تری از ترجمه ماشینی عصبی ارائه کنیم.

یک نمای کاملاً ساده اما مفید از فرآیند ترجمه خودکار توسط مثلث زیر نشان داده می‌شود که توسط محقق فرانسوی B. Vauquois در سال ۱۹۶۸ معرفی شد:

فرآیند ترجمه خودکار در مثلث B. Vauquois

فرآیند ترجمه خودکار در مثلث B. Vauquois

این مثلث فرآیند تبدیل جمله‌ی مبدا به مقصد را در سه مرحله‌ی مختلف نشان می‌دهد. هر مرحله در این مثال نشانگر عمق تجزیه و تحلیل جمله می‌باشد. فلش قرمز رنگ اول (۱) تحلیل جمله در زبان مبدا را نشان می‌دهد. در مرحله‌ی دوم (۲)، جمله به نمایی از زبان مقصد تبدیل می‌شود که عمق کمتری دارد، که در مرحله‌ی سوم (۳)، یا همان مرحله‌ی تولید، به جملات و کلمات معنادار زبان مقصد تبدیل و منتقل می‌شود. نحوه‌ی کار مثلث به این صورت است که هرچقدر زبان مبدا را بیشتر تحلیل کنید، فاز انتقال کوچک‌تر و ساده‌تر خواهد بود. در نهایت، اگر بتوانیم زبان مبدا را به یک زبان میانی مجازی یا Interlingua تبدیل کنیم، نیازی به انجام تبدیل نیست و تنها نیازمند یک تحلیل‌گر و تولید‌کننده برای هر زبان هستیم که از هر زبانی به هر زبان دیگر ترجمه انجام دهیم.

ترجمه ماشینی مبتنی بر قانون

ترجمه ماشینی مبتنی بر قانون قدیمی‌ترین رویکرد است که چندین تکنولوژی را در بر دارد. تمام موتورهای مبتنی بر قانون دارای ویژگی‌های زیر می‌باشد:

  • فرآیند کاملاً از این مثلث پیروی کرده و معمولاً قسمت تحلیل بسیار پیشرفته است، اما بخش تولید معمولاً به حداقل رسانیده می‌شود.
  • در تمام سه مرحله، از پایگاه‌داده‌ای از قوانین و آیتم‌های واژگانی که این قوانین بر آن‌ها اعمال شدنی هستند استفاده می‌شوند.
  • این قوانین و آیتم‌های واژگانی قابل خواندن بوده و توسط یک زبان‌شناس یا واژه‌شناس می‌توانند تغییر یا اصلاح یابند.

برای مثال، نمای داخلی یک جمله می‌تواند به این شکل باشد:

ساختار داخلی یک جمله

ساختار داخلی یک جمله

در اینجا چند سطح تحلیل مشاهده می‌شود:

  • نشان‌گذاریِ ادات سخن یا نقش هر کلمه در جمله
  • تحلیل مورفولوژیکی، اینکه فعل دارای S برای شخص سوم است
  • تحلیل معنایی، برای مثال violin یک آلت موسیقی است.
  • تحلیل ساختاری و گروه‌بندی برخی کلمات
  • تحلیل وابستگی عبارت‌ها

سپس بر اساس قوانین تولیدیِ زبان مقصد این جمله به جمله‌ی مقصد تبدیل می‌شود. در این مثال زبان فرانسوی آورده شده است:

تبدیل جمله فوق با همان ساختار به زبان فرانسوی

تبدیل جمله فوق با همان ساختار به زبان فرانسوی

ترجمه ماشینی مبتنی بر عبارت

ترجمه‌ی ماشینی مبتنی بر عبارت ساده‌ترین و محبوب‌ترین نسخه‌ی ترجمه ماشینی آماری محسوب می‌شود. امروزه نیز در بسیاری از سرویس‌های ترجمه‌ی آنلاین مورد استفاده قرار می‌گیرد.

از نظر فنی، ترجمه‌ی ماشینی مبتنی بر عبارت از فرآیند تعریف شده توسط مثلث پیروی نمی‌کند. یعنی این موتور می‌تواند ترجمه‌های مختلفی برای یک جمله‌ی منبع ایجاد کند و قدرت این رویکرد در انتخاب بهترین مورد از میان این ترجمه‌هاست.

نمای ترجمه ماشینی خودکار در مثلث

نمای ترجمه ماشینی خودکار در مثلث

ترجمه‌ی ماشینی مبتنی بر عبارت بر سه منبع استوار است:

  • یک جدول عبارت که ترجمه و احتمالات عبارت‌های زبان منبع را در خود دارد.
  • یک جدول نظام‌دهی که نحوه‌ی نظم و ترتیب کلمات پس از ترجمه از زبان منبع به زبان مقصد را در خود دارد.
  • یک مدل زبانی که احتمال هر یک از توالی‌های کلمات در زبان مقصد را دیکته می‌کند.

در این سیستم‌ها مدل زبان مقصد بسیار مهم است که از الگوریتم‌های جست‌وجوی پیشرفته‌ای استفاده می‌کنند. در این مدل‌ها دانش معنایی و زبانیِ صریح و ضمنی وجود ندارد. جایگزین‌ها و انواع مختلفی برای این سیستم‌ها پیشنهاد شده است که اکثر موتورهای ترجمه‌ی آنلاین از ساده‌ترین مکانیسم‌های ترجمه ماشینی مبتنی بر عبارت استفاده می‌کنند.

ترجمه ماشینی عصبی

رویکرد ترجمه‌ی ماشینی کاملاً متفاوت از موارد پیشین است و در مثلث چنین نمایش داده می‌شود:

نمای ترجمه ماشینی عصبی در مثلث

نمای ترجمه ماشینی عصبی در مثلث

که در آن:

  • تحلیل، انکودینگ یا رمزگذاری نامیده می‌شود که نتیجه‌ی این تحلیل یک سری بردار کاملاً مبهم می‌باشد
  • انتقال، دیکودینگ یا رمزگشایی نامیده می‌شود که مستقیماً زبان مقصد را بدون فاز تولید ایجاد می‌کند. البته این یک محدودیت و قاطعیت نیست و ممکن است در آینده توسعه یافته و تغییر یابد، اما پایه و اساس این تکنولوژی به این صورت است.

در این فرآیند ابتدا هر یک از کلمه‌های جمله‌ی منبع از رمزگذار عبور کرده و به متن (Context) منبع تبدیل می‌شود که یک بردار عددی است. این بردارها خشت‌های اصلیِ این سیستم بوده و تبدیلات آن‌ها مد نظر این متن نیست. سپس مانند سیستم مبتنی بر قانون، معادل هر کلمه از طریق یک دیکشنری تک زبانه ویژه بررسی می‌شود. بخشی از معنای تولیدی توسط ترجمه‌ی ماشینی عصبی در همین فرآیند نهفته است.

فرض کنید دارای اشیای مختلفی هستید که هر کدام را باید با یک شکل و رنگ نشان دهید و سپس شکل‌ها و رنگ‌های مشابه را در کنار هم قرار دهید، یک حالت می‌تواند شکل زیر باشد:

اشیای مختلف با شکل های مختلف که مانند کلمه عمل میکنند.

اشیای مختلف با شکل‌های مختلف که مانند کلمه عمل می‌کنند.

همچنین می‌توانیم ابعاد دیگری نیز مانند سایز، رنگ، مشابهت و… را به این نمودار خود اضافه کنیم. در مرحله‌ی واژه‌یابی نیز از همین شبکه و نمودارها استفاده می‌شود، زیرا کلمات را نیز می‌توان مانند همین شکل‌ها و بر اساس ابعاد مختلف نشان داد – برای مثال می‌توان از یک نمودار ۸۰۰ بعدی استفاده کرد – و همانند شکل‌ها به آن‌ها ویژگی‌هایی تعریف کرد. برای مثال چند مورد از ابعاد می‌توانند نقش کلمه در جمله، جنسیت کلمه، منفی یا مثبت بودن و… باشد که در حالت کلی کلمه‌هایی که دارای ویژگی‌های نزدیک به هم هستند در فضای نزدیک‌تری نسبت به هم قرار خواهند گرفت.

در فرآیند ترجمه، مرحله‌ی دوم به این صورت نشان داده می‌شود:

فاز دوم در فرآیند ترجمه ماشینی عصبی

فاز دوم در فرآیند ترجمه ماشینی عصبی

همانطور که در بالا نیز اشاره شد، هر کلمه به یک Context تبدیل می‌شود، و سپس کلمه‌های متن مقصد تولید می‌شوند. در تولید متن مقصد نیز مانند تحلیل متن مبدا، کلمات به یک سری Context مقصد تبدیل می‌شوند که همواره کلمه‌ی ترجمه شده‌ی قبل را در نظر دارد. اتمام فرآیند زمانی فرا می‌رسد که دیکودر تصمیم بگیرد انتهای جمله را ترجمه و تبدیل کند.

البته فرآیند کامل ترجمه ماشینی عصبی یک فرآیند مبهم و کمی انتزاعی است که با قواعد و قوانین ریاضی و هوش مصنوعی در هم آمیخته است. اما کلیات کار به شرح بالا می‌باشد. تنها به یاد داشته باشید که ترجمه ماشینی عصبی نیز مانند ترجمه‌ی مبتنی بر قانون کار می‌کند و برای ترجمه از یک سری قانون استفاده می‌کند، اما نحوه‌ی کار با این قانون‌ها و همچنین شبکه‌ی عصبیِ کلمات به صورت برداری کاملاً متفاوت است.

منبع: systransoft.com

0 پاسخ

دیدگاه خود را ثبت کنید

آیا می خواهید به بحث بپیوندید؟
در صورت تمایل از راهنمایی رایگان ما استفاده کنید!!

پاسخ دهید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *