آخرین اخبار
facebook Telegram RSS ارسال به دوستان نسخه چاپی
کد خبر : 26429
تاریخ انتشار : 16 اردیبهشت 1392 9:49
تعداد بازدید : 499

با هدف تولید ماشین ترجمه

پیکره موازی انگلیسی- فارسی با نام «میزان» ارایه شد

پیکره موازی دوزبانه انگلیسی- فارسی با نام «میزان»، با یک میلیون جمله هم تراز شده به عنوان پایه و اساس تولید ماشین های ترجمه آماری تهیه شده است و در صورت نیاز در اختیار سازمان ها، نهادها، دانشگاه ها ، مراکز علمی و پژوهشگران قرار خواهد گرفت.

دبیرخانه شورای عالی اطلاع‌رسانی- یکی از بنیادی‌ترین نیازها برای تولید ماشین ترجمه آماری، تولید پیکره‌ای موازی است و این دبیرخانه با توجه به اهمیت موضوع در حوزه گسترش خط و زبان فارسی در محیط رایانه‌ای، تهیه پیکره موازی انگلیسی-فارسی با یک میلیون جمله را در دستور کار خود قرار داد. پیکره موازی از متونی تشکیل می‌شود که برای هر جمله از آن در یک زبان ترجمه معادل آن در زبان دیگر آورده می‌شود. مترجم ماشینی با استفاده از چنین پیکره‌ای، فرآیند ترجمه را فراگرفته و پس از گذراندن مرحله آموزش، می‌تواند برای ترجمه جملات جدید مورد استفاده قرار گیرد.به دلیل نیاز شدیدی که به پیکره‌های موازی در تولید ماشین‌های ترجمه آماری وجود دارد، محققان علاوه بر تحقیقات فراوانی که در زمینه چگونگی یادگیری فرآیند ترجمه و الگوریتم‌های ترجمه آماری انجام داده‌اند، تلاش‌های زیادی نیز در زمینه پیکره‌های موازی و مسایل مربوط به آنها انجام داده‌اند. با وجود همه تلاش‌ها و تحقیقاتی که در زمینه تولید پیکره‌های موازی صورت گرفته، متاسفانه تاکنون پیکره مناسبی که بتواند نیازهای محققان فارسی‌زبان را برآورده کند، برای زبان فارسی تهیه نشده بود. بر این اساس در مرحله اول پروژه به امکان‌سنجی و راه‌کارها و منابع ممکن برای تولید چنین پیکره‌ای پرداخته شد و سپس ابزار لازم برای الکترونیکی کردن منابع و هم‌ترازی آنها توسعه یافت و در انتها با به‌کارگیری افراد متخصص پیکره‌ای با یک میلیون جمله هم‌تراز شده ایجاد شد.گفتنی است راه‌اندازی سامانه ترجمه آماری پایه با عنوان «مترجم بر خط» با همکاری دانشگاه علم و صنعت و دبیرخانه شورای عالی اطلاع‌رسانی از جمله کاربردهای عملی تهیه پیکره موازی انگلیسی-فارسی میزان است که اکنون به صورت آزمایشی با آدرس www.machinetranslation.ir در دسترس علاقه‌مندان قرار گرفته است. نتایج ارزیابی‌ها نشان می‌دهد که به‌رغم ساده و پایه بودن این سامانه ترجمه، کیفیت ترجمه بر اساس شاخص‌های بین‌المللی (مانند شاخص بلو) در مقایسه با سامانه‌های مشابه ترجمه ماشینی انگلیسی به فارسی قابل قبول است. دریافت این پیکره پس از تکمیل کاربرگ الکترونیکی در قالب تفاهم‌نامه از طریق آدرس www.dadegan.ir/catalog/mizan در اختیار سازمان‌ها، نهادها، دانشگاه‌ها‌، مراکز علمی و پژوهشگران قرار خواهد گرفت.


نظر شما



نمایش غیر عمومی
تصویر امنیتی :