Развитие автоматической системы для перевода биомедицинских патентов в режиме реального времени

Работа исследователей TALP UPC, которая была выполнена более чем три года, есть частью совместного проекта называющиеся MOLTO в Седьмой рамочной программе ЕС . MOLTO включил сотрудничество исследовательских групп в Гетеборге (Швеция), Хельсинки (Финляндия), Утрехт (Голландия), София (Болгария) и Цюрих (Швейцария).С неспециализированной целью получения совокупности автоматического перевода на нескольких языках, каковые смогут создать отличные переводы, исследователи MOLTO трудились над тремя случаями: формулировки математических упражнений, описание объектов в модели и музей для перевода патентов, что имеет место, что участники TALP продолжили трудиться конкретно.

Как неспециализированная техника в проекте MOLTO, исследователи применяли синтаксически-семантические грамматикина основе определенных онтологий области (концептуальные схемы, каковые облегчают обмен информацией между совокупностями). Со своей стороны эти компоненты были интегрированы в то, что известно как Grammatical Framework (GF): инструмент IT, что превращает автоматические переводы на разные языки, вероятные через неспециализированное абстрактное представление. Дабы уменьшить его применение онлайн, Интерфейс прикладного программирования (API) был создан так, дабы инструмент мог быть включен в любое веб-приложение.Для дешёвого перевода способы гибридизации употреблялись, каковые объединяют статистические методы и Грамматическую Структуру.

GF формирует грамматически верные переводы, пока включение статистических способов (подобный применяемым совокупностями машинного перевода, такими как Гугл Translate) может покрыть широкие области, такие как биомедицина.Помимо этого, патенты – часть совокупности восстановления документа, которая первоначально имела возможность лишь искать документы на английском. Исходя из этого особую заботу выполняли, дабы создать способ, что поддерживает сложное размещение семантических аннотаций и признаков, каковые присутствуют в документах. Среди вторых факторов это указывает, что структура химических соединений, обрисованных в регистрах биотехнологии, может сберигаться, и документы смогут разыскиваться на языке перевода.

Итог – непроизвольный перевод патентов на английский, французский и немецкий язык (три официальных языка Европейского патентного ведомства), с добавленным преимуществом, что переводы смогут быть выполнены в реальном времени. Это крайне полезно в задаче многоязычных поисков базы данных


Бурятия Онлайн