Заседание No. 8, Распознавание рукописных математических формул

Докладчик: А. Ю. Сапаров (УдГУ, Ижевск)
Дата: 24 января 2014
Время: 13:00
Место: зал ученого совета ИПС
Аннотация:

Доклад посвящен использованию регулярных выражений и основных элементов теории графов в задаче распознавания математических формул. Основная проблема в распознавании рукописных математических формул состоит в том, что эти тексты, как правило, состоят из большого числа маленьких фрагментов, расположенных в соответствии с некоторыми строгими правилами. Несмотря на то, что формальное определение синтаксиса математических текстов может вовлекать бесконтекстные грамматики и даже более сложные конструкции, на практике часто для успешного распознавания достаточно определения математического языка на базе регулярных выражений. Поскольку некоторые конструкции в математических текстах могут встречаться чаще других, мы вводим понятие взвешенного регулярного выражения. Веса в нём определяют предпочтение одних конструкций перед другими. Вводится математический
аппарат для использования таких выражений при распознавании. Вводятся понятия двухуровневых и двумерно ориентированных графов,
которые позволяют описывать сложные изображения, состоящие из иерархии частей с особым взаимным расположением. Рассматривается специальное отображение, которое из математической формулы строит соответствующий двумерно ориентированный граф, называемый графом изображения формулы. Описывается метод решения задачи распознавания, основанного на
обратной задаче получения графа изображения формулы.