Особенности представления текста словоуказателя

Разработана специальная программа, позволяющая получать к введенным текстам (к каждому в отдельности или к нескольким вместе) указатели словоформ, т. е. списки словоформ с их адресами (номерами листов и строк) в рукописях.

Здесь нам также пришлось столкнуться с определенными проблемами. В алфавите, который Древняя Русь восприняла от южных славян, уже с самого начала были буквы, не имевшие особого фонетического значения; например, в нем было 3 различных буквы для звука [и], 2 буквы для [о], 2 буквы для [ф] и т. д. К XVI в. некоторые буквы поменяли свое звуковое значение уже на русской почве, в языке развились такие фонетические явления, как аканье, позиционное оглушение и озвончение шумных согласных; все это привело к тому, что одна и та же словоформа могла быть записана несколькими способами. К тому же писцы в своей работе очень часто использовали приемы сокращенного написания слов (под титлом или с выносными буквами), и в текстах житий некоторые словоформы имеют свыше 10 вариантов написания. Например: блаженагоблаженнаⷢ҇блⷶ҇женнагоблаⷤ҇еннагоблаⷤ҇ннаⷢ҇блаⷤ҇ннагобл҃женаⷢ҇бл҃женагобл҃женⷩ҇агобл҃аженнаⷢ҇бл҃аженнагобл҃жнаⷢ҇бл҃жнагобл҃жннаⷢ҇бл҃жⷩ҇наⷢ҇бл҃жнⷩ҇агобл҃жннаго.

Таким образом при написании программы составления словоуказателя нужно было решать проблему сведения графических вариантов словоформ к одному виду.

В тексте словоуказателя было произведено некоторое упрощение графики, которое позволяет более компактно представить словник:


Особая программа, написанная Тарасовой Еленой Евгеньевной и Тарасовым Евгением Анатольевичем, осуществляет частичное сведение орфографических вариантов одной и той же словоформы к единой форме:

Эта программа позволяет уменьшить объем словника на 6–10%.


Еленой Григорьевной Уфлянд была разработана процедура, позволяющая автоматически устранить следующие случаи графической и орфографической вариативности:

Применение этой процедуры к словоуказателю позволило сократить его объем более чем на 18%. Все производимые замены записываются во вспомогательный файл, что позволяет контролировать правильность работы программы.


Однако нельзя сказать, что вариативность в словоуказателе устранена полностью. Нам предстоит решить еще ряд проблем, важнейшими среди которых являются: