Особенности представления текста словоуказателя

Разработана специальная программа, позволяющая получать к введенным текстам (к каждому в отдельности или к нескольким вместе) указатели словоформ, т. е. списки словоформ с их адресами (номерами листов и строк) в рукописях.

Здесь нам также пришлось столкнуться с определенными проблемами. В алфавите, который Древняя Русь восприняла от южных славян, уже с самого начала были буквы, не имевшие особого фонетического значения; например, в нем было 3 различных буквы для звука [и], 2 буквы для [о], 2 буквы для [ф] и т. д. К XVI в. некоторые буквы поменяли свое звуковое значение уже на русской почве, в языке развились такие фонетические явления, как аканье, позиционное оглушение и озвончение шумных согласных; все это привело к тому, что одна и та же словоформа могла быть записана несколькими способами. К тому же писцы в своей работе очень часто использовали приемы сокращенного написания слов (под титлом или с выносными буквами), и в текстах житий некоторые словоформы имеют свыше 10 вариантов написания. Например: блаженагоблаженнаⷢ҇блⷶ҇женнагоблаⷤ҇еннагоблаⷤ҇ннаⷢ҇блаⷤ҇ннагобл҃женаⷢ҇бл҃женагобл҃женⷩ҇агобл҃аженнаⷢ҇бл҃аженнагобл҃жнаⷢ҇бл҃жнагобл҃жннаⷢ҇бл҃жⷩ҇наⷢ҇бл҃жнⷩ҇агобл҃жннаго.

Таким образом при написании программы составления словоуказателя нужно было решать проблему сведения графических вариантов словоформ к одному виду.

В тексте словоуказателя было произведено некоторое упрощение графики, которое позволяет более компактно представить словник:

  • дублирование букв устранено: у, ѹ, , ѫ > у; , я, ѧ > я;
  • надстрочные знаки опущены, поскольку на протяжении текста рукописи в одних и тех же словах они могут быть расставлены по-разному;
  • выносные буквы спущены в строку и заключены в круглые скобки, что позволяет более четко соотнести слово с его буквенным составом: по(д)визи, ꙗвление(м);
  • титло или титловое покрытие над словом помечается в словнике особым знаком #, стоящим за словом: агглъ#.

Особая программа, написанная Тарасовой Еленой Евгеньевной и Тарасовым Евгением Анатольевичем, осуществляет частичное сведение орфографических вариантов одной и той же словоформы к единой форме:

  • объединяются словоформы с одинаковым буквенным составом, различающиеся наличием/отсутствием выносных букв или тем, какие именно буквы помещены над строкой, например: безмо(л)виибе(з)молвиибезмолвии > безмолвии; чꙗдоро(ди)ючꙗ(до)родиючꙗдородию > чꙗдородию;
  • объединяются словоформы, различающиеся тем, как представлен конечный согласный: выносная буква/ строчная буква без ера или еря/ строчная буква с ером или ерем, например: игуме(н)игуменигуменъ > игуменъ;
  • объединяются длинные (шесть и более букв) словоформы под титлом, если одна из них длиннее/короче на одну букву другой, например: блженнаго#блженаго#блжнаго# > блженаго#;
  • объединяются словоформы, различающиеся тем, как представлена частица же в их составе: полностью или в виде выносного ж, например: поне(ж)понеже > понеже;
  • объединяются словоформы, различающиеся тем, как представлено возвратное сꙗ в их составе: полностью или в виде выносного с, например: повину(с)повинусꙗ > повинусꙗ;
  • объединяются (в диалоговом режиме) словоформы, различающиеся видом редуцированного на конце слова, например: старецъстарець > старець;
  • объединяются (в диалоговом режиме) словоформы, если букве а в одной соответствует о в другой: манастырꙗмонастырꙗ > монастырꙗ; студенагостуденого > студенаго; алтарꙗолтарꙗ > алтарꙗ.

Эта программа позволяет уменьшить объем словника на 6–10%.


Еленой Григорьевной Уфлянд была разработана процедура, позволяющая автоматически устранить следующие случаи графической и орфографической вариативности:

  • сокращенные написания сакральных слов под титлом: мч҃нк, м(ч)нк > мученикъ;
  • вынос отдельных букв или буквосочетаний над строкой: грешна(го), грешна(г), грешнаго > грешнаго;
  • написание «ъ/ь» после заднеязычных согласных: отвергьше, отвергъше, отвергше > отвергше;
  • написание «ъ/ь» после «м» и «в»: мьзду, мзду > мзду;
  • написание «ъ/ь» после шипящих и «ц»: мужъ, мужь > мужь;
  • написание финального «ъ»: нас, насъ > насъ;
  • написание сочетаний плавного и редуцированного между согласными в корни: длъжни, дльжни, должни > должни;
  • написание гласных после шипящих: одержымъ, одержимъ > одержимъ;
  • написание гласных после заднеязычных согласных: книгы, книги > книги;
  • написание сочетаний гласных: въсвоаси, въсвоꙗси > въсвоꙗси;
  • написание суффиксов «-ьск-», «-ьств-»: богатество, богатьство, богатство > богатство;
  • написание «и/ь» перед последней гласной окончания: келии, кельи > келии.

Применение этой процедуры к словоуказателю позволило сократить его объем более чем на 18%. Все производимые замены записываются во вспомогательный файл, что позволяет контролировать правильность работы программы.


Однако нельзя сказать, что вариативность в словоуказателе устранена полностью. Нам предстоит решить еще ряд проблем, важнейшими среди которых являются:

  • достаточно многочисленные случаи чередования редуцированных и гласных «о/е» на месте современных беглых гласных в приставке и корне: въсхититивосхитити;
  • удвоенные согласные: воистинувоистинну;
  • непоследовательное написание ятя: грѣхъгрехъ.