XML разметка текстов

XML-разметка позволяет структурированно отображать компоненты смысловой и формальной интерпретации текста, которые были выявлены в ходе обработки достаточно большого количества текстов и были сформулированы в публикациях коллектива составителей корпуса.

Александр Гребеньков написал программу для автоматической конвертации текстовых файлов в формат XML, доступных для пользователей.

В формальном плане разметка корпуса основывается на международных нормах оформления электронных изданий текста, в частности Text Encoding Initiative (TEI), однако содержит также и дополнительные элементы, которые необходимы для адекватного отображения особенностей русского рукописного текста.

Файл DTD для рукописей, представленных в XML-формате [39 kB]