UniTurk тууралуу маалымат
В рамках конференции будет организован традиционный семинар UniTurk.
На предыдущих семинарах Uniturk (Казань, 2014; Стамбул, 2014; Казань, 2015; Бишкек, 2016) обсуждались проблемы разработки унифицированной морфологической разметки текстов на тюркских языках для использования в корпусах и других системах автоматической обработки текста. Подобная унифицированная система разметки могла бы также служить в качестве универсального средства глоссирования текстовых примеров (например, в международных публикациях).
В феврале 2014 года в Казани был принят рабочий вариант унифицированной морфологической разметки. Принятый вариант ориентируется на морфемную структуру тюркской словоформы и призван максимально полно отразить многообразие различных тюркских языков. Для обсуждения на очередном семинаре Uniturk предлагаются следующие вопросы:
1. Грамматическая (морфологическая и словообразовательная) и семантическая разметка. Разграничение семантических и грамматических тегов (разряды числительных, залоги и т.п.). Представление полифункциональных аффиксов.
2. Вопрос о степени полноты и детализации разметки.
3. Проблема синтетического и аналитического выражения отдельных категорий в разных языках (например, т.н. “инструментальный падеж”, способы выражения вопросительности, модальности и т.п.).
4. Представление глагольных аффиксов: подготовка сопоставительных таблиц.
Мы ждем ваших предложений по вопросам унификации систем аннотаций, которые будут размещены на сайте семинара.
На веб-странице семинара можно ознакомиться с существующими системами разметки и публикациями по данной тематике.