|
В данной работе рассматривается 4-ая версия базы данных «Языки мира». Ее главной особенностью стал переход от иерархического представления данных, при котором признаки были оформлены в виде бинарного дерева, к парадигматическому. Был разработан список из 124 признака, каждый из которых имеет, в среднем, восемь вариантов значений. Долгое время единственным источником информации для заполнения рефератов языков в базе данных служило одноименное энциклопедическое издание. Однако в ближайшее время, как только данные обо всех описанных в энциклопедии языках будут введены в базу, проблема поиска альтернативных источников информации встанет особенно остро. Решением данной проблемы может стать создание опросников и проведение краудсорсинг-проекта. Лингвистические опросники чаще всего используются специалистами при описании новых языков. Главной же особенностью предлагаемого краудсорсинга станет участие в нем не только специалистов по конкретным языкам, но и носителей, не имеющих лингвистического образования. Таким образом, возникает необходимость создания двух видов опросников. Первый вид предназначен для работы со специалистами и включает в себя, в основном, прямые вопросы, ответы на которые предполагают не только знания о языке, но и определенный уровень лингвистического образования. Второй вид предназначен для носителей языка, не имеющих профильного образования, и включает в себя, как правило, задания на составление словосочетаний и предложений по заданным критериям и задания на перевод. Главным преимуществом такого краудсорсинг-проекта станет возможность удаленно работать с большим количеством информантов одновременно и в обозримые сроки значительно расширить базу данных, добавив в нее новые языки.
Ключевые слова:база данных, языки мира, парадигматическое представление данных, краудсорсинг, опросник, носитель языка
|