В статье обсуждаются результаты пилотного исследования, нацеленного на выявление взаимосвязи между типами постов, которые пользователь размещает на своей странице ВКонтакте, и его личностными особенностями, определенными при помощи психологических методик. Рассматриваются возможности применения результатов анализа аккаунтов пользователей социальных сетей в качестве основы первичной экспресс-диагностики при работе с учебными группами. Кроме того, приводятся примеры как уже решенных, так и открытых задач автоматизации, возникающих в процессе разработки инструментария. С. 3-13.
In the paper we discussed the results of pilot study aimed to determine associations between type of user's posts in social network VKontakte and his/her psychological traits. We considered the possible ways to apply user account analysis as a rapid primary test in student groups. We provided examples of both open and already closed automation tasks that appeared during the development of the research tool.
Ключевые слова: социальные сети, психологические особенности, цифровые следы, автоматизация исследований.
Keywords: social networks, psychological traits, digital footprints, research automation.
В статье рассматривается задача определения авторского стиля текста. Разработан метод, основанный на процессе генерации повторной выборки. Тексты произведений рассматриваются как последовательности символов, сгенерированные различными случайными источниками. Процедура генерации повторных выборок применена для получения тестовых фрагментов текста. Для того чтобы проверить, принадлежат ли выборки одной генеральной совокупности, используется двухвыборочный критерий. Представлены результаты численных экспериментов для текстов на английском и русском языках. С. 14-23.
The paper presents a method for the literary style determination. It is based on a re-sampling approach and character level features. A text is considered as a sequence of characters (n-grams) generated by different random sources. Bootstap-like approach is used to draw samples from the texts. Kolmogorov-Smirnov two-sample test and KNN based statistic are applied. Experiments with texts in English and Russian are given, illustrating the algorithm operation.
Ключевые слова: авторский стиль, определение авторства текста, сравнение текстов, двухвыборочный критерий.
Keywords: writing style, authorship attribution, two-sample test, re-sampling.