четверг, 14 марта 2013 г.

Чем отличаются твиты мужчин и женщин: гендерные маркеры

Дэвид Баммэн (David Bamman) из Университета Карнеги (США) с коллегами провел исследование "Gender in twitter: styles, stances, and social networks" ("Гендер в твиттере: стиль написания, привычки и социальные сети").

Исследование определило, что стиль написания сообщений в сервисе Twitter зависит не только от привычек конкретного пользователя, но и от его пола. Следует, правда, понимать, что выявленные паттерны не всегда справедливы — чем больше у Вас подписчиков одного пола, тем сильнее Ваши твиты характерны для типичного мужчины или женщины.

В исследовании анализировались 14,464 активных пользователей Twitter и их 9 миллионов сообщений. Где-то 643 твита на респондента. 

Ученые Дэвид Баммэн, Джэйкоб Айзенштейн (Jacob Eisenstein) и Тайлер Шноублен (Tyler Schnoebelen) постарались выявить какие-то общие языковые конструкции и лингвистические повторы в твитах респондентов. Респондентов делили в категорию мужчин или женщин на основе имени учетной записи по авторской модели классификации с точностью 88%.

После индексирования и анализа более девяти миллионов сообщений, ученые сделали следующий вывод:
All of the pronouns detected by our Bayesian analysis as gender markers are associated with female authors: yr, u, ur, she, she’ll, her, hers, myself, herself…Female markers include a relatively large number of emotion-related terms like sad, love, glad, sick, proud, happy, scared, annoyed, excited, and jealous. All of the emoticons that appear as gender markers are associated with female authors, including some that the prior literature found to be neutral or male: :) :D and ;).
Для женщин характерно эмоционально звуковое "удлинение" ("круутооо"), использование различных сокращений ("omg", "lol") и звукоподражательных слов ("ох", "хммм"), а также повторяющихся восклицательных знаков. 

Мужчины гораздо чаще употребляют различного рода нецензурные выражения в своих твитах, а также отрицания или соглашения без каких-либо пояснений. Еще для мужчин характерно использование названий брендов (например: apple's, iphone, lebron).

Авторы исследования выделили 8 категорий для частого упоминания слов в 9 миллионах изученных твитов:
  1. Имена: имена собственные, бренды;
  2. Мат и табуированные слова;
  3. Цифры: 2010, 3-0, 500;
  4. Хэштеги;
  5. Пунктуация: знаки препинания: &, >, ?, * (без смайлов и эмоций);
  6. Словарь: слова из словаря, которые нельзя отнести к жаргону или вульгарностям, имена собственные и сокращенные: "милый", "качество", "стоимость", "хотят";
  7. Сокращенные произносимые слова, без апострофов: "лол", "нет", "ха-ха";
  8. Другие слова, которые могут быть написаны, как сокращения или выразители эмоций: "OMG", ";)", "API".
Интересно, что в 2010 году было проведено аналогичное исследование на более маленькой группе участников (всего тысяча человек). Результаты оказались довольно схожими:
Female authors were more likely to use emoticons, ellipses (…), expressive lengthening (nooo waaay), repeated exclamation marks, puzzled punctuation (combinations of ? and !), the abbreviation omg, and transcriptions of backchannels like ah, hmm, ugh, and grr.
Женщина часто общаются в более естественном "Живом" стиле. То же самое можно сказать и о мужчинах пользователях Twitter, но в гораздо меньшей степени.

Комментариев нет:

Отправить комментарий