Данные для этого небольшого анализа данных были собраны в прошлом коммунистическом проекте. Но я ещё слегка подкорректировал данные, где были ошибки. Хотя они всё равно должны остаться. Второе замечание - данные устаревают.
Если объяснять вкратце, то я находил различия между отзывами, оставленными под аккаунтами психологов на сайте b17. И такие различия позволили лучше понять, как люди представляют психологов, как выстраивают их образ.
- Сравнивать не просто по соотношению частот, а находить соотношение частот из выборок with replacement, чтобы получить интервал соотношения частот (которые я называю шансами). Да, я говорю про bootstrapping. И далее уже ранжировать по нижней границе интервала. Так, редкие и случайные высокие значения упадут вниз, и ранжирование будет внушать больше доверия.