Культуры ⋃ Компьютеры

Проект Михаила Конинина

Про culture consensus analysis - 2024-04-20

Сегодня продолжил анализировать чаты. Нашел более понятную инструкцию как делать culture consensus analysis (CCA), немного доработал (в оригинале используются данные интервью), и реализовал его на основе данных чата кудрявых. Получилось не сразу, но получилось. Судя по анализу в чате есть 1 культура. Я, конечно, ожидал такого результата (как никак 3 месяца его анализирую), но все равно приятно.😊

Я сделал упрощенную версию CCA - на основе факторного анализа (PCA) на уровне участников чата.

Большую часть дня я экспериментировал с этим анализом - смотрел как результаты меняются, когда я изменяю параметры, изучал результаты и т.п. В итоге я понял, что этот анализ выявляет есть или нет культура даже без моего вмешательства. А еще, приятный побочный эффект - можно извлекать ключевые слова относящиеся к этой культуре (их я могу потом отправлять чатгпт).

Так, поняв, что “оно работает само” я попробовал этот метод на других чатах и нашел еще пару чатов, где он показывает присутствие единых культур - чат для активистов, сохраняющих малоресурсные языки, чат osm-картографов и чат работников пунктов выдачи ВБ. Пока я не изучал эти чаты глубже, но в целом правдоподобно. Все эти чаты имеют особые языки и активную аудиторию, я и без этого метода замечал, что они отличаются от других чатов.

Есть еще много вопросов, например, возможно, что в более общих чатах CCA не находит одной культуры просто потому, что люди там общаются на много разных тех. Нужно ли это как-то учитывать или просто откинуть такие чаты?

На сегодняшний день, я очень доволен этими промежуточными результатами. Кроме подтверждения цифрами, что у меня на руках есть цифровая культура для анализа, я их нашел еще несколько, так что смогу экспериментировать с ними, сравнивая что получается и что не получается.😊