Культуры ⋃ Компьютеры

Проект Михаила Конинина

Дневная заметка - 2024-05-17

Вчера решил заняться и сделать анализ того, на что обращают внимания покупатели. Вернее систему, которая будет делать такой анализ. На самом деле я уже делал ее, в прошлом году. Тогда я остановился на выявленных аспектах. Я решил, что просто список аспектов товаров мне не удастся продать, и я забросил эту работу.

И вот решил вернуться к этой теме. Сделал план, что нужно сделать. Нашел статьи, на основе которых писал эту программу в прошлый раз и занялся. Программировал до 11 вечера. Продвинулся хорошо, сделал выгрузку отзывов и их синтактический разбор. Тут главное для меня, что когда я выделяю слова-кандидаты, я сохраняю еще связанные предложения. В прошлом году я не сделал это и из-за этого потом не смог превратить этот анализ из простого “посчета слов” в интерпретивский количественный анализ.

Хотел сегодня продолжить программировать, но не было сил. Потом…😊

Интепретивистский количественный анализ - это тоже очень интересная для меня тема. Почти никто этим не занимается и статей нет, хотя я считаю, что современная дата-сайнс вполне может быть интепретивистской наукой. Не зря эпистемологию ДС сравнивают с эпистемологией этнографии.

Интерпретивизм - это такая парадигма в соц.науках, конкурирующая с позитивизмом. Позитивизм - это когда исследуют какое-то социальное явление как объективно существующее, а интерпретивизм - когда исследуют то, как люди-участники конструируют и понимают это явление. Т.е. в интерпретивизме важна точка зрения человека, что явление значит для него, как он его понимает.

И основной источник этих точек зрения - это тексты (тот самый пользовательский контент-UGC). Обычно эти текст изучают качественными методами. И современная ДС может дать толчок, чтобы научиться выявлять точки зрения автоматически в больших количествах текстов. Отнестись к текстам каждого отдельного человека, с таким же вниманием, какое уделяют текстам Пушкина.😊