Дневные заметки - 2024-03-05
Сегодня я продолжал читать про эпистемологию дата-сайнс. Автор основывает ее на вариационной индукции. Т.е. он говорит, что в ДС алгоритмы используют вариацию в данных для установления причинно-следственных связей.
В первых главах он ведет к этому выводу. Очень подробно и интересно описывает различия между феноменологическими науками (типа ДС или инженерных) и теоретическими. Он рассказывает, что в феноменологических науках используется индуктивный метод, а в теоретических - гипотезно-дедуктивный.
Индуктивная природа феноменологических наук приводит к тому, что их обобщения имеют меньшую теоретическую силу. В то же время - они в большей мере ориентированы на поиск способов влиять на феномены.
Феноменологические науки - прикладные. Они ищут и используют каузальные законы, но не для создания теорий. Для них каузальные законы нужны, чтобы обосновать различия между эффективными и не эффективными стратегиями.
И ДС в этом ничем не отличается. Модели машинного обучения - это алгоритмический поиск этих каузальных законов, которые потом применяются на практике.