Применен термодинамический подход к решению проблемы выбора числа кластеров/тем в тематическом моделировании. Сформулированы основные положения подхода, и исследуется поведение тематических моделей при ва-риации температуры. При помощи термодинамического формализма показано существование энтропийного фазового перехода в тематических моделях и сформулированы критерии выбора оптимального числа тем/кластеров. DOI: 10.21883/PJTF.2017.12.44713.16725 Термодинамический формализм, реализованный на основе миними-зации свободной энергии, успешно применяется в различных областях, таких как обработка изображений. Существенное развитие методов кластеризации произошло в рамках тематического моделирования (ТМ) [4,5]. В ТМ решается задача восстановления исходного многомерного распределения в виде смеси мультиномиальных распределений со скрытыми параметрами. Одной из нерешенных проблем в ТМ является выбор числа распределений в смеси. Причем эта проблема возникает как в кластерном анализе, сетевом анализе [6], так и при исследовании фазовых переходов веществ с различной пространственной структурой [7].Поскольку ТМ ориентировано на работу с большими данными, совокупность документов и слов можно рассматривать как мезоско-пическую систему из большого числа частиц (миллионы документов и слов в них), характеризующуюся термодинамическими величинами, такими как энергия, энтропия и свободная энергия. Исходя из этого, термодинамический подход к проблеме выбора числа в тематическом моделировании можно сформулировать в виде следующих положений: 90