Методы машинного обучения в Data Mining пакета Statistica [Александр Халафян]

48

В настоящее время, благодаря совершенствованию технологий сбора и хранения данных в различных областях человеческой деятельности накоплены огромные массивы разнородных данных – количественных, качественных, текстовых, ограниченного и неограниченного объема. Поэтому в дополнении к методам многомерного анализа, как правило, основанных на парадигме среднего, появились современные технологии анализа данных, в частности Data Mining – добычи данных, или интеллектуального анализа данных. Методы машинного обучения Data Mining являются составной частью искусственного интеллекта (ИИ), проникающего практически во все сферы человеческой деятельности. Но ИИ – это программный продукт, разработанный человеком, и эффективность его работы зависит в том, числе и от того насколько правильно применены методы машинного обучения.

В издании освещены методы машинного обучения: деревья решений – общие деревья классификации и регрессии, CHAD-модели, интерактивные деревья, стохастический градиентный бустинг, случайные леса регрессии и классификации; процедуры обучения – методы опорных векторов, к-ближайших соседей, наивный байесовский классификатор; автоматизированные нейронные сети и программа DATA MINER. Книга написана на основе курсов, читаемых автором в Кубанском государственном университете. При описании методов использовались версии пакета STATISTICA 10, 13 (Tibco, USA).

Для студентов, изучающих математические и технические дисциплины, а также аспирантов, преподавателей вузов, специалистов в области Data Science, научных работников различных направлений, занимающихся анализом данных. Простая и доступная для широкого круга читателей форма изложения делает возможным использование пособия для самостоятельного изучения методов машинного обучения, реализованных в Data Mining пакета STATISTICA.