서문 - 기계학습과 대화

이 책은 기계 학습의 주요 개념과 알고리즘을 소개합니다. 기계 학습은 1950년대부터 발전해 온 다양한 학습 알고리즘의 집합으로, 이미 방대한 연구와 문헌이 축적되어 있습니다. 특히 최근 딥러닝의 눈부신 성과로 인해 산업계와 학계 모두 이 방법론에 새롭게 주목하고 있습니다.

이미 잘 알려진 알고리즘을 다루면서도 새로운 책으로 이 분야를 소개하는 이유는 분명합니다. 기계 학습 자체는 오래전부터 개발되었지만, 이를 다루는 소프트웨어 환경은 2010년 이후 급격히 발전했습니다. 2020년대의 도구로 기계 학습을 다시 소개하는 일은 여전히 큰 의미가 있습니다. 수식만으로는 기계 학습을 온전히 이해하기 어려우며, 실제 데이터와 상호작용하는 코드를 통해 비로소 그 가치가 드러나기 때문입니다.

이러한 관점에서 이 책은 수식과 코드를 함께 제시합니다. 각 개념은 수학적 정의로 설명하는 동시에, 파이썬 기반의 실행 가능한 코드로 데이터에 적용해 봅니다. 독자는 이론을 읽는 데 그치지 않고, 코드를 직접 실행하고 결과를 관찰하면서 개념을 체득할 수 있습니다.

1책의 구성¶

이 책은 기계 학습을 크게 세 부분으로 나누어 다룹니다.

수학: 통계적 추론과 가능도 등 기계 학습의 바탕이 되는 수학적·통계적 원리를 다룹니다.
데이터: 탐색적 데이터 분석과 스케일링·거리 등 데이터를 이해하고 다루는 방법을 살펴봅니다.
알고리즘: 기계 학습 기초부터 kNN, 결정 트리, 부스팅, 선형 모델, 서포트 벡터 머신, 차원 축소에 이르기까지 주요 알고리즘을 소개합니다.

이 구성을 통해 독자는 기계 학습의 수학적 토대를 이해하고, 데이터를 다루는 감각을 익히며, 대표적인 알고리즘의 원리와 활용법을 차례로 익히게 됩니다.

이 책이 기계 학습을 처음 접하는 독자에게는 길잡이가 되고, 이미 익숙한 독자에게는 개념을 다시 정리하는 계기가 되기를 바랍니다. 본문에 남아 있는 오류는 전적으로 저자의 책임입니다.

이성주