본문 바로가기

수능독서

[2024 수능특강] 로지스틱 회귀와 서포트 벡터 머신

■ 로지스틱 회귀와 서포트 벡터 머신 (Logistic Regression and Support Vector Machines)

 

() 머신 러닝에서 긍정/부정과 같이 이진 분류를 하는 데 요긴하게 활용되는 것이 로지스틱 회귀이다. 주어진 데이터세트의 속성을 고려하여 데이터세트를 둘로 나누는 통계적 방법이 로지스틱 회귀인데 하나의 속성만을 고려하는 경우에는 시그모이드 함수가 사용된다. 일변수 로지스틱 회귀는 데이터세트를 둘로 나누는 최적의 시그모이드 함수를 찾는 것이 핵심이다.

주제 : 로지스틱 회귀의 개념과 활용

 

 

In machine learning, logistic regression is widely used for binary classification tasks, such as predicting positive or negative outcomes. Logistic regression is a statistical method that splits a given dataset into two groups based on its attributes. When considering only one attribute, a sigmoid function is used. The key to univariate logistic regression is finding the optimal sigmoid function that best divides the dataset into two groups.

Topic: The Concept and Application of Logistic Regression

 

 

() 머신 러닝에서 n개의 속성을 갖는 데이터세트를 둘로 분류하기 위하여 n차원 공간에서 구분하는 경계를 설정하는 방법을 쓰는 것이 서포트 벡터 머신이다. n차원 공간에서 점으로 나타나는 개체들을 나누는 결정 경계는 가능한 한 점들이 결정 경계에서 멀어지도록 마진을 크게 하는 방법을 찾게 된다. 이렇게 결정 경계를 설정하게 되면 새로운 데이터세트가 주어졌을 때 이 모델을 활용하여 데이터세트를 둘로 분류할 수 있게 된다.

주제 : 서포트 벡터 머신의 개념과 활용

 

 

In machine learning, Support Vector Machines (SVM) are used to classify a dataset with nn attributes into two groups by creating a boundary in an nn-dimensional space. The decision boundary, which separates the data points, is determined in such a way that it maximizes the margin, meaning the distance between the boundary and the closest data points is as large as possible. Once this decision boundary is established, the model can be used to classify new datasets into two groups.

Topic: The Concept and Application of Support Vector Machines