Notice
Recent Posts
Recent Comments
Link
«   2025/04   »
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30
Tags
more
Archives
Today
Total
관리 메뉴

All about AI!

머신 러닝(Machine Learning)이란 무엇인가? 머신러닝의 종류와 특징 본문

카테고리 없음

머신 러닝(Machine Learning)이란 무엇인가? 머신러닝의 종류와 특징

인공돌이 2020. 7. 10. 22:43

머신 러닝(Machine Learning)이란 무엇인가? 머신러닝의 종류와 특징

머신러닝(machine learning)은 컴퓨터가 인간과 동물이 자연적으로 학습하는 방법, 즉 경험에서 배우는 것을 가르치는 데이터 분석 기법이다. 머신러닝 알고리즘은 미리 정해진 방정식이나 모델에 의존하지 않고 데이터로부터 직접 정보를 "학습"하는 연산 방법을 사용한다. 이 알고리즘은 일반적으로 학습에 사용할 수 있는 데이터의 양이 증가할수록 시스템의 성능도 향상된다. 딥러닝은 머신러닝의 특화된 형태다. 빅데이터가 증가하면서 머신러닝은 신용 평가 및 알고리즘 거래를 위한 계산 금융, 얼굴 인식, 동작 감지 및 객체 감지를 위한 이미지 처리 및 컴퓨터 비전, 컴퓨터 생물학, 종양 검출, 약물 발견 및 DNA 염기서열 분석, 가격 및 부하 예측을 위한 에너지 생산, 예측 가능한 유지보수를 위한 자동차, 항공우주 및 제조, 음성 인식 응용 프로그램을 위한 자연 언어 처리 등 다양한 분야의 문제를 해결하는 핵심 기법이 되었다. 머신러닝 알고리즘은 데이터에서 통찰력을 생성하고 더 나은 결정과 예측을 할 수 있도록 도와주는 자연스러운 패턴을 찾아낸다. 그것들은 의료 진단, 주식 거래, 에너지 부하 예측 등의 중요한 결정을 내리는데 매일 사용된다. 예를 들어, 미디어 사이트들은 당신에게 노래나 영화를 추천하기 위해 수백만 가지의 선택사항을 선별하는 기계 학습에 의존한다. 소매업자들은 그것을 고객의 구매 행동에 대한 통찰력을 얻기 위해 사용한다. 많은 양의 데이터와 많은 변수를 포함하지만 기존의 공식이나 방정식이 없는 복잡한 작업이나 문제가 있는 경우 머신러닝을 사용하는 것이 효과적일 수 있다. 머신러닝(machine learning)은 미래 출력을 예측할 수 있도록 미리 준비된 입/출력 데이터, 즉 정답을 알려주어 교육하는 지도 학습과 입력 데이터에서 숨겨진 패턴이나 내재적 구조를 스스로 찾아내는 비지도 학습의 두 가지 기법을 사용한다. 지도학습은 불확실한 상황에서 증거를 바탕으로 예측을 하는 모델을 만든다. 지도 학습 알고리즘은 알려진 입력 데이터 집합과 그 데이터에 대한 알려진 응답(출력)을 취하며 새로운 데이터에 대한 반응에 대한 합리적인 예측을 생성하도록 모델을 훈련시킨다. 예측하려는 출력에 대해 알고 있는 데이터가 있는 경우 지도 학습이 효과적이다. 지도 학습은 분류 및 회귀 기법을 사용하여 예측 모델을 개발한다. 분류 기법은 예를 들어 이메일이 진품인지 스팸인지 또는 종양이 암인지 양성인지 등 별개의 반응을 예측한다. 분류 모델은 입력 데이터를 범주로 분류한다. 대표적인 어플리케이션으로는 의료영상, 음성인식, 신용등급을 들 수 있다. 데이터에 태그를 지정하여 분류하거나 특정 그룹 또는 클래스로 구분할 수 있는 경우 분류 모델을 사용할 수 있다. 예를 들어 손글씨 인식 애플리케이션은 글자와 숫자를 인식하기 위해 분류 모델을 사용한다. 이미지 처리와 컴퓨터 비전에서는 객체 감지 및 이미지 세분화를 위해 비지도 패턴 인식 기법이 사용된다. 분류 모델을 위한 공통 알고리즘은 지원 벡터 머신(SVM), 부스트 및 백킹 의사결정 트리, k-가장 가까운 이웃, Naïve Bayes, 판별 분석, 로지스틱 회귀, 신경망 등이 있다. 회귀 기법은 연속적인 반응(예: 온도 변화 또는 전력 수요의 변동)을 예측한다. 대표적인 어플리케이션으로는 전기 부하 예측과 알고리즘 트레이딩이 있다. 데이터 범위로 작업 중이거나 반응 속성이 실제 숫자인 경우(예: 온도 또는 장비 한 개의 고장 시간) 회귀 기법을 사용할 수 있다. 일반적인 회귀 알고리즘에는 선형 모형, 비선형 모델, 정규화, 단계적 회귀, 부스트 및 백킹 의사결정 트리, 신경망, 적응형 신경 퍼지 학습 등이 포함된다. 비지도 학습은 데이터에서 숨겨진 패턴이나 내재적 구조를 발견한다. 라벨이 부착된 응답 없이 입력 데이터로 구성된 데이터 집합에서 추론을 도출하는 데 사용된다. 클러스터링은 가장 일반적인 비지도 학습 기법이다. 데이터에서 숨겨진 패턴이나 그룹화를 찾기 위한 탐색적 데이터 분석에 사용된다. 클러스터링을 이용한 어플리케이션으로는 유전자 시퀀스 분석, 시장 조사, 개체 인식 등이 있다. 예를 들어, 만약 휴대폰 회사가 휴대폰 타워를 건설하는 장소를 최적화하기를 원한다면, 그들은 머신러닝을 사용하여 그들의 타워에 의존하는 사람들의 집단의 수를 추정할 수 있다. 전화기는 한 번에 하나의 타워와만 통화할 수 있기 때문에, 연구팀은 클러스터링 알고리즘을 사용하여 고객의 그룹 또는 클러스터에 대한 신호 수신을 최적화하기 위해 셀 타워의 최적 배치를 설계한다. 올바른 알고리즘을 선택하는 것은 매우 어려운 일처럼 보일 수 있다. 수십개의 지도/비지도 학습 머신러닝 알고리즘이 있으며, 각 알고리즘은 학습에 대해 서로 다른 접근 방식을 취한다. 가장 좋은 방법이나 모든 곳에 딱 들어맞는 하나의 방법은 없다. 올바른 알고리즘을 찾는 것은 부분적으로 시행착오일 뿐이다. 고도로 숙련된 데이터 과학자들조차 알고리즘을 시험해 보지 않고는 작동 여부를 알 수 없다. 그러나 알고리즘 선택은 또한 작업 중인 데이터의 크기와 유형, 데이터로부터 얻고자 하는 통찰력, 그리고 그러한 통찰력이 어떻게 사용될지에 따라 달라진다. 다음은 감독 및 감독되지 않은 기계 학습 중 선택에 관한 몇 가지 지침이다. 예를 들어 온도나 주가, 분류와 같은 연속 변수의 미래 가치나 웹캠 비디오 영상에서 자동차의 제조사를 식별하는 등 예측을 위한 모델을 교육해야 하는 경우 지도 학습 방식이 효과적일 수 있다. 데이터를 탐색해야 하고 데이터를 클러스터로 분할하는 것과 같은 내부 표현을 잘 찾을 수 있도록 모델을 교육하려면 비지도 학습 방식이 더 효과적일 수 있다.