머신러닝(기계학습)에 대한 짧은 생각

머신러닝(Machine Learning 이하 기계학습)에 대해서 처음 접하게 된 것은 2014년 말, 미국 마이크로소프트에서였다.

마이크로소프트에서 진행하는 컨퍼런스 참여중에 들을 만한 세션이 있는지 찾다가, 유연지 않게 Azure with Machine Learning 이라는 주제가 눈길을 끌어 알고 있는 지인분들가 함께 세션을 듣게 되었다.

지인분 왈, “대박이다 대박!!”이라는 말은 연신 외치는것이 진짜 좋은 것가 하는 솔깃한 마음에 더욱 귀 귀울여 들었는데 대략 내용은 이랬다.

“마이크로소프트에서 서비스하는 클라우드에서 기계학습 서비스를 이용할 수 있다는 것”

처음본 방식은 생소한것이 설계도 같이 데이터와 학습 모델, 결과 모델등을 끌어다 놓기를 이용해서 오피스 프로그램중 하나인 “비지오”도면 그리듯이 연결하면 바로 이용할 수 있다는 것이다.

즉 원시 데이터를 이용해서 특정한 결론을 만들어 내는 학습 과정을 기계학습이라고 하여 저자 역시 이 기술에 관심이 커졌다.

특히 해킹을 사전에 예측한다거나, 알수 있도록 기계학습을 시킬수 있다면 침해사고 대응이 무척 좋을것 같아는 생각에 배우고 싶은 맘이 간절했지만, 어떻게 시작해야 할지 막막한 부분이 많아, 우선 기초 이론부터 파보기로 했다.

기계학습이란?

즉 별도의 기계학습 시스템을 도입하지 않고, 데이터만 있다면 바로 기계학습을 만들 수 있다는 것이다.

요즘 빅데이터 기술에 대한 애기가 많다.

클라우드 기술이 발전하면서 대량의 데이터를 하나의 서버 혹은 여러 대의 서버에 저장 할 수 있어, 과거에는 대량의 데이터를 처리하기 위해서는 초기 구축 비용이 많이 들어, 시도 해볼 수 없었던 일들이 지금은 쉽게 가능하다.

그럼 클라우드는 무엇일까?

클라우드는 쉽게 애기하자면 리스 서비스를 생각하면 된다.

“나와 데이트하는 여자친구는 포르쉐를 원한다.”가 가장 기본적인 클라우드를 의미하는 것 같다.

지금 나에게는 비싼 포르쉐 자동차가 없지만 포르쉐를 빌릴수는 있는 것이다.

클라우드는 이 처럼 필요한 하드웨어 자원을 필요한 만큼, 기간동안 이용할 수 있도록 하는 리스 개념의 서비스로써, IT 인프라의 큰 비용을 차지하는 초기 시스템 구입 비용과 유지 보수 비용이 들지 않아 현재 많은 사랑을 받고 있다.

그럼 기계 학습과 빅 데이터가 관계가 있을까?

기계학습은 데이터를 이용해 새로운 결과를 예측하는 것이다.

“데이터A는 결과 A와 같다.” 라고 정의한다. 그리고 데이터A는 복수일 수도 있고 하나의 데이터일 수도 있다.

정확한 결과를 얻기 위해서는 입력되는 데이터가 많을 수록 정확도를 높을 수 있기 때문에, 입력된 데이터를 통해 예측하는 통계학과 비슷하다고 할 수 있다.

하지만 통계학과 차이가 있는 부분은 통계학은 결과를 부정적인 시각에서 바라본다는 것과 기계학습은 긍정적인 시각으로 바라본다는 점이 크게 다르다.

쉽게 설명하자면, 통계학은 “자동자 이용하는 도로 트래픽의 통계를 보니 오늘 12시에 막힐 수 있다.”가 통계학이다. 즉 막힌것이다는 예측이 있지만 이는 부정적인 견해가 들어간 것이라 볼 수 있다.

하지만 기계학습은 예측의 목표가 주어지게 된다. 따라서 “도로 트랙픽 이용량이 11시 80%이면 12시에 막힌다.”라는 결과가 넣고 틀렸다 하더라도, 기계학습을 이용해 더 정확한 결과치를 만들어 낼 수 있으므로 긍정적인 견해로 바라보게 된다.

이처럼 사람이 하는 수동은 한번 분석하면 그 작업으로 끝이라고 할 수 있지만 기계의 경우 지속적으로 사용할 수 있다는 점에서 큰 호응을 얻고 있다고 생각된다.

 

 

 

Facebook Comments

Leave A Reply

이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다.