본문 바로가기
수학.통계

AI.빅데이터 시대의 수학 [미적분, 선형대수학, 확률과통계, 이산수학]

by 지식편집자 2023. 11. 17.

 

데이터 분석을 위해서는 수학에 대한 이해가 필요합니다. 특히, 아래의 수학 분야가 인공지능과 직접적으로 연관됩니다.

  1. 미적분(Calculus)
  2. 선형대수학 (Linear Algebra)
  3. 확률과통계 (Probability and Statistics)
  4. 이산수학 (Discrete Mathmatics)

미적분(Calculus)

미분(differential)은 인공지능의 실체이자 핵심이라고 할 수 있는 오차역전파(Back-Propagation)에서 가중치를 수정해서 오차를 최소화하는 데 사용합니다. 데이터에는 오류가 포함되어 있습니다. 데이터가 특정한 확률 분포로부터 관찰되었다고 해도, 모든 데이터가 해당 분포에 정확하게 일치하지 않습니다. 머신러닝 모델의 목표는 주어진 데이터가 관찰될 확률을 최대화하는 것입니다.

하지만 많은 파라미터를 가지고 있는 모델, 특히 딥러닝 모델의 손실 함수(loss funtion: 모델의 예측 결과와 정답 데이터의 차이를 나타내는 함수)는 복잡도가 높기 때문에 최적의 파라미터를 한번에 계산할 수가 없습니다. 그 대신 파라미터를 여러 번에 걸쳐서 조금씩 업데이트하는 방법을 사용합니다. 파라미터를 얼마나 조절하는지와 관련이 있는 것이 미적분입니다. 미분은 함수에서 입력 변수의 변화량에 따른 출력 변수의 변화량을 나타내는 개념입니다.

머신러닝의 예를 들면, 입력 변수는 데이터와 모델 파라미터, 출력 변수는 모델의 예측 결과로 생각할 수 있습니다. 모델을 학습시킬 때는 데이터가 이미 주어져 있습니다. 미분 개념을 통해 파라미터의 변화량과 예측 값의 변화량 사이의 관계를 사용하는 데 사용됩니다. 모델의 예측 결과와 정답 데이터의 차이(오차)를 계산하여, 오차 값(출력)과 미분을 이용해서 모델 파라미터(입력)가 얼마나 변경되어야 오차가 줄어드는지 알아낼 수 있습니다.

선형대수학(Linear Algebra)

인공지능은 본질적으로 컴퓨터가 이해할 수 있는 대량의 데이터, 즉 숫자를 이용하여 복잡한 계산을 수행하는 것입니다. 이러한 복잡한 계산을 효율적으로 풀 수 있도록 도와주는 것이 선형대수학입니다.

인공지능에서 데이터는 여러 숫자들이 나열된 배열 형태로 표현됩니다. 파이썬과 같은 프로그래밍 언어들은 배열을 기본적인 자료 구조로 제공합니다. 선형대수학은 데이터의 배열과 관련이 있습니다. 선형대수학에서 등장하는 벡터와 행렬은 숫자의 배열과 관련됩니다. 선형대수학은 선형방정식의 풀이를 위한 행렬 이론, 벡터 공간과 그들 사이의 선형사상(mapping)에 관한 이론입니다. 행렬은 주어진 선형 시스템에서의 효과적인 표현을 가능하게 하며, 벡터 공간은 제한된 영역 안에서 선형사상을 표현하기에 유용합니다.

행렬은 인공지능에서 데이터의 공간 변환, 인공지능 최적 설계, 확률의 추출 과정에서 필수적인 도구입니다. 신경망에서는 행렬의 곱셉이 기본적으로 사용됩니다. 신경망에서 주어진 입력과 연결강도를 곱할 대 행렬 연산의 이해와 활용이 필수적입니다. 벡터는 신경망의 입력으로 들어갈 데이터 사용에 필요하며, 벡터의 내적과 직교 조건, 벡터들 사이의 거리 측정 방법, 선형 변환 등에 필요합니다. 신경망에서 입력과 그 사이의 연결강도를 곱하여 더하는 것은 사실상 벡터 내적의 개념을 사용합니다.

 

확률과통계(Probability and Statistics)

인공지능, 특히 머신러닝 이론은 추론 통계학(inferential stastistcs) 아이디어를 바탕으로 하고 있습니다. 인공지능의 궁극적 목적은 어떤 데이터를 분류하거나 값을 예측하는 것입니다. 이때 분류나 값의 예측은 확률과 통계를 토대로 합니다. 데이터가 따르는 특정한 확률 분포를 추정하는 것입니다. 머신러닝 모델은 특정한 확률 분포를 나타내고 있기 때문에, 머신러닝 모델을 정의하고 학습시키는 데는 확률 개념이 포함됩니다. 모델의 종류와 구조는 확률 분포의 형태를 결정하고, 확률 분포의 세부적인 부분들은 모델의 파라미터(parameter, 매개변수)에 의해 결정됩니다.

이산수학(Discerte Mathmatics)

디지털 정보 처리는 이산적입니다. 디지털 시계와 아날로그 손목 시계와 비교하면 직관적으로 이해됩니다. 9시 25분을 예로 들면, 디지털 시계에서는 9:25 숫자로 표시됩니다. 반면에 분침과 시침이 있는 아날로그 손목 시계에서는 시침 9시와 10시 사이에 분침은 25분을 가리키며 각도로 표현됩니다. 이는 연속적인 개념입니다. 컴퓨터공학, 정보통신, 정보기술은 이산수학을 기초로 합니다. 데이터는 '0'과 '1'의 2진수로 표현되는 디지털 신호로 표시됩니다. 인공지능을 위한 알고리즘 계산도 컴퓨터 내에서 디지털 신호 계산으로 이루어 집니다. 신경세포(perceptron)에서의 덧셈, 곱셈 작업도 모두 디지털 계산으로 이루어집니다.

 

 

https://modulabs.co.kr/blog/ai-math-intro/

 

AI 수학 왜 중요할까요? (선형대수학, 확률과 통계, 미적분) - 머신러닝 수학, 딥러닝 수학

인공지능을 공부하고 싶지만 수학이 두려운 분들을 위해 인공지능 분야에서 수학이 왜 중요한지, 그리고 선형대수학, 확률과 통계, 미적분 등의 수학 분야들이 머신러닝 이론에 어떻게 적용되

modulabs.co.kr

모두의 인공지능 기초 수학 | 서지영 | 길벗 출판사
 
인공지능 시대의 선형대수학 | 생능출판사