본문 바로가기

수학.통계11

데이터 분석을 위한 수학 로드맵 인공지능 시대를 맞이하여 기업과 노동은 큰 변화를 겪을 것이다. 예측 가능하고 반복적인 업무들은 인공지능으로 대체될 것이기 때문이다. 기업의 전문성에 의존하여 특화된 분야를 추구하던 비즈니스 모델은 데이터 수집, 처리, 분석하는 플랫폼을 구축하는 방향으로 변경되고 있다. 특정 산업에 특화된 경영의 리더보다 디지털과 네트워크 기반의 비즈니스 리더가 부각되고 있다. ​ - 교양으로서의 인공지능, 이상진 지음 앞으로의 여러 산업들은 데이터 플랫폼을 중심으로 재편될 것입니다. 데이터 원천 접근성에 따른 산업 별 차이로 인한 시차가 있을 뿐, 데이터 플랫폼을 기초로 하는 디지털 트랜스포메이션은 거부할 수 없는 시대적 흐름입니다. 데이터 기획력과 분석력은 산업에서의 생존 능력이 될 것입니다. ​ 데이터 플랫폼은 모.. 2023. 11. 18.
AI.빅데이터 시대의 수학 [미적분, 선형대수학, 확률과통계, 이산수학] 데이터 분석을 위해서는 수학에 대한 이해가 필요합니다. 특히, 아래의 수학 분야가 인공지능과 직접적으로 연관됩니다. 미적분(Calculus) 선형대수학 (Linear Algebra) 확률과통계 (Probability and Statistics) 이산수학 (Discrete Mathmatics) ​ 미적분(Calculus) 미분(differential)은 인공지능의 실체이자 핵심이라고 할 수 있는 오차역전파(Back-Propagation)에서 가중치를 수정해서 오차를 최소화하는 데 사용합니다. 데이터에는 오류가 포함되어 있습니다. 데이터가 특정한 확률 분포로부터 관찰되었다고 해도, 모든 데이터가 해당 분포에 정확하게 일치하지 않습니다. 머신러닝 모델의 목표는 주어진 데이터가 관찰될 확률을 최대화하는 것입니다.. 2023. 11. 17.
수학적 모형(mathematical model)의 의의 아래 내용은 에서 발췌 및 참고하여 작성했습니다. 수학적 모형(mathematical model)은 실제 현상을 함수 또는 방정식으로 나타내는 수학적 표현입니다. 수학적 모형의 목적은 현상을 이해하고 미래를 예측하는 것입니다. 현상(실제 문제)에 대한 수학적 모형화 과정은 아래와 같습니다. (1) 첫 번째 작업은 독립변수(indepent variable)와 종속변수(dependent variable)를 확인해서 이름을 붙이고, 수학적으로 다루기 쉽게 하기 위해 현상을 단순화시키는 가정을 만들어 수학적 모형을 공식화하는 것입니다. 물리적 현상과 수학적 기술에 대한 지식을 이용해서 변수를 관련 짓는 방정식을 세웁니다. 참고할 만한 물리법칙이 없는 상황에서는 일정한 규칙을 알아내기 위해 표의 형태로 자료를 인.. 2023. 11. 1.
최재혁 베이징대 HSBC 경영대 금융수학자, 헬로디디 인터뷰 https://www.hellodd.com/news/articleView.html?idxno=97735 물리 좋아해 수학 공부···월가 등 금융계서 11년 그리고 - 헬로디디 최재혁 베이징대학교 HSBC 경영대학교 교수는 금융수학자이다. 미국 월스트리트와 홍콩 금융가에서 11년 동안 일했다. 채권 파생 상품의 가격을 결정하는 연구를 하다가, 지난 2016년 업계를 떠나 www.hellodd.com "나는 모든 걸 다했다. 물리계는 모든 걸 편미분방정식으로 설명하니 편미분방정식을 공부했다. 또 응용 관점에서 편미분방정식을 갖다가 어떻게 모델을 하느냐 라는 걸 했다. 컴퓨터를 써서 하는 계산 수학을 했다. 또 통계 확률은 기본적으로 다 했다." "삼성전자는 스마트폰을 만들어 팔면 자기들 손에서 상품이 떠난다.. 2023. 10. 13.
명목척도, 순위척도, 등간척도, 비율척도 / 양적데이터, 질적데이터, 횡단데이터, 종단데이터 의 내용을 발췌하여 작성하였습니다. 척도 (1) 명목척도(nominal scale) (2) 순위척도(ordinal scale) (3) 등간척도(interval scale) (4) 비율척도(ratio scale) 데이터 (1) 양적 데이터(quantitative data) (2) 질적 데이터 (qualitative data) (3) 횡단 데이터(cross-sectional data) (4) 종단 데이터 (longitudinal data) 척도의 종류 (1) 명목척도(nominal scale) : 측정대상의 특성을 단순하게 구분할 목적으로 숫자를 부여하는 척도이다. 범주 척도라고 부르기도 한다. 예를 들어, 성별을 나타낼 때 남성이면 1, 여성이면 0으로 표시한다고 할 때 이를 명목척도라고 한다. 명목척도를.. 2023. 10. 4.
상관분석(correlation analysis) : 공분산, 상관계수, 산포도 에서 참고 및 발췌하여 작성했습니다. 학문적 연구에서는 둘 또는 그 이상의 변수들이 서로 어떤 관계를 가지고 있는가를 규명해야 하는 경우가 대부분이다. 두 변수 간의 관련성을 규명할 때 가장 자주 사용되는 통계적 방법이 회귀분석(regression analysis)과 상관분석(correlation analysis)이다. 한 변수로부터 다른 변수의 변화를 예측할 때 회귀분석을 사용하며, 변수 간의 관련성을 설명하기 위해서 상관분석을 사용한다. 두 변수 간 관련성을 분석할 때는 먼저 산포도를 그려보는 것이 좋다. 산포도(scatter plot)는 두 변수 간의 관계를 알아보기 위하여 두 변수값을 나타내는 점을 도표에 나타낸 것이다. X축에.. 2023. 9. 27.
[책 리뷰] 미적분의 힘 / 스티븐 스트로가츠 지음 / 해나무 수학이 얼마나 매력적이고 재미있는 학문인지, 그리고 얼마나 실용적인지 느끼고 있는 요즘입니다. 흥미로운 일화로 책이 시작됩니다. ​ ​ 리처드 파이먼이 말한대로 신이 사용하는 언어인 미적분을 공부해봐야겠습니다. 챕터 별로 다시 한번 정독하는 것부터 시작하려 합니다. ​ -------------------------- (1) 미적분학은 어려운 문제를 단순하게 만들려고 한다. 미적분학은 단순성에 과도하게 집착한다.... 미적분학이 복잡해 보이는 이유는 복잡한 문제들을 다루기 때문이다. 사실, 미적분학은 지금까지 인류가 맞닥뜨렸던 가장 어렵고 중요한 문제들을 풀어왔다. 미적분학이 성공을 거둔 비결은 바로 복잡한 문제를 단순한 부분들로 쪼개는 데 있다. ​ (2) 미적분학은 분할하여 정복하는 전략을 극단적으로,.. 2023. 8. 30.
기술통계(descriptive statistics)와 추리통계(inferential statistics) 의 내용을 발췌하여 작성하였습니다. 통계학은 데이터를 활용하여 사물이나 현상의 본질과 특성을 이해함으로써 올바른 판단과 의사결정을 할 수 있도록 돕기 위해 개발된 데이터분석 방법론이다. 우리는 주변에서 일어나는 여러 가지 현상들에 대한 데이터를 수집하여 분석함으로써 그 현상에 대해 보다 더 정확한 현황을 파악하고, 문제점 및 원인을 규명하며 해결책을 찾아나간다. 데이터에 기반한 분석을 하지 않은 채 개인적으로 경험하거나 관찰한 바에 근거하여 어떠한 결론을 내리게 되면 그 판단에 오류가 발생하게 되고, 결과저긍로 효과적인 의사결정을 내리지 못하기 때문에 데이터에 활용한 의사결정의 중요성은 매우 크다. 통계분석은 그 목적에 따라 기술통계(descriptive statistics)와 추리통계(inferenti.. 2023. 8. 28.
[책 리뷰] 복잡한 세계 숨겨진 패턴 / 닐 존슨 지음 / 바다출판사 주식 시장과 인공지능 알고리즘을 연구하다보니 자연스럽게 수학과 물리에 관심이 가게 됩니다. 이 중 "복잡계" 라는 개념에 완전히 매료 되었습니다. 복잡계는 자연과 인간이 만든 문명 거의 모든 영역에서 관찰됩니다. 무질서해 보이는 복잡한 세상도 면밀히 관찰하다 보면 일종의 패턴이 발견됩니다. 다양한 변수 가운데에서 패턴을 찾는 일을 하는 것이 인공지능의 역할입니다. 세상의 많은 것들이 데이터화 되고 이를 인공지능이 분석하면, 여러 산업에서의 패턴들이 발견되지 않을까 싶습니다. 복잡계 이론을 읽으면서 여러 개체들이 마치 레고 블럭처럼 유기적으로 결합되어 새로운 것이 창발되고, 이것들이 피드백 과정을 거쳐 다시 강화되는 구조에 매료되었습니다. 최근에 관심을 갖고 보는 주제들에서 공통적인 키워드들이 발견됩니다... 2023. 8. 26.
[책 리뷰] 미적분의 쓸모 / 한화택 지음 / 더퀘스트 제목 그대로 미적분의 "쓸모"에 대해 알려주는 책입니다. 미적분, 미적분방정식이 SpaceX , 디즈니 애니매이션, 주가 예측 등에 어떻게 활용되었는지 설명하는 책입니다. 현업에 인공지능을 적용하는 노력을 하면서, 미적분에 대한 이해가 없으면 원리적인 이해를 할 수 없다는 것을 깨닫고 있습니다. 수학의 필요에 대해 알려주는 좋은 책입니다. "수학"과 "물리"를 틈틈히 공부하려고 합니다. ​ 수학 공식을 배우기 전에 수학을 왜 배워야 하는지 알아야 하는데 교육 과정은 그렇지 않은것 같습니다. 수학 문제를 잘 풀고 수학 점수 잘 받는게 무슨 의미가 있을까요. 현실을 해석하고 적용하는 단계까지 이어지지 않는다면 별다른 의미가 없습니다. 어떤 것을 공부하더라도 실용적 측면에서, 아웃풋을 목표로 해야 합니다. ​.. 2023. 8. 26.
분산과(Variance) 공분산(Covariance) , 에서 참고 및 발췌하여 작성했습니다. 하나의 확률변수가 흩어진 정도를 측정하는 측도로서 분산(Variance)을 생각했다면, 두 확률 변수 X와 Y 사이의 흩어진 관계를 측정하는 측도로서 다음과 같이 정의되는 공분산(Covariance)을 생각할 수 있다 확률변수 X의 변동을 타나내는 측도로서 X가 평균 E(X)로부터 흩어져 있는(또는 밀집된) 정도를 다음과 같이 g(X) = [X-E(X)]2에 대한 기댓값으로 측정하고 분산(Variance)이라고 정의한다. 이 때 X가 그의 평균 E(X)로부터 멀리 떨어져 있는 경향이 많을수록 [X-E(X)]2의 값도 커지는 경향이 있는데, 그런 경우 자연히 분산도 커지게 된다. 편의상 확률변수 .. 2023. 8. 19.