본문 바로가기

전체 글

(124)
데이터 개요 본 문서는「2026 이기적 빅데이터분석기사 필기 기본서」를 바탕으로 데이터의 개론을 다룬다.이 글은 데이터의 정의와 속성, 수집 과정을 다룬 후, 데이터가 정보와 지식으로 전환되어 가치가 창출되는 과정을 순차적으로 살펴본다. 01 데이터의 정의 "데이터(data)"는 1646년 영국 문헌에 처음 등장한 용어로, 라틴어 datum에서 유래하며 "주어진 것"을 의미한다.1940년대 이전까지 데이터는 관념적·추상적 개념으로 인식되었으나,이후 자연과학과 사회과학의 발달과 함께 기술적·사실적 개념으로 변화하였다. 데이터는 다음 두 가지 관점에서 이해할 수 있다. 1 | 추론과 추정의 근거가 사실 2 | 현실 세계에서 관찰·측정을 통해 수집한 사실 데이터의 특징은 다음 네 가지로 요약할 수 있다. ..
경사하강법 (Gradient Descent) Reporting Date: October. 01, 2025선형대수를 통한 기계학습의 수학적 기초와 최적화 원리에 대해 다루고자 한다.목차01 지도학습의 기본원리02 손실 함수와 최적화의 원리03 경사하강법04 손실 함수 최적화 01 지도학습의 기본 원리 지도학습(SL)은 인공지능 학습 방법 중 가장 기초적이면서도 널리 사용되는 형태이다.지도학습에서는 입력값(input)과 그에 대응하는 정답값(output)이 모두 주어진 데이터를 바탕으로, 모델이 입력과 출력 간의 규칙을 학습한다. 1 . 데이터셋의 구성과 의미 지도학습에 사용되는 데이터셋(dataset)은 이미 발생한 사건이나 관측 결과를 정리한 형태로, 각 데이터 샘플은 입력 변수(독립변수)와 이에 대응하는 결과 변수(종속변수)를 포함한다.즉..
제 8장 - 오즈비 Reporting Date: October. 5, 2024 오즈비와 연구 설계에 대해 다루고자 한다.목차01 오즈비02 코호트 연구03 사례 대조 연구 01 오즈비Odds Ratio, OR앞서 다룬 카이제곱 검정과 로그 우도비 검정은 범주형 변수 간의 통계적 유의성을 판단하는 데 초점을 두었다.본 장에서는 그 관계의 크기(효과 크기) 를 수치화하는 지표인 오즈비(OR) 를 다룬다. 두 집단 간 사건 발생 가능성의 상대적 비교를 제공하며, 특히 2×2 분할표 분석과 로지스틱 회귀분석에서 널리 사용된다. 위험비(Risk Ratio)와 유사하지만, 사건이 발생할 확률 대비 발생하지 않을 확률(odds)의 비율을 사용한다. 1 . 정의 및 기본 공식두 집단(노출 vs 비노출)에 대해 사건(또는 성공)의 발..
제 8장 - 카이제곱 통계 Reporting Date: October. 5, 2024질적변수의 분석에 널리 이용되는 다항분포, 카이제곱검정을 소개하고교차표에 대한 기초적인 분석에 대해 다루고자 한다.목차01 데이터의 분류02 카이제곱 분포03 카이제곱 적합도 검정04 교차분석 01 데이터의 분류 1 . 양적 데이터Quantitative Data관찰 대상의 속성을 수치로 측정할 수 있는 데이터로, 덧셈과 뺄셈 등의 산술 연산이 가능하다.척도의 성격에 따라 구간 척도와 비율 척도로 구분된다.① 구간 척도 (Interval Scale)값들 간의 간격이 일정하다는 특성을 지니며, 절대적 영점이 존재하지 않는다.따라서 0은 속성의 부재(absence)를 의미하지 않으며, 덧셈과 뺄셈은 가능하지만 곱셈이나 나눗셈을 통한 비율 비교는 ..
SVM: 비확률적 마진 기반 분류기 Reporting Date: September. 24, 2025SVM, 즉 비확률적 마진 기반 분류기에 대해 다루고자 한다.목차01 서포트 벡터 머신02 데이터 벡터의 표현03 토큰 수와 표현의 제약04 SVM의 핵심 개념05 SVM의 최적화 문제06 모델 일반화와 조정 더보기 수준별 이해도① 데이터 정제 및 전처리대상: 기존 IT 인력요구 수준: 기본적인 이해로 충분하며, 실무 적용 중심내용: 결측치 처리, 이상치 제거, 형식 변환 등 데이터의 품질을 높이는 작업② 모델링(연계 결합, 파이프라인 구성)대상: 석사 및 박사 수준의 연구자요구 수준: 심층적인 이해와 설계 능력 필요내용: 모델의 구조 설계, 학습 및 추론 과정의 최적화, 다양한 알고리즘의 조합 및 실험③ 알고리즘 설계대상: 석사 및 박사..
머신러닝: Credit Approval Reporting Date: September. 17, 2025 의사결정트리 기반 신용평가 분석에 대해 다루고자 한다. 목차01 Credit Approval 02 암맹처리03 ID3 의사결정트리 분할 전략04 의사결정트리의 한계 01 Credit Approval UCI의 Credit Approval 데이터셋의 일부 속성(attribute)들을 보고,어떤 속성을 학습 가설(feature set)에 포함하는 것이 더 좋은지를 판단하고자 한다.더보기 참고자료 Machine Learning in Korean (1) | 카이스트 응용인공지능 연구실" data-og-description="" data-og-host="aai.kaist.ac.kr" data-og-source-url="https://aai.ka..
머신러닝: EnjoySport Reporting Date: September. 17, 2025 의사결정트리 학습 과정에서 활용되는 개념에 대해 다루고자 한다.목차01 함수 근사02 노드 불순도 측정 지표03 정보 이득 01 함수 근사Function Approximation기계학습(supervised learning, 개념학습) 관점에서가설(hypothesis)과 목표 함수(target function) 관계를 설명하고자 한다. Introduction to Machine Learning and Design of a Learning SystemLet me go to the google trend, and understand the trend of the keywords — Machine Learning, data science, ar..
머신러닝: 실무 사례 Reporting Date: September. 17, 2025 반도체 HBM 공정과 스마트 CCTV를 중심으로 머신러닝의 실제 활용에 대해 다루고자 한다.목차01 제조 공정 혁신02 서울시 스마트 CCTV 시스템 01 제조 공정 혁신 1 . 과거 제조업 현장오랜 기간 아날로그 방식의 공정 관리에 의존해 왔으나 글로벌 경쟁 심화와 공정 복잡성 증가로 인해 단순 수작업이나경험 중심의 운영만으로는 품질과 효율성을 확보하기 어려워졌다.이에 따라 디지털 전환(DX) 과 인공지능 전환(AX) 은제조업 경쟁력 강화를 위한 핵심 과제로 부상하였다. DX와 AI 트랜스포메이션의 개념을 정리하고,실제 사례로서 반도체 HBM 적층 공정의 기술적 차이를 분석한다. 2 . Digital Transformation ..