쉽게 이해하는 인공 신경망(ANN) 2025년 10월 25일 · # IT # 빅데이터 1. 인공 신경망이란? 우리가 무언가를 보고, 듣고, 생각하는 모든 과정은 뇌 속 수많은 신경세포, 즉 뉴런(Neuron)들의 복잡한 상호작용 덕분이다. 각각의 뉴런은 다른 뉴런들로부터 전기적 신호를 받는데, 이때 들어오는 신호가 충분히 강하지 않으면 아무런 반응도 하지 않는다.…
로지스틱 회귀 원리와 성능 평가방법 2024년 10월 13일 · # IT # 빅데이터 로지스틱 회귀와 분류 모델의 성능 평가 지표는 분류 문제에서 중요한 개념들로, 각각을 이해하는 것이 모델의 해석과 성능 개선을 할 수 있다. 1. 로지스틱 회귀(Logistic Regression) 로지스틱 회귀는 회귀 분석과는 달리, 종속 변수가 범주형(이산적 값, 예: 0…
데이터 통계 분석 2024년 10월 14일 · # IT # 빅데이터 기술통계학 (Descriptive Statistics) 기술통계학은 데이터의 일반적인 특성을 요약하는 방법으로, 데이터 분석에서 제일 먼저 사용된다. 기술통계는 데이터의 기본적인 특성을 설명하는 데 사용되는 수치다. 다음은 기술통계학적 수치를 나열 한 것이다. 이상치는 데이터 집합에서 다른 관측값들과 확연히 다른 값을…
[빅데이터] 와인 데이터 분석 2024년 10월 18일 · # IT # 빅데이터 구글 코랩 환경에서 데이터 분석을 진행하였으며, 사용한 데이터의 링크는 여길 눌러 들어가라 이 데이터는 와인의 여러 화학적 성분과 와인의 종류(화이트 와인 또는 레드 와인), 그리고 품질 등급을 포함하고 있다. 주요 열의 내용은 다음과 같다. 먼저 다운받은…
[빅데이터] 소비자 특성 분석 2024년 10월 25일 · # IT # 빅데이터 구글 코랩 환경에서 데이터 분석을 진행하였으며, 사용한 데이터의 링크는 여길 눌러 들어가라 각 열(Column)에 대한 간단한 분석을 통해 이 CSV 파일에서 데이터 준비 과정을 아래 항목들을 고려한 데이터 분석 준비 과정을 설명하겠다. 1. ID (고객 식별 번호) 2.…
[빅데이터] 타이타닉 데이터 분석 2024년 10월 26일 · # IT # 빅데이터 구글 코랩 환경에서 데이터 분석을 진행하였으며, 이 데이터셋은 seaborn 라이브러리에 포함되어 있어 별도의 다운로드 없이 사용할 수 있다. 타이타닉 데이터셋의 주요 항목은 다음과 같다. 1. 데이터 요약 2. 결측값 3. 기본 통계 정보 간단한 분석 결과…
쉽게 이해하는 유전자 알고리즘 2025년 10월 25일 · # 빅데이터 1. 유전자 알고리즘이란? 이 글 보러 들어온 사람이라면 대충 이게 뭘 하는건지 쯤은 알고 있을거라 생각한다.모르는 사람을 위해 개념 요약을 적어 놓았다. 2. 이걸 왜 쓸까? 최적화 문제를 푸는 전통적인 방식은 대부분 한 지점에서 시작하여 정해진…
쉽게 이해하는 로지스틱 회귀분석 2025년 10월 25일 · # IT # 빅데이터 1. 로지스틱 회귀 분석이란? 우리가 데이터를 분석할 때 푸는 문제는 크게 두 가지로 나눌 수 있다. 하나는 ‘공부한 시간에 따라 시험 점수가 몇 점일까?’처럼 연속적인 값을 예측하는 문제이고, 다른 하나는 ‘공부한 시간에 따라 시험에 합격할까, 불합격할까?’처럼 정해진 몇…