IT

[빅데이터] 타이타닉 데이터 분석

구글 코랩 환경에서 데이터 분석을 진행하였으며, 이 데이터셋은 seaborn 라이브러리에 포함되어 있어 별도의 다운로드 없이 사용할 수 있다. 타이타닉 데이터셋의 주요 항목은 다음과 같다. 1. 데이터 요약 2. 결측값 3. 기본 통계 정보 간단한 분석 결과 1. 타이타닉 데이터셋 불러오기 import seaborn as sns# 타이타닉 데이터셋 불러오기titanic = sns.load_dataset(‘titanic’)print(titanic.head()) 2. 데이터 정보 확인 # 데이터 […]

[빅데이터] 타이타닉 데이터 분석 더 읽기"

[빅데이터] 소비자 특성 분석

구글 코랩 환경에서 데이터 분석을 진행하였으며, 사용한 데이터의 링크는 여길 눌러 들어가라 각 열(Column)에 대한 간단한 분석을 통해 이 CSV 파일에서 데이터 준비 과정을 아래 항목들을 고려한 데이터 분석 준비 과정을 설명하겠다. 1. ID (고객 식별 번호) 2. Year_Birth (출생 연도) 3. Education (학력 수준) 4. Marital_Status (결혼 상태) 5. Income (연간 소득) 6. Kidhome, Teenhome (어린

[빅데이터] 소비자 특성 분석 더 읽기"

[빅데이터] 와인 데이터 분석

구글 코랩 환경에서 데이터 분석을 진행하였으며, 사용한 데이터의 링크는 여길 눌러 들어가라 이 데이터는 와인의 여러 화학적 성분과 와인의 종류(화이트 와인 또는 레드 와인), 그리고 품질 등급을 포함하고 있다. 주요 열의 내용은 다음과 같다. 먼저 다운받은 데이터 파일을 코랩 환경에 올리고, 다음의 코드를 작성해주고 실행하자. 다음과 같은 결과가 나올 것이다. Unnamed: 0은 원래 인덱스로 사용되었던

[빅데이터] 와인 데이터 분석 더 읽기"

기본 게이트웨이 설명

기본 게이트웨이(Default Gateway)는 네트워크 상의 다른 네트워크로 데이터 패킷을 전송할 때 경로를 제공하는 장치다. 기본 게이트웨이는 로컬 네트워크(내부 네트워크)의 호스트(예: 컴퓨터, 서버)가 외부 네트워크(인터넷 등)와 통신할 수 있도록 한다. 특히, 네트워크 세그먼트가 다른 네트워크와 통신할 때 경로를 설정해 주는 라우터가 기본 게이트웨이 역할을 한다. 기본 게이트웨이의 역할 기본 게이트웨이는 네트워크에서 경로를 모르는 패킷을 처리하는 역할을

기본 게이트웨이 설명 더 읽기"

Subnet과 VLAN 차이

VLAN (Virtual Local Area Network)과 서브넷(subnet)은 네트워크의 세분화와 관리에 중요한 역할을 하지만, 목적과 동작 원리는 다르다. 이 차이를 스위치와 라우터, 그리고 브로드캐스트 트래픽을 이용한 예시를 통해 설명하겠다. VLAN (Virtual LAN) VLAN은 스위치에서 동작하며, 물리적인 네트워크를 논리적으로 나누는 기술이다. 같은 물리적 네트워크에 연결된 장치들이 있어도 서로 다른 VLAN에 속하는 장치들은 서로 통신할 수 없다. VLAN은 레이어

Subnet과 VLAN 차이 더 읽기"

쉽게 이해하는 패킷 구조

TCP/IP 프로토콜에서 패킷은 인터넷을 통해 데이터를 전송하는 기본 단위다. 인터넷이 데이터 패킷을 사용하는 이유와 이를 기반으로 어떻게 효율적으로 통신이 이루어지는지 간략하게 설명하겠다. 인터넷이 데이터 패킷을 사용하는 이유 인터넷에서 모든 데이터를 한 번에 보내지 않고, 작은 단위의 데이터(패킷)로 나누어 전송하는 이유는 대표적으로 세가지 이유가 있다. 회선 교환 방식 (Circuit Switching) vs 패킷 교환 방식 (Packet Switching)

쉽게 이해하는 패킷 구조 더 읽기"

데이터 통계 분석

기술통계학 (Descriptive Statistics) 기술통계학은 데이터의 일반적인 특성을 요약하는 방법으로, 데이터 분석에서 제일 먼저 사용된다. 기술통계는 데이터의 기본적인 특성을 설명하는 데 사용되는 수치다. 다음은 기술통계학적 수치를 나열 한 것이다. 이상치는 데이터 집합에서 다른 관측값들과 확연히 다른 값을 가지는 데이터 포인트를 말한다. 이상치는 측정 오류나 분포의 자연적 변동성 때문에 발생할 수 있고, 데이터 분석 결과에 큰 영향을

데이터 통계 분석 더 읽기"

로지스틱 회귀 원리와 성능 평가방법

로지스틱 회귀와 분류 모델의 성능 평가 지표는 분류 문제에서 중요한 개념들로, 각각을 이해하는 것이 모델의 해석과 성능 개선을 할 수 있다. 1. 로지스틱 회귀(Logistic Regression) 로지스틱 회귀는 회귀 분석과는 달리, 종속 변수가 범주형(이산적 값, 예: 0 또는 1)일 때 사용된다. 예를 들어, 이메일이 스팸인지 아닌지(스팸: 1, 정상: 0)와 같은 2진 분류에서 유용하다. 로지스틱 회귀는 독립

로지스틱 회귀 원리와 성능 평가방법 더 읽기"

L2스위치와 L3스위치

스위치의 개념 스위치는 네트워크에서 데이터 프레임을 전달하는 장치로, 주로 이더넷 네트워크에서 사용된다. 스위치는 네트워크 내에서 연결된 장치들 간의 데이터 전송을 효율적으로 관리하고, 각 포트 간의 트래픽을 분리해 충돌을 방지한다. MAC 주소를 기반으로 데이터를 전달하는 L2 스위치와 IP 주소를 기반으로 라우팅을 수행할 수 있는 L3 스위치가 있다. OSI 7계층 모델 OSI(개방형 시스템 상호 연결) 모델은 네트워크

L2스위치와 L3스위치 더 읽기"

충돌 도메인과 브로드캐스트 도메인

충돌 도메인(Collision Domain) 충돌 도메인은 네트워크 상에서 두 개 이상의 장치가 동시에 데이터를 전송하려고 할 때 발생할 수 있는 충돌(collision)이 일어나는 범위를 의미한다. 충돌이 발생하면 데이터가 망가져서 장치들이 다시 데이터를 전송해야 하므로 네트워크 성능이 저하된다. 스위치를 사용하는 경우 브로드캐스트 도메인(Broadcast Domain) 브로드캐스트 도메인은 브로드캐스트 패킷이 도달할 수 있는 네트워크 영역을 의미한다. 네트워크 상에서 브로드캐스트 메시지는

충돌 도메인과 브로드캐스트 도메인 더 읽기"

위로 스크롤