Data Analysis 4

데이터 분석 도구 : Pandas

4. 데이터 분석 도구 : Pandas4-1. Pandas 시작하기4-1-1. pandas 개요💡pandas는 데이터 분석과 조작을 위해 설계된 파이썬 라이브러리로, 특히 구조화된 데이터(예: 테이블 형태의 데이터) 처리에 강력하다. pandas는 데이터프레임(DataFrame)이라는 구조를 중심으로 빠르고 직관적인 데이터 처리 및 분석을 지원한다.pandas는 매우 잘 정리된 공식 문서를 제공한다. 문서에는 함수별 설명, 예제, 사용 방법이 모두 포함되어 있다. 공식 문서 링크는 다음과 같다.https://pandas.pydata.org/docs/pandas의 특장점복잡한 데이터를 간단하게 조작할 수 있는 고수준의 API를 제공한다.CSV, Excel, SQL 등 다양한 데이터 소스를 지원하여, 불러..

데이터 분석 도구 : NumPy

3. 데이터 분석 도구 : NumPy3-1. NumPy 시작하기3-1-1. NumPy 개요💡NumPy란 Numerical Python의 줄임말로, 대규모 다차원 배열과 행렬 연산을 지원하는 파이썬 라이브러리이다. NumPy는 수학적 연산을 빠르고 효율적으로 수행할 수 있도록 설계되어 있어, 데이터 분석, 머신러닝, 인공지능, 이미지 처리, 신호 처리, 통계 분석 등 여러 분야에서 활용된다. NumPy의 주요 특징NumPy의 핵심 자료 구조인 ndarray는 다차원 배열을 효율적으로 관리할 수 있다.벡터화 연산(Vectorized Operations)을 통해 for문을 사용하지 않고 배열 간 연산을 빠르게 수행할 수 있다.선형대수, 통계, 푸리에 변환 등 다양한 수학적 연산을 함수로 지원한다.파이썬 리스..

데이터 분석 도구: 배열(연산, 인덱싱, 슬라이싱)

2. 데이터 분석 도구 시작2-1. 리스트 다시 보기2-1-1. 리스트를 다시 짚고 넘어가는 이유는?데이터 구조의 기본 개념을 이해하는 데 필수적이다.데이터 분석 도구로 알아볼 Numpy의 ndarray와 Pandas의 Series/DataFrame은 파이썬 리스트와 유사한 구조를 갖고 있다.Numpy의 ndarray는 다차원 배열로, 파이썬의 리스트를 확장하여 수치 계산에 최적화된 형태이다.Pandas의 Series와 DataFrame은 각각 1차원 및 2차원 데이터 구조로, 인덱싱과 슬라이싱 개념을 활용한다.따라서 리스트의 개념을 이해하면 Numpy와 Pandas의 데이터 구조를 쉽게 습득할 수 있고, 내부 동작을 이해할 수 있다.인덱싱과 슬라이싱은 데이터 접근과 조작의 기본이다.데이터 분석에서는 특..

데이터 분석(Data Analysis) 이란?

1. 데이터 분석1-1. 데이터 과학1-1-1. 데이터란💡이론을 세우는 데 기초가 되는 사실 또는 자료[컴퓨터] 프로그램을 운용할 수 있는 형태로 기호화 또는 숫자화한 자료(출처 : Oxford Languages)1-1-2. 데이터의 종류정형 데이터고정된 구조를 가진 데이터로, 일반적으로 행과 열로 구성된 표 형태로 저장된다.예시 : 관계형 데이터베이스, 스프레드시트 파일(Excel, CSV 등)비정형 데이터고정된 구조가 없는 데이터로, 다양한 형태와 형식을 가진다.예시 : 텍스트, 멀티미디어(이미지, 동영상, 오디오 등)1-1-3. 데이터 과학이란💡데이터 과학은 비즈니스에 대한 의미 있는 인사이트를 추출하기 위한 데이터 연구로서, 수학, 통계, 인공 지능 및 컴퓨터 공학 분야의 원칙과 사례를 결합하..