본문 바로가기

빅데이터 분석2

[Dacon] 교육 - 정형 데이터 분석 파이프라인 (오늘의 파이썬) #. 정형 데이터 분석의 전체 파이프라인 탐색적 데이터 분석(EDA) 데이터 전처리 머신러닝 모델링 모델 튜닝 1️⃣ 탐색적 데이터 분석(EDA) EDA : 처음 데이터를 수집하였을 때 다양한 각도에서 관찰하고 이해하는 과정. EDA 과정이 필요한 이유는 데이터 분석을 시작 하기전에 데이터에대한 100% 이해가 필요하기 때문. 데이터를 잘 이해하고 파악하여야 목적에 맞게 데이터를 정제 시킬 수 있고 더 나아가 새로운 인사이트를 도출 할 수 있게 될 것. EDA 기초 내용🤴👸 라이브러리 불러오기 (import) 파일 불러오기 (read_csv()) 행열갯수 관찰하기 (shape) 데이터 확인하기 (head()) 결측치 유무 확인하기 isnull().sum() 데이터 결측치 확인하기 (info()) 수치데이.. 2022. 4. 22.
[빅데이터] AI Hub AI Hub AI Hub는 한국지능정보사회진흥원이 운영하는 AI 통합 플랫폼이다. 2017년 AI 학습용 데이터 구축·확산 사업의 일환으로 AI 기술·서비스 개발에 필수적인 AI데이터, 소프트웨어, 컴퓨팅자원, 소재정보 등을 원스톱으로 제공하는 것을 목적으로 한다. AI 허브 AI 허브는 AI 기술 및 제품·서비스 개발에 필요한 AI 인프라(AI 데이터, AI SW API, 컴퓨팅 자원)를 지원함으로써 누구나 활용하고 참여하는 AI 통합 플랫폼입니다. aihub.or.kr 2022. 4. 19.