전체 글(55)
-
View
VIEW 가상의 테이블, 실제 데이터를 저장하지 않고 데이터의 주소 값만 가짐 한마디로 특정 컬럼의 데이터를 보여주는 역할 쿼리를 간단하게 줄여주는 기능 수정 및 인덱스 설정이 불가능 View 코드 CREATE VIEW AS (QUERY) View 사용 예제 use world; select sub1.continent, sub1.region, count(sub1.region) as count from ( select distinct country.continent, country.region, countrylanguage.language from country join countrylanguage on country.code = countrylanguage.countrycode ) as sub1 group..
2022.03.20 -
Excel을 이용한 데이터 분석
기초통계량 정리 합계 : SUM(범위) 중앙값 : MEDIAN(범위) 최대값 : MAX(범위) 최소값 : MIN(범위) 평균 : AVERAGE(범위) 최빈값 : MODE(범위) 분산 : VAR(범위) 표준편차 : STDEV(범위) 피벗테이블 BOXPLOT & 산점도 사분위수 : QUARTILE(범위 , 데이터종류지정) 데이터 전처리 =IF(logical_test , [value_if_true] , [value_if_false] ) ( 조건(가정) , 조건을 만족할 경우 , 조건을 만족하지 않을 경우) =VLOOKUP( 찾을 기준 데이터 , 데이터 범위 , 불러올 데이터 열 번호 , 0 or 1) (0 : FALSE 정확히 일치 / 1 : TRUE 근사치 (defalt)) =MATCH(lookup_valu..
2022.03.20 -
Visualization - Seaborn
Seaborn이란? matplotlib을 기본으로 다양한 시각화 기법을 제공하는 라이브러리 pandas DataFrame과 매우 호환이 잘 됨 matplotlib에서 지원하지 않는 다양한 형태의 시각화도구를 제공 예시 : histplot, kdeplot, jointplot, Facetgrid, ... # 패키지 설치 !pip install seaborn # 패키지 import import seaborn as sns sns.set_theme(style='whitegrid') penguins 데이터 불러오기 penguins = sns.load_dataset("penguins") penguins Histplot 가장 기본적으로 사용되는 히스토그램을 출력하는 plot 전체 데이터를 특정 구간별 정보를 확인할 때..
2022.03.18 -
Pandas
Pandas란? pandas는 "python data analysis"의 약자 테이블형태로 데이터를 다룰 수 있게 해주는 패키지 (python용 엑셀) !pip install pandas # pandas install import pandas as pd ## option setting # 불러들이는 데이터에 맞춰 모든 컬럼을 확인 가능하도록 옵션값 설정 pd.options.display.max_columns = 200 pd.options.display.max_info_columns =200 DataFrame 테이블형태의 데이터 구조 다양한 형태의 데이터를 받아 사용할 수 있으며 다양한 통계, 시각화 함수를 제공 !pip install xlrd !pip install openpyxl !pip install..
2022.03.18 -
Numpy
What is Numpy? numpy는 "numerical python"의 약자 Numerical Computing : 컴퓨터가 실수값을 효과적으로 계산할 수 있도록 하는 연구 분야 Vector Arithmetic : 벡터 연산 > 데이터가 벡터로 표현되기 때문 numpy는 다양한 머신러닝 라이브러리들에 의존성을 가지고 있고, 일반 파이썬 리스트에 비해 강력한 성능을 자랑gka 성능 : numpy array >> python list (or tuple) python list와 비슷한 개념을 numpy에서는 numpy array라고 부름 : 파이썬 리스트처럼 여러 데이터를 한번에 다룰 수 있으나, 모든 데이터가 동일한 data type을 가져야함 Numpy Basics 주피터 노트북에서 Numpy 설치 !..
2022.03.18 -
Function
Function이란? 하나의 기능을 나타냄 특정 기능을 구현한 코드 묶음 함수를 사용하는 가장 중요한 이유는 재사용상 때문 def 함수이름(param1, param2, ... ): return 전역변수, 글로벌변수 함수 밖에서 정의가 되었어도 함수 내부에서 자유롭게 호출해서 사용이 가능 age = 28 age # 함수정의 def person_nm(name,mail) : print(f'제 이름은 {name},{age},{mail}입니다.') # 함수실행 코드 def person_nm('Eddy','mail23@gmail.com') 지역변수, 로컬변수 함수 내부에서 정의 된 age 변수는 함수 내부에서만 정의되는 변수로서 함수 밖에서는 호출할 수 없음 그렇기에 다른 함수에서 같은 이름의 변수를 사용해도 관계..
2022.03.18