Python(22)
-
빅분기 실기 Chapter1
- 파이썬의 자료형 : 숫자형, 문자형, 리스트, 튜플, 집합, 사전, 논리(불리언) - if문 형식 if (조건문) : 명령어1 elif (조건문) : 명령어2 else : 명령어3 - 반복문 1. for 문 2. whilea 문 : 특정 조건까지 계속 반복 for 변수 in 리스트/튜플/문자열 : 수행할 문장1 수행할 문장2 while : 수행할 문장1 수행할 문장2 - numpy import numpy as np 사용법 (함수) 설명 np.abs(arr) 절대값 리턴 np.sqrt(arr) 제곱근(루트) 계산 np.square(arr) 제곱 계산 np.exp(arr) 지수 계산 np.Log(arr) 로그 계산 np.add(arr1,arr2) arr1 + arr2 : 두 배열을 더함 np.subtra..
2022.06.07 -
Crawling
크롤링 진행 순서 1. url정의 2. requsts로 url에 정보요청 3. 정보를 html 변환 (보기 쉽게) 4. html 내에서 뉴스헤더 선별 BeautifulSoup 사용 requests는 요청을 받기는 하지만 text로만 받음 API는 통신을 위해 정형화 된 데이터 형태의 text 우리가 원하는 데이터로 가공하기 위해 편의상 html로 변환 text를 html로 변환하는 모듈이 beautifulSoup import requests # 크롤링에 사용하는 패키지 # 컴퓨터간 통신을 위한 여러가지 기능들을 파이썬으로 제어할 수 있도록 하는 패키지 from bs4 import BeautifulSoup # html 변환에 사용함 url = ' 크롤링 하고 싶은 페이지 url ' rep = request..
2022.03.24 -
Pandas 함수
df.value_counts() df.value_counts() # 값의 갯수를 카운트 df['AM or PM'].value_counts() df.shape df.shape len() len(df[df['Language']=='en']) groupby() df.groupby('Language')['Purchase Price'].sum().sort_values(ascending=False) pivot_table() pd.pivot_table(df, index='CC Provider' , columns='AM or PM' , values='Purchase Price' , aggfunc=np.mean , ) contains() df[df['Address'].str.contains('Apt')].groupby(..
2022.03.23 -
Visualization - Matplotlib
파이썬의 대표적인 시각화 패키지 패키지의 이름에서 느껴지듯 MATLAB의 수리데이터 시각화를 파이썬으로 옮겨온 컨셉 기본적인 형태의 다양한 시각화 함수를 제공 !pip install matplotlib import matplotlib.pyplot as plt %matplotlib inline 윈도우 한글 폰트 사용 # family 파라메터에 사용가능한 폰트이름 전달(가장 간단한 방법) plt.rc('font', family='NanumGothic') # 사용가능한 폰트 목록 확인 import matplotlib.font_manager as fm fm.get_fontconfig_fonts() Line plot 시간 혹은 순서에 따라 데이터가 어떻게 변화하는지를 보기위해 주로 사용 plot( x축데이터, y..
2022.03.23 -
Class
클래스란? 같은 목적 혹은 대상을 위해 만들어진 함수들의 묶음 class [클래스명] : #클래스의 선언 def __init__ (self, [파라메터]): self.[변수명] = [파라메터] self.x = x def [함수명] ([self, 파라메터]): [실행코드] 클래스의 선언은 함수와 달리 소괄호 없이 선언한다 클래스명은 단어의 첫 알파벳을 대문자로 ex) MyClass, SumTotal 클래스 선언이후 처음 작성되는 __init__ 함수는 클래스가 정의되면서 입력되는 파라메터를 저장하고 재사용하기 위한 초기화 함수 클래스 내 함수의 파라메터 앞에는 항상 self를 추가해주어야 하며 __init__ 함수에서 설정한 변수 사용시에도 self를 추가해준다 self. 변수는 클래스 내부에서 사용되며 ..
2022.03.21 -
Visualization - Seaborn
Seaborn이란? matplotlib을 기본으로 다양한 시각화 기법을 제공하는 라이브러리 pandas DataFrame과 매우 호환이 잘 됨 matplotlib에서 지원하지 않는 다양한 형태의 시각화도구를 제공 예시 : histplot, kdeplot, jointplot, Facetgrid, ... # 패키지 설치 !pip install seaborn # 패키지 import import seaborn as sns sns.set_theme(style='whitegrid') penguins 데이터 불러오기 penguins = sns.load_dataset("penguins") penguins Histplot 가장 기본적으로 사용되는 히스토그램을 출력하는 plot 전체 데이터를 특정 구간별 정보를 확인할 때..
2022.03.18