전체 글(55)
-
[LeetCode] 197. Rising Temperature
내 첫 쿼리 SELECT id FROM (SELECT id ,recorddate ,temperature ,(LAG(temperature) OVER (ORDER BY id)) AS tem2 FROM weather) sub WHERE (temperature-tem2)>0 완성 쿼리 SELECT w.id FROM weather w JOIN weather w1 ON DATEDIFF(w.recordDate,w1.recordDate) = 1 AND w.temperature > w1.temperature 조인 조건 ON에 DATEDIFF 함수 사용 가능
2022.06.09 -
[빅분기] 결측값을 집단 평균값으로 대체
#집단별 평균확인 data.groupby('industry').mean() #lambda함수 구성 #평균으로 대체하는 함수 생성 fill_mean_func = lambda g : g.fillna(g.mean()) #lambda함수를 apply를 이용해 적용 data_group_mean = data.groupby('industry').apply(fill_mean_func) data_group_mean
2022.06.08 -
[Numpy] where 함수
data2 = data.copy() data2['sales_new'] = np.where(pd.notnull(data2['sales'])==True, data2['sales'], data2['salary'] ) data2 np.where(조건) : 기본적으로 조건에 맞는 인덱스를 리턴 해주는 함수, 슬라이싱에 이용 가능 np.where(조건, a, b) : 조건이 True이면 a의 식을 반영, False이면 b식을 반영
2022.06.08 -
[HackerRank] Weather Observation Station 5
SELECT city, LENGTH(city) FROM station ORDER BY 2 , 1 LIMIT 1 ; SELECT city, LENGTH(city) FROM station ORDER BY 2 DESC , 1 LIMIT 1 ; city의 이름의 길이가 가장 짧은 거, 가장 긴거 추출 쿼리 작성 하나로 작성할 수는 없었을까?
2022.06.08 -
[HackerRank] Weather Observation Station 3
내 쿼리 SELECT DISTINCT city FROM station WHERE MOD(id,2)=0 짝수 구현시 MOD 함수 이용하기
2022.06.07 -
통계 공부
p_value 상관관계 vs 인과관계 공분산 : 두 확률 변수의 상관정도를 나타내는 값 공분산 공분산은 확률변수 X의 편차(평균으로부터 얼마나 떨어져 있는지)와 확률변수 Y의 편차를 곱한 것의 평균값이다. 공분산이 0보다 크면 X가 증가할 때 Y도 증가한다는 뜻이다. 공분산이 0보다 작으면 X가 증가할 때 Y는 감소한다. 공분산이 0이면 두 변수 간에는 아무런 상관 관계가 없다. 이처럼 공분산을 통해 우리는 X의 증가에 따라 Y가 증가하는지 감소하는지에 대해서 알 수 있다. 다른 말로, 공분산은 두 변수 간에 양의 상관관계가 있는지, 음의 상관관계가 있는지 정도 알려준다. 하지만 상관관계가 얼마나 큰지는 제대로 반영하지 못한다. 공분산의 문제는 확률변수의 단위 크기에 영향을 많이 받는다는 것이다. 이를 ..
2022.06.07