목록Python Study (25)
Studio KimHippo :D
# -*- coding : utf-8 -*- # NOTE : 집합 자료형 # NOTE # 집합 자료형은 중복된 값은 저장되지 않는다. # 집합 자료형은 순서가 없다. s1 = set([1, 2, 3]) s2 = set('Hello') print(s1) print(s2) l1 = list(s1) t1 = tuple(s1) print(s1) print(l1) print(t1) # NOTE # 집합 자료형은 인덱싱이나 슬라이싱을 할 때 리스트나 튜플로 바꿔서 해야한다. print(l1[0]) print(t1[:2]) # NOTE : 집합 연산 s3 = set([1, 2, 3, 4, 5, 6]) s4 = set([4, 5, 6, 7, 8, 9]) # NOTE : 교집합 print(s3 & s4) print(s4..
# -*- coding : utf-8 -*- # NOTE : 딕셔너리 자료형 # NOTE # 딕셔너리 자료형은 키와 밸류로 구성됨. dic = {'name' : 'pey', 'phone' : '0119993323', 'birth' : '1118'} dic2 = {1 : 'hi'} dic3 = {'a' : [1, 2, 3]} print(dic) print(dic2) print(dic3) # NOTE : 딕셔너리 쌍 추가, 삭제 # NOTE : 쌍 추가 dic4 = {1:'a'} dic4[2] = 'b' dic4['name'] = 'pey' print(dic4) # NOTE : 쌍 삭제 del dic4['name'] print(dic4) # NOTE : Key를 이용해 value얻기 dic5 = {'pey'..
# -*- coding : utf-8 -*- # NOTE : 튜플 자료형 # NOTE : 리스트와 튜플의 차이 # 리스트 : 값을 수정, 삭제, 삽입 할 수 있음. # 튜플 : 값을 수정, 삭제, 삽입 할 수 없음. # NOTE : 단지 하나의 요소를 가질 때에는 반드시 ,가 있어야함. tup1 = (1,) tup2 = 1, 2, 3 # = (1, 2, 3) tup3 = ('a', 'b', ('ab', 'cd')) print(tup1) print(tup2) print(tup3) # NOTE : 튜플 인덱싱, 슬라이싱 tup4 = (1, 2, 'a', 'b') print(tup4[0]) print(tup4[3]) print(tup4[1:]) print(tup4[:2]) # NOTE : 튜플 관련함수 # N..
# -*- coding : utf-8 -*- import pandas as pd import numpy as np # NOTE # Series 객체는 1차원 NumPy 배열과 표준 파이썬 딕셔너리처럼 동작. # NOTE # Series 객체는 딕셔너리와 마찬가지로 키의 집합을 값의 집합에 매핑 data = pd.Series(np.linspace(0.25, 1, 4), index = ['a', 'b', 'c', 'd']) print(data['b']) print('a' in data) print(data.keys()) print(list(data.items())) # NOTE # 딕셔너리와 마찬가지로 새로운 키에 값을 할당해 Series를 확장시킬 수 있다. data['e'] = 1.25 print(dat..
# -*- coding : utf-8 -*- import pandas as pd import numpy as np # NOTE # Series : 인덱싱된 데이터의 1차원 배열 data = pd.Series([0.25, 0.50, 0.75, 1.00]) print(data, '\n') # NOTE : Series는 일련의 값과 인덱스를 모두 감싸고 있다. # NOTE : 값과 인덱스는 각각 values와 index 속성으로 접근할 수 있다. print(data.values) print(data.index) # NOTE # NumPy 배열은 인덱스가 정수로 정해져 있지만, # Pandas의 Series는 인덱스가 어떤 타입의 값으로도 구성할 수 있다. data2 = pd.Series([0.25, 0.50,..
필요패키지 로드 # -*- coding : utf-8 -*- %matplotlib inline import matplotlib.pyplot as plt import seaborn as sns import numpy as np sns.set() rand = np.random.RandomState(42) 데이터생성 # NOTE : 2차원 평면에 임의의 점 10개 추출 x = rand.rand(10, 2) plt.scatter(x[:,0], x[:,1], s=100) 좌표 제곱거리 # NOTE : 각 쌍의 점 사이의 좌표 차이 계산 diff = x[:, np.newaxis, :] - x[np.newaxis, :, :] diff.shape # NOTE : 좌표 차이를 제곱함. sq_diff = diff**2 p..
필요 패키지 로드 # -*- coding : utf-8 -*- %matplotlib inline import matplotlib.pyplot as plt import seaborn as sns import pandas as pd import numpy as np import os # os.chdir('./Python-Practice/Python Practice from Windows/numpy/data') print(os.getcwd()) sns.set() 데이터 로드 및 마스크 생성 data = pd.read_csv('Seattle2014.csv', engine='python') rainfall = data['PRCP'].values inches = rainfall / 254 rainy = (inche..
필요 패키지 로드 %matplotlib inline import matplotlib.pyplot as plt import pandas as pd import numpy as np import seaborn seaborn.set() # NOTE : 플롯 스타일 설정 미국 대통령 키 추출 data = pd.read_csv('president_heights.csv') heights = np.array(data['height(cm)']) Out [1] : array([189, 170, 189, 163, 183, 171, 185, 168, 173, 183, 173, 173, 175, 178, 183, 193, 178, 173, 174, 183, 183, 168, 170, 178, 182, 180, 183, 178..