반응형
파이썬을 이용한 머신러닝 강의를 듣던 중 내용을 정리해봄
우선 데이터 분석을 하기 위해서 자주 사용되는 패키지들을 모아놓은 아나콘다를 설치하자.
<패키지 설치 명령어>
conda create -n ML_study python=3.6 numpy=1.16.4 pandas matplotlib scikit-learn=0.20 scipy=1.1 pillow
numpy
- 과학 계산을 하기 위해 필요한 패키지
- 다차원 배열을 위한 기능과 선형 대수 연산 제공
- 반복문 필요없이 전체 데이터 배열에 대해 빠른 연산 및 표준 수학 함수 제공
- 난수 생성기 기능 제공
- ndarray 객체 생성방법: numpy.array(object, dtype, copy, order, subok, nadmin)
- ndarray 생성 함수: array, arange, linspace, ones, zeros, empty
기본적인 numpy 사용법
import numpy as np
data = [6, 7.5, 8, 0, 1]
arr = np.array(data)
print(arr)
data2 = [[1, 2, 3, 4], [5, 6, 7, 8]]
arr2 = np.array(data2)
print(arr2)
print(arr2.ndim) # 2
print(arr2.shape) # (2, 4)
print(arr2.dtype) # int32
print(np.arange(14))
float_arr = arr.astype(np.float32)
print(float_arr)
arr = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
print(arr[:2])
예제2
import numpy as np
np.random.seed(12345)
names = np.array(['Bob', 'Joe', 'Will', 'Bob', 'Will', 'Joe', 'Joe'])
data = np.random.randn(7, 4)
print('\n', names == 'Bob')
print('\n', data[names == 'Bob'])
arr = np.arange(8)
arr2 = arr.reshape((4,2))
예제3
import numpy as np
arr = np.random.randn(5, 4)
print(arr.mean())
print(arr.mean(axis=1)) # axis가 1이면 행, 0이면 열
x = np.array([[1,2,3], [4,5,6]])
y = np.array([[6,23], [1,-7], [8,9]])
print(x.dot(y))
반응형
'Data Analysis' 카테고리의 다른 글
크롤링이 안 되는 경우 (User-Agent) (0) | 2022.04.30 |
---|---|
파이썬 sqlite3(데이터베이스) 모듈 사용 (0) | 2020.11.12 |
엑셀 빈 셀에 한 번에 특정 값 입력하기 (0) | 2020.11.12 |
파이썬 openpyxl (차트) (0) | 2020.11.11 |
파이썬 openpyxl (0) | 2020.11.11 |