Data Analysis

파이썬 numpy

알로그 2021. 2. 20. 19:58
반응형

파이썬을 이용한 머신러닝 강의를 듣던 중 내용을 정리해봄

우선 데이터 분석을 하기 위해서 자주 사용되는 패키지들을 모아놓은 아나콘다를 설치하자.

<패키지 설치 명령어>

conda create -n ML_study python=3.6 numpy=1.16.4 pandas matplotlib scikit-learn=0.20 scipy=1.1 pillow

numpy

  • 과학 계산을 하기 위해 필요한 패키지
  • 다차원 배열을 위한 기능과 선형 대수 연산 제공
  • 반복문 필요없이 전체 데이터 배열에 대해 빠른 연산 및 표준 수학 함수 제공
  • 난수 생성기 기능 제공
  • ndarray 객체 생성방법: numpy.array(object, dtype, copy, order, subok, nadmin)
  • ndarray 생성 함수: array, arange, linspace, ones, zeros, empty

 

 

 

기본적인 numpy 사용법

import numpy as np

data = [6, 7.5, 8, 0, 1]
arr = np.array(data)
print(arr)

data2 = [[1, 2, 3, 4], [5, 6, 7, 8]]
arr2 = np.array(data2)
print(arr2)
print(arr2.ndim)    # 2
print(arr2.shape)   # (2, 4)
print(arr2.dtype)   # int32

print(np.arange(14))

float_arr = arr.astype(np.float32)
print(float_arr)

arr = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
print(arr[:2])

예제2

import numpy as np

np.random.seed(12345)

names = np.array(['Bob', 'Joe', 'Will', 'Bob', 'Will', 'Joe', 'Joe'])
data = np.random.randn(7, 4)

print('\n', names == 'Bob')
print('\n', data[names == 'Bob'])

arr = np.arange(8)
arr2 = arr.reshape((4,2))

예제3

import numpy as np

arr = np.random.randn(5, 4)
print(arr.mean())
print(arr.mean(axis=1))  # axis가 1이면 행, 0이면 열

x = np.array([[1,2,3], [4,5,6]])
y = np.array([[6,23], [1,-7], [8,9]])
print(x.dot(y))
반응형