본문 바로가기

카테고리 없음

[패스트캠퍼스 수강 후기] 데이터분석 인강 100% 환급 챌린지 5회차 미션

29. ch05_08 - 33. 06_03

안녕하세요. 기초과정이 끝나고 본격적으로 파이썬에 대해 배우고 있어요.

여전히 뭐가 뭔지 모르겠지만 아직 5일차니까 천천히 꾸준히 갈게요. 


ch05_08

1.
2. 문자의 길이

공백도 문자로 계산

a = 'banana'
len(a)
>6

a = 'banana pen'
len(a)
>10

3-1
쪼개기

a = 'This is a pen'

a.split(' ') - 공백기준
>['This', 'is', 'a', 'pen']

a = 'This-is-a-pen'
a.split('-') - '-' 기준
>['This', 'is', 'a', 'pen']

기준은 출력되지 않음.

list 형식으로 값 return
aa = a.split('-')
aa
>['This', 'is', 'a', 'pen']

aa[0]
>'This' (0부터 시작하는것 주의)

aa[2]
>'a'

aa[0] + aa[2]
>'Thisa'
문자열의 덧셈은 이어붙이는 것

3-2. 대문자/소문자로 만들기

a = 'My name is Teddy'
a.lower()
>my name is teddy'

a.upper()
>'MY NAME IS TEDDY'

한글은 대소문자 X

3-3. startswith, endswith ~로 시작하는, 끝나는(많이 사용)

a = '01-sample.png'
b = '02-sample.jpg'
c = '03-sample.pdf'

a.startswith('01')
>true
a가 01로 시작해? 참

my list[a, b]

for file in mylist:
if file.endswith('jpg'):
print(file)
>02.sample.jpg

3-4. replace(바꾸기)

a = '01-sample.png'
a.replace('png', 'jpg')
>'01-sample.jpg'

a
>'01-sample.png'(값이 변한 것이 아님.

new_a = a.replace('png', 'jpg')
new_a
>'01-sample.jpg'

3-5. 불필요한 공백 제거

strip 앞뒤 공백 제거
a = ' 01-sample.png '
b = '01-sample.png'
a == b
>False

a.strip()
>'01-sample.png'

a.strip() == b
>True


ch05_09

1. 패키지, 모듈, 함수의 관계도

함수들이 뭉쳐진 .py(파이썬) 파일 안에 있는 것 - 모듈
모듈 그룹화 - 패키지
패키지 - 라이브러리라고 부르기도 함.

2. 모듈 import
다른 사람이 만든 모듈을 우리가 가져다 쓰는 개념

import pandas

3. 패키지에서 import

from 패키지명 import 파일명

from pandas import DataFrame
DataFrame()


통째로 가져오기
import pandas
pandas.DataFrame()

'.'을 찍고 쓰면 됨

4. 별칭(alias) 짓기

pandas -> pd로
별명 지을 때는 as를 붙여줌
import pandas as pd(pandas를 pd라고 부를게)

5. 자주 사용하는 패키지, 모듈
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

numpy 과학계산
pandas 데이터분석
matplotlib 시각화
seaborn 시각화 (matplotlib를 더 쉽게 사용할 수 있도록 도움)

--------------------------- 기초과정 종료

31. ch06_01

1.
array(배열) 여러 값들의 그룹

1차원 배열
numpy.array([1,2,3,4])

2차원 배열(축의 갯수만큼)
numpy.array([[1,2,3,4],
[5, 6, 7, 8],
[9, 10, 11, 12],
[13, 14, 15, 16]])
괄호 끝에 있는 것들은 두번씩 써주기
한행씩 묶기

ndarray n차원의 dimension이 있는 것

shape 차원의 수 확인
axis 기준이 되는 축

32. ch6_02

1. Numpy import

import numpy
numpy
><module 'numpy' from '/usr/local/lib/python3.6/dist-packages/numpy/__init__.py'>

1-1 별칭 지정

import numpy as np

2. ndarray 생성

arr = np.array([1, 2, 3, 4], dtype=int)
타입이 정수

arr
array([1, 2, 3, 4])
>[1, 2, 3, 4]

type(arr) 타입이 무엇인가.
numpy.ndarray

2-1. list로부터 생성

mylist1 = [1, 2, 3, 4] 1차원

mylist2 = [[1, 2, 3, 4], 2차원
[5, 6, 7, 8]]

arr1 = np.array(mylist1)

arr2 = np.array(mylist2)

2-2. shape 확인

arr1.shape
>(4.) 4라고 하나 출력되면 1차원. 1차원의 갯수는 4개가 있다.

arr2.shape
>(2, 4)
행이 두개 컬럼이 4개인 2차원 array다.

3. array에서 data타입

3-1.
array - 1개의 단일 데이터 타입만 가능.
list에서는 섞여도 가능

mylist = [1, 3.14, '테디', '1234']
mylist
>[1, 3.14, '테디', '1234']

mylist[1]
> 3.14

3-2. array에서 data 타입

arr = np.array([1, 2, 3, 3.14])
arr
array([1, 2, 3, ....3.14])

3-2 array에서 data 타입

case 1. int(정수), float(실수) 타입 혼재

arr = np.array([1, 2, 3, 3.14])
arr
>array([1. , 2. , 3. , 3.14])

정수가 실수형으로 바뀜
1.0 2.0 3.0 으로 바뀐 것

case 2. int, float 혼재. dtype 지정

arr = np.array([1, 2, 3, 3.14], dtype=int)
arr
>array([1, 2, 3, 3])

실수가 정수로 바뀜

case 3. int와 str(문자열) 타입 혼재

arr = np.array([1, 3.14, '테디', '1234'])
arr
>array(['1', '3.14', '테디', '1234'], dtype='<U32')

다 문자열로 바뀜

case 4. int와 str 타입 혼재. int로 dtype 지정

arr = np.array([1, 3.14, '테디', '1234'], dtype=int)
> 에러

arr = np.array([1, 3.14, '1234'], dtype=int)
arr
>array([ 1, 3, 1234])
'1234'를 문자열로 지정했음에도 숫자로 바꾸어줌



 

패스트캠퍼스 데이터분석 강의 링크 

bit.ly/3imy2uN