| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | |||
| 5 | 6 | 7 | 8 | 9 | 10 | 11 |
| 12 | 13 | 14 | 15 | 16 | 17 | 18 |
| 19 | 20 | 21 | 22 | 23 | 24 | 25 |
| 26 | 27 | 28 | 29 | 30 |
- 데이터분석
- image
- 코딩
- defaultbranch
- powershell에러해결
- OS
- 이클립스프로젝트
- 데이터
- 파이썬에러
- 이미지읽어오기
- 카파
- 엑셀
- 라이브러리
- 프로그래밍
- Python
- 반복문
- 깃허브
- gitcommand
- 이미지연산
- 일치도
- 이미지
- github
- powershell에러
- 머신러닝
- 통계
- windowpowershell
- 코드
- 파이썬
- 깃에러
- git
- Today
- Total
목록Python (11)
나중에 내가 보려고 만든 블로그
파이썬에서 'utf-8' codec can't decode byte 0xb4 in position 0: invalid start byte 에러날때 해결하는 방법. 주로 read_csv, read_excel로 csv, 엑셀파일을 데이터프레임으로 불러올때 발생하고, 데이터에 한글있을때 발생하는 에러. 파일 불러올때 encoding='euc-kr' 혹은 'cp949'추가해주면 해결된다. 1 2 df = pd.read_csv('test.csv',encoding='euc-kr') df = pd.read_csv('test.csv',encoding='cp949') cs
파이썬에서 반복문을 위해 iterator를 생성할 때 길이가 다른 두개의 리스트에서 조합이 필요해서 사용했다. 데카르트 곱(cartesian product)을 생성해주며, 중첩 for 루프와 동일하다. 아래 코드는 (0 0), (0 1), ..., (29 9)까지 조합 이터레이터를 생성해주는 예시코드. 1 2 3 4 5 6 il = list(range(30)) jl = list(range(10)) import itertools for i,j in itertools.product(il,jl) : print(i,j) cs
데이터 전처리에서 유용하게 사용하는 replace 기능이다. text.replace(원래값, 바꿀값) 이런 형식으로 사용한다. replace는 변경하고자하는 요소를 하나씩 지정해줘야하는데 개수가 많아지면 하나씩 하는게 번거롭다. 여러개의 단어를 동시에 바꾸려면 dic이나 list를 생성해서 일괄 적용하면 된다. 나는 dic을 생성하는 방법을 사용했다. {원텍스트:바꿀텍스트}로 {key:value} 형식으로 매칭하면 된다. a를 apple로 바꾸고 싶고 b를 banana로 바꾸고 싶으면 아래와 같이 딕셔너리를 작성하면 된다. 1 dic = {'a':'apple', 'b':'banana'} cs replace 여러번 일괄적용하는 방법을 사용하려면 일단 함수를 직접 def해서 사용해야한다. 그러면 파이썬에서 ..