Notice
Recent Posts
Recent Comments
Link
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | |||
| 5 | 6 | 7 | 8 | 9 | 10 | 11 |
| 12 | 13 | 14 | 15 | 16 | 17 | 18 |
| 19 | 20 | 21 | 22 | 23 | 24 | 25 |
| 26 | 27 | 28 | 29 | 30 |
Tags
- git
- 이클립스프로젝트
- OS
- 카파
- 이미지
- powershell에러해결
- 통계
- 라이브러리
- github
- 깃허브
- powershell에러
- 파이썬에러
- 데이터
- 데이터분석
- 엑셀
- 이미지연산
- defaultbranch
- 반복문
- windowpowershell
- Python
- gitcommand
- 이미지읽어오기
- 코드
- 머신러닝
- 일치도
- 코딩
- 깃에러
- image
- 파이썬
- 프로그래밍
Archives
- Today
- Total
나중에 내가 보려고 만든 블로그
[python] feature importances 본문
파이썬 scikit-learn에서 트리계열(decision tree, random forest 등) 알고리즘에는 feature_importances_ 기능이 있다.
분류에서 어떤 feature를 사용했고, 어느정도 중요도로 판단했는지 알 수 있다.
다만 그 중요도가 모든 알고리즘에서 적용되는건 아니고 적용된 분류방식에서 판단한 정도라는 점이다.
바로 출력하면 index순서대로 중요도만 뽑아줘서 어떤 특성의 중요도 인지 알기 어렵다.
반복문을 통해서 특성이름과 중요도가 함께 출력되도록 구현한 코드다.
|
1
2
3
4
5
6
7
8
|
list= []
for i in range (len(clf.feature_importances_)):
list.append ([clf.feature_importances_[i], features[i]])
print ('feature_importance: ')
for importance_, feature_ in sorted(feature_importance, reverse = True):
print ('%.4f \t {}'.format(feature_) % importance_)
|
cs |
'Python' 카테고리의 다른 글
| [Python] 엑셀리스트로 파일명 일괄 변경, xlrd 라이브러리 (0) | 2022.01.03 |
|---|---|
| [Python] tqdm : 반복문에서 진행률 표시 (0) | 2021.08.06 |
| [python] decision tree 시각화, graphviz 리눅스 설치, 에러 (0) | 2021.05.13 |
| [Python] 'utf-8' codec can't decode byte 0xb4 in position 0: invalid start byte (0) | 2021.04.23 |
| [Python] itertools 조합 이터레이터 생성 (0) | 2021.04.23 |