티스토리 뷰
잔재미코딩님의 pymysql로 database를 실습하는 인프런강좌를 수강 중에 지마켓 크롤러 작성 부분에서 마주한 오류이다.
지마켓 베스트에서 카테고리별 / 서브카테고리별 상품을 모두 따오는 크롤러였는데 다음과 같은 오류가 발생했다.
딱 봐도 저 셀렉트 구문이 잘못되어 value가 없고 value가 없으니 for문에서 꺼낼 값이 없기에 out of range가 생긴 것이겠지. 강좌를 잠시 멈추고 무엇이 잘못되었는지 확인하러 가보자
서브카테고리 밑에 (관련상품군 : 하이마트)라는 굉장히 불편해보이는 것이 끼어있다.
그래서 서브 카테고리 리스트를 받는 select문에서 링크가 있는 a만을 특정해줬더니 (li > a) 문제 해결.
인줄 알았지만 한 번 더 돌리고 다음과 같은 두 번째 오류 발견
가격 내용이 없을 시 0을 할당하도록 코드를 짰는데 가격에서 '원'과 ','를 없애려다보니 0을 get_text()할 수 없어서 생긴 오류
if / else 문으로 나눠서 해결!
/
잔재미코딩님도 강좌에서 항상 하시는 말씀이 절대로 한 번에 돌아갈 리 없다고 강조하신다. 그만큼 코딩은 오류를 예방하기 위한 꼼꼼함도 필요하지만 오류를 마주했을 때 당황하지 않고, 침착하게(+화내지말고) 오류에 대응하는 것도 중요한가부다.
*오류가 익숙해진다는 것은... 성장하고 있다는 뜻이겠지?
'코드' 카테고리의 다른 글
[PYTHON/SCRAPY] scrapy 크롤러 파싱 오류(dont_filter) (0) | 2019.10.29 |
---|---|
[python, MySQL] from 파이썬 크롤러 to MySQL via pymysql (0) | 2019.10.17 |
BeautifulSoup 모듈 find와 select의 차이점 - 복잡한 웹을 간단하게 (6) | 2019.10.16 |
[python] 크롤러 중 마주친 AttributeError 예외처리 (0) | 2019.10.14 |
어쩌다 경기지역화폐 크롤러 제작에서 마주친 오류 : scrapy 실패기 (0) | 2019.10.10 |
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- flask
- HTML
- Crawling
- DATABASE
- 일기
- BeautifulSoup
- 유럽
- Selenium
- 마드리드
- 저널
- 유튜버
- 파이썬
- 런업
- coding
- 유튜브
- 리뷰
- python
- 글쓰기
- scrapy
- 블로그
- 분석
- NLP
- error
- 항공
- 코로나
- 이슈
- 오류
- nltk
- css
- 스페인
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
글 보관함