웹크롤링 중에 인스타그램 차단때문에 밤새 알아보다가 발견한 글입니다.
원문 가시면 코드 수록되어 있습니다.
글 요약
-
Public API를 이용한 방법
: 차단걱정이 없음, 개발자 계정과 엑세스 토큰 필요. 요청 수 / 속도 제약있음. 다른 유저 팔로우 수는 수집 불가
-
웹페이지를 이용한 방법
: 탐지되면 Ip나 계정 차단당할 수 있음. 다른 유저 팔로우 수 가져올 수 있음. 셀레니움 특성상 안정성이 좀 떨어짐
-
Private API를 이용하는 방법
: 마찬가지로 다른 유저 팔로우 수를 가져올 수 있음. 탐지되면 IP/계정 차단 당할 수 있음. 안정성이 우수함
원글 링크
데이터 수집의 지옥, 인스타그램? 이 3가지 방법으로 뚫어버려!
rkttu
2
정보 공유를 가장한 광고글로 파악되어 광고 카테고리르 글을 옮깁니다. 이 결정에 이의가 있으시다면 이 글이 광고가 아닌 이유를 소명해주시면 운영진 회의에서 논의를 거치도록 하겠습니다.
제가 공유해주신 글을 광고글로 판정한 이유는, 이 글의 마지막에 다음과 같은 문구가 기재되어있기 때문입니다.
“해시스크래퍼의 인스타그램 수집을 통해 로그인 없이 손쉽게 크롤링을 경험해 보시길 바랍니다.”
2개의 좋아요
rkttu
3
아울러 앞으로 이런 종류의 글을 올리실 때는 카테고리를 정확하게 확인해서 게시를 부탁드립니다. 잘못된 카테고리를 선택해서 올리실 경우, 스팸 계정으로 간주되어 예고없이 계정 차단/삭제 조치가 이루어질 수 있으니 주의 부탁드립니다.