질문과 답변
Q. md5 메시지 요약 함수란?
Q. 가상 호스팅 문제에서 - 요청 URI로도 어떤 docroot에 접근해야 할지 구분할 수 있는 것 아닌가? 왜 무조건 디폴트 루트로 가게 되는 것인가?
Q. 유저 에이전트가 로봇인 경우 어떻게 처리할까?
headless browser
Q. 구글의 랭킹 알고리즘에 대해 설명해보자.
Pagerank
Q. 로봇이 방문한 URL 탐색을 위해 사용하는 자료구조 중 트리는 어떤식으로 이뤄져 있을까?
Q. 만약 웹페이지 컨텐츠가 browser history 에 종속적이라면 (script 파일에 종속적이라면) 크롤러는 이에 대해 무방비 상태가 될까?
Q. 사악한 웹 마스터가 로봇을 함정에 빠트릴 수 있는 함정들은 무엇들이 있을까?
Q. 사적 용도(서치엔진이 아닌데도)로 로봇을 사용해도 되는가?
Q. 느슨한 존재 비트맵 설명만으론 해시 테이블과 크게 다른 것 같지 않은데..
Q. 크롤러는 웹 서버가 가상 호스팅을 지원하는지, IP 주소가 같은 장비를 가리키는지 등의 정보를 어떻게 알 수 있나?
Q. 페이지 콘텐츠에서 어느 정도 크기의 바이트를 얻어오고 또 어떻게 생성?
Q. 현재는 가상호스팅 환경에서 로컬 robots.txt 파일을 개별 서브디렉터리에 설치할 수 있나?
Q. 딥 웹의 원리는? 단순히 robots.txt에서 모든 크롤링을 막아놓은 것인가?
Last updated