반응형
Notice
Link
목록"w" (1)
스택큐힙리스트
파이썬을 사용하여 정확한 문자 집합으로 어떤(!) 웹페이지를 다운로드하는 방법은 어떻게 되나요?
(음... 적어도 대부분의 브라우저가 그렇게 처리한다고 믿습니다. 문서화가 정말로 부족합니다.) 저는 브라우저처럼 페이지의 문자 집합을 결정할 수 있는 라이브러리를 찾고 있습니다. 제 문제에 대한 적절한 해결책이 필요한 첫 번째 사람은 아니라고 확신합니다. 해결책 (아직 시도해보지 않았습니다...) Beautiful Soup의 문서에 따르면 다음과 같은 우선순위로 인코딩을 시도해서 문서를 유니코드로 변환합니다: 스프 생성자의 fromEncoding 인수로 전달하는 인코딩. 문서 자체에서 발견되는 인코딩: 예를 들어, XML 선언이나 (HTML 문서의 경우) http-equiv META 태그에 있는 것. Beautiful Soup이 문서 내부에서 이런 종류의 인코딩을 찾으면, 문서를 처음부터 다시 파싱하고..
카테고리 없음
2023. 11. 23. 09:52