1. 소식
Tomcat 릴리즈가 활발하네요. 이번에는 5월 8일부로 8.0 버전이 업데이트되었습니다.
2. 상세
이번 업데이트에서 눈에 띄는 내용은 URI 처리와 크롤러 세션 관리 관련 개선입니다. 원문 릴리즈 노트 문구와 요약은 다음과 같습니다.
- 원문: “Implement configuration options to work-around specification non-compliant user agents (including all the major browsers) that do not correctly %nn encode URI paths and query strings as required by RFC 7230 and RFC 3986”. 요약하면, RFC 7230 및 RFC 3986에서 요구하는 방식대로 URI 경로와 쿼리 문자열을
%nn형식으로 인코딩하지 않는 사용자 에이전트에 대응할 수 있도록 설정 옵션이 추가되었습니다. 원문은 주요 브라우저 모두가 여기에 포함된다고 설명합니다. - 원문: “Enable the CrawlerSessionManagerValve to correctly handle bots that crawl multiple hosts and/or web applications when the Valve is configured on a Host or an Engine.” 요약하면,
CrawlerSessionManagerValve가Host또는Engine에 설정된 경우, 여러 호스트나 여러 웹 애플리케이션을 크롤링하는 봇을 더 정확히 처리할 수 있도록 개선되었습니다.
관련 설정을 적용할 때는 운영 환경에 바로 반영하기보다, 문제가 되었던 요청 URI나 봇 접근 패턴을 테스트 환경에서 먼저 재현해 보는 것이 좋습니다. 특히 URI 인코딩과 관련된 변경은 프록시, 로드밸런서, 애플리케이션 라우팅 규칙과 함께 영향을 받을 수 있으므로 접근 로그와 오류 로그를 함께 확인하는 편이 안전합니다.
3. 참고
3-1. RFC 7230
https://tools.ietf.org/html/rfc7230