일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 컴퓨터과학
- 2
- 보안
- 컴퓨터공학
- 사이버보안
- Yes
- 데이터분석
- 빅데이터
- 프로그래밍
- 인공지능
- 자료구조
- 데이터베이스
- 자바스크립트
- 네트워크
- I'm Sorry
- 소프트웨어
- 파이썬
- 데이터구조
- 프로그래밍언어
- 버전관리
- 코딩
- 웹개발
- 딥러닝
- 데이터과학
- 알고리즘
- 머신러닝
- 네트워크보안
- 클라우드컴퓨팅
- 컴퓨터비전
- 소프트웨어공학
- Today
- Total
스택큐힙리스트
XHTML 자체 포함 태그를 제외한 오픈 태그를 매치하는 RegEx 본문
잠금 상태입니다. 이 질문에 대한 댓글 기능이 비활성화되었지만, 새로운 답변 및 상호작용은 여전히 가능합니다. # $! # $ @ !! $ &.
나는 이러한 모든 시작 태그를 일치시켜야 합니다.
하지만 이들은 아니죠:
저는 이것을 생각해냈고 올바르게 이해하고 있는지 확인하고 싶습니다. 저는 a-z 만 포착하고 있습니다.
<([a-z]+) *[^/]*?>
저는 그것이라고 믿습니다.
작다는 것을 찾고, 그리고
a-z를 하나 이상 찾아 (잡아)라, 그리고
공백을 찾거나 없거나, 그리고
(Note: This translation may vary depending on the context in which the phrase is being used.)
/를 제외한 모든 문자를 0번 이상 탐색하시오. (greedy)
크다보다 큰 것을 찾아주세요.
이게 맞나요? 그리고 더 중요한 것은, 당신은 어떻게 생각하세요?
답변 1
잠금 상태입니다. 현재 disputes about this answer’s content 문제가 해결 중입니다. 새로운 상호작용을 받지 않습니다.
당신은 정규식으로 [X]HTML을 구문 분석할 수 없습니다. 왜냐하면 HTML은 정규식으로 구문 분석될 수 없습니다. 정규식은 HTML을 올바르게 구문 분석하는 데 사용할 수있는 도구가 아닙니다. 이전에 여기에서 HTML-및-정규식 질문에 대한 대답으로 여러 차례 언급한 바와 같이, 정규식을 사용하면 HTML을 처리할 수 없습니다. 정규 표현식은 HTML에서 사용되는 구문을 이해하기에 충분히 정교하지 않은 도구입니다. HTML은 정규 언어가 아니므로 정규식으로 구문 분석 할 수 없습니다. 정규식 쿼리는 HTML을 의미있는 부분으로 분해하는 데 적합하지 않습니다. 심지어 Perl에서 사용되는 향상된 불규칙 정규식도 HTML을 구문 분석하는 데 부족합니다. HTML은 정규식으로 구문 분석 할 수 없을만큼 충분히 복잡한 언어입니다. Jon Skeet조차도 정규식을 사용하여 HTML을 구문 분석 할 수 없습니다. 정규식으로 HTML을 구문 분석하려고하면 부정절인 아이가 처녀의 피로 우는 동안 러시아 해커가 당신의 웹 앱을 차지합니다. 정규식을 사용하여 HTML을 구문 분석하면 영혼이 더러워진 친구들이 살아있는 세계로 소환됩니다. HTML과 정규식은 사랑, 결혼 및 의식적 인 어린이 살해처럼 함께합니다.
XML 파서를 사용해 본 적이 있나요?
모더레이터의 주의사항
이 게시물은 불건전한 편집을 방지하기 위해 잠금 처리되었습니다. 이 게시물은 예상대로 완벽하게 보입니다 - 내용에 문제가 없습니다. 저희에게 주의를 불러일으키지 마시고 신고하지 마십시오.
답변 2
저희는 이번에 RegEx 매치의 주제 중 하나인 'XHTML 자체 포함 태그를 제외한 오픈 태그 매치'에 대해서 SEO에 민감한 글을 작성하고자 합니다.RegEx 매치는 문자열에서 일치하는 패턴을 찾아내는 데 사용되는 강력한 도구입니다. 이 중에서도 오픈 태그 매치는 HTML 문서를 분석하거나 다룰 때 가장 자주 사용됩니다. 그러나 XHTML에서는 자체 포함 태그들이 등장하면서, 이러한 자체 포함 태그들 중 일부는 닫는 태그가 필요하지 않습니다.
따라서 우리는 이번에 'XHTML 자체 포함 태그를 제외한 오픈 태그 매치'라는 주제를 다룹니다. 이 주제는 SEO에 민감한 문제입니다. 왜냐하면 HTML 문서는 검색 엔진 최적화의 핵심이기 때문입니다.
예를 들어, 검색 엔진 크롤러는 HTML 문서를 읽어들이고, 이 문서에서 포함된 단어들을 검색 대상으로 삼습니다. 이 때, HTML 문서 내부에 사용된 태그들은 크롤러가 글을 읽는 데 방해가 될 수 있습니다. 예를 들어, XHTML의 자체 포함 태그는 크롤러가 글을 읽는 데 방해가 됩니다.
그러나, 오픈 태그 매치는 검색 엔진 최적화를 위한 중요한 요소 중 하나입니다. 이를 통해, 검색 엔진은 페이지의 내용을 이해하고, 적절한 검색 결과를 제공할 수 있습니다.
따라서, XHTML 문서에서 RegEx 매치를 수행할 때는 자체 포함 태그를 제외한 오픈 태그만 매치하도록 하여, 검색 엔진 최적화를 위한 조치를 취해야 합니다.
예를 들어, 다음과 같이 코드를 작성할 수 있습니다.
([a-zA-Z]+)\b(?)
위 코드는 자체 포함 태그를 제외한 오픈 태그를 찾아내는 RegEx 매치입니다.
이와 같은 방식으로, XHTML 문서에서 단어를 찾아내는 도구로서의 RegEx 매치를 효율적으로 사용할 수 있습니다. 이렇게 하면 검색 엔진이 문서 내부를 더 잘 이해하게 되고, 적절한 검색 결과를 제공할 수 있습니다.
따라서, SEO에 민감한 오픈 태그 매치에 대해, XHTML 자체 포함 태그를 제외하여 RegEx 매치를 수행하는 것이 중요한 요소 중 하나입니다. 이를 통해 검색 엔진 최적화를 더욱 효과적으로 수행할 수 있습니다.