스택큐힙리스트

XHTML 자체 포함 태그를 제외한 오픈 태그를 매치하는 RegEx 본문

카테고리 없음

XHTML 자체 포함 태그를 제외한 오픈 태그를 매치하는 RegEx

스택큐힙리스트 2023. 3. 24. 20:04
반응형

잠금 상태입니다. 이 질문에 대한 댓글 기능이 비활성화되었지만, 새로운 답변 및 상호작용은 여전히 가능합니다. # $! # $ @ !! $ &.

나는 이러한 모든 시작 태그를 일치시켜야 합니다.

하지만 이들은 아니죠:



저는 이것을 생각해냈고 올바르게 이해하고 있는지 확인하고 싶습니다. 저는 a-z 만 포착하고 있습니다.

<([a-z]+) *[^/]*?>

저는 그것이라고 믿습니다.

작다는 것을 찾고, 그리고

a-z를 하나 이상 찾아 (잡아)라, 그리고

공백을 찾거나 없거나, 그리고

(Note: This translation may vary depending on the context in which the phrase is being used.)

/를 제외한 모든 문자를 0번 이상 탐색하시오. (greedy)

크다보다 큰 것을 찾아주세요.

이게 맞나요? 그리고 더 중요한 것은, 당신은 어떻게 생각하세요?

답변 1

잠금 상태입니다. 현재 disputes about this answer’s content 문제가 해결 중입니다. 새로운 상호작용을 받지 않습니다.

당신은 정규식으로 [X]HTML을 구문 분석할 수 없습니다. 왜냐하면 HTML은 정규식으로 구문 분석될 수 없습니다. 정규식은 HTML을 올바르게 구문 분석하는 데 사용할 수있는 도구가 아닙니다. 이전에 여기에서 HTML-및-정규식 질문에 대한 대답으로 여러 차례 언급한 바와 같이, 정규식을 사용하면 HTML을 처리할 수 없습니다. 정규 표현식은 HTML에서 사용되는 구문을 이해하기에 충분히 정교하지 않은 도구입니다. HTML은 정규 언어가 아니므로 정규식으로 구문 분석 할 수 없습니다. 정규식 쿼리는 HTML을 의미있는 부분으로 분해하는 데 적합하지 않습니다. 심지어 Perl에서 사용되는 향상된 불규칙 정규식도 HTML을 구문 분석하는 데 부족합니다. HTML은 정규식으로 구문 분석 할 수 없을만큼 충분히 복잡한 언어입니다. Jon Skeet조차도 정규식을 사용하여 HTML을 구문 분석 할 수 없습니다. 정규식으로 HTML을 구문 분석하려고하면 부정절인 아이가 처녀의 피로 우는 동안 러시아 해커가 당신의 웹 앱을 차지합니다. 정규식을 사용하여 HTML을 구문 분석하면 영혼이 더러워진 친구들이 살아있는 세계로 소환됩니다. HTML과 정규식은 사랑, 결혼 및 의식적 인 어린이 살해처럼 함께합니다.

지금은 가지 않습니다. 정규식과 HTML의 힘이 같은 개념적 공간에서 함께하면 물감 같은 푸딩처럼 당신의 마음을 파괴합니다. 정규식으로 HTML을 구문 분석하려고하면 당신은 그들과 그들의 사랑스러운 방법에 항복하는 것이고, 그들의 이름이 기본 다국어 평면에서 표현 될 수 없는 학살자 인 하나를위한 무정한 노예가됩니다. HTML 플러스 정규식은 의식이 있는 신경을 액화시킬 것입니다. 당신이 주목하면서, 공포의 습격에서 당신의 정신은 시드가 있습니다. rege̿̔̉x 기반의 HTML 파서는 StackOverflow를 죽이고 있는 암컷입니다. s 시간이 늦었습니다. 적정치 못한 괴짜 정규식도 HTML을 구문 분석하기에 능하지 않습니다. 정규식을 사용하여 HTML을 분석하면 인간의 고통과 보안 결함에 대한 영원한 고통의 인간을 위해 운명이 결정됩니다. HTML을 처리하기 위해 정규식을 사용하는 것은이 세계와 SGML 엔티티와 같이 더 부패 된 엔티티의 공포의 영역 사이에 개척 한 것입니다. reg ex를 사용하는 HTML 파서의 세계를 조만간 살펴 보면 프로그래머의 의식이 적장과 비슷한 곳으로 즉시 이동됩니다. ...

XML 파서를 사용해 본 적이 있나요?

모더레이터의 주의사항

이 게시물은 불건전한 편집을 방지하기 위해 잠금 처리되었습니다. 이 게시물은 예상대로 완벽하게 보입니다 - 내용에 문제가 없습니다. 저희에게 주의를 불러일으키지 마시고 신고하지 마십시오.

답변 2

저희는 이번에 RegEx 매치의 주제 중 하나인 'XHTML 자체 포함 태그를 제외한 오픈 태그 매치'에 대해서 SEO에 민감한 글을 작성하고자 합니다.

RegEx 매치는 문자열에서 일치하는 패턴을 찾아내는 데 사용되는 강력한 도구입니다. 이 중에서도 오픈 태그 매치는 HTML 문서를 분석하거나 다룰 때 가장 자주 사용됩니다. 그러나 XHTML에서는 자체 포함 태그들이 등장하면서, 이러한 자체 포함 태그들 중 일부는 닫는 태그가 필요하지 않습니다.

따라서 우리는 이번에 'XHTML 자체 포함 태그를 제외한 오픈 태그 매치'라는 주제를 다룹니다. 이 주제는 SEO에 민감한 문제입니다. 왜냐하면 HTML 문서는 검색 엔진 최적화의 핵심이기 때문입니다.

예를 들어, 검색 엔진 크롤러는 HTML 문서를 읽어들이고, 이 문서에서 포함된 단어들을 검색 대상으로 삼습니다. 이 때, HTML 문서 내부에 사용된 태그들은 크롤러가 글을 읽는 데 방해가 될 수 있습니다. 예를 들어, XHTML의 자체 포함 태그는 크롤러가 글을 읽는 데 방해가 됩니다.

그러나, 오픈 태그 매치는 검색 엔진 최적화를 위한 중요한 요소 중 하나입니다. 이를 통해, 검색 엔진은 페이지의 내용을 이해하고, 적절한 검색 결과를 제공할 수 있습니다.

따라서, XHTML 문서에서 RegEx 매치를 수행할 때는 자체 포함 태그를 제외한 오픈 태그만 매치하도록 하여, 검색 엔진 최적화를 위한 조치를 취해야 합니다.

예를 들어, 다음과 같이 코드를 작성할 수 있습니다.

([a-zA-Z]+)\b(?)

위 코드는 자체 포함 태그를 제외한 오픈 태그를 찾아내는 RegEx 매치입니다.

이와 같은 방식으로, XHTML 문서에서 단어를 찾아내는 도구로서의 RegEx 매치를 효율적으로 사용할 수 있습니다. 이렇게 하면 검색 엔진이 문서 내부를 더 잘 이해하게 되고, 적절한 검색 결과를 제공할 수 있습니다.

따라서, SEO에 민감한 오픈 태그 매치에 대해, XHTML 자체 포함 태그를 제외하여 RegEx 매치를 수행하는 것이 중요한 요소 중 하나입니다. 이를 통해 검색 엔진 최적화를 더욱 효과적으로 수행할 수 있습니다.

반응형
Comments