728x90
반응형
질문 : 문자열에서 HTML 태그 제거
Java 문자열에서 HTML을 제거하는 좋은 방법이 있습니까? 다음과 같은 간단한 정규식
replaceAll("\\<.*?>", "")
작동하지만 &
올바르게 변환되지 않고 두 꺾쇠 괄호 사이의 비 HTML이 제거됩니다 (예 : .*?
가 사라짐).
답변
정규식 대신 HTML 파서를 사용하십시오. 이것은 Jsoup으로 매우 간단합니다.
public static String html2text(String html) {
return Jsoup.parse(html).text();
}
Jsoup은 또한 사용자 정의 가능한 화이트리스트에 대한 HTML 태그 제거 를 지원합니다 <b>
, <i>
및 <u>
만 허용하려는 경우 매우 유용합니다.
출처 : https://stackoverflow.com/questions/240546/remove-html-tags-from-a-string
728x90
반응형
'프로그래밍 언어 > HTML,CSS,JS' 카테고리의 다른 글
두 개의 클래스가있는 요소에 적용되는 CSS 선택기 (0) | 2021.08.10 |
---|---|
공백이 아닌 태그가 HTML5에서 유효한가요? (0) | 2021.08.10 |
내장 DOM 메소드 또는 프로토 타입을 사용하여 HTML 문자열에서 새 DOM 요소 생성 (0) | 2021.08.09 |
'$ (this)'와 'this'의 차이점 (0) | 2021.08.09 |
Google Maps JS API v3-간단한 다중 마커 예제 (0) | 2021.08.09 |