Java에서 문자열에 포함된 HTML 태그들 제거하기
개요 개발을 진행하다 보면 문자열에서 HTML 관련 태그를 모두 삭제하고자 하는 경우가 있다. HTML 내용에는 예외 상황이 많기 때문에 정규식으로 완벽히 지우기는 어렵긴 하다. 그래서 공통 코드로 하나 만들어 보았다. 개발 public class HtmlUtils { private enum HtmlTagPatterns { SCRIPTS("]*>.*?", Pattern.DOTALL), STYLE("", Pattern.DOTALL), TAGS("]+|[a-zA-Z!-:]+)>"), N_TAGS("
Programing/Java
2018. 2. 8. 15:28
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- 태그를 입력해 주세요.
- jackson
- PYTHON
- HADOOP
- Learning Spark
- jenkins
- Git
- mysql
- db
- 통계학
- spark
- java
- Hdfs
- jenkins2.0
- json
- exception
- Oracle
- linux
- mongodb
- mongo
- bigdata
- 확률분포
- 데이터과학자
- spring
- Apache Spark
- 책요약
- Sqoop
- Django
- flume
- 알고리즘
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 |
글 보관함