去除字符串中的 HTML 标签内容,只保留文本内容。
import java.util.regex.*;/*** 去除字符串中的 HTML 标签内容,只保留文本内容。*/
public class RemoveHtmlTags {public static void main(String[] args) {// 原始 HTML 字符串String html = "<p style=\"color:red;\">这是一段包含<b>加粗</b>文本的HTML内容。</p>";// 定义要匹配的HTML标签模式Pattern pattern = Pattern.compile("<[^>]+>", Pattern.CASE_INSENSITIVE);// 创建Matcher对象并进行匹配操作Matcher matcher = pattern.matcher(html);// 将匹配到的HTML标签替换为空格或其他需要的字符String result = matcher.replaceAll("");System.out.println(result);}
}