substring-after:函数返回一个字符串,该字符串是给定子字符串后给定字符串的其余部分。
#句法
substring-after( haystack ,needle)
haystack:
要评估的字符串。该字符串的一部分将被返回。
needle:
要搜索的子字符串。needle
在haystack
中第一次出现之后的所有内容都将被返回。
#示例如下
substring-after('aa-bb','-')
>> bbsubstring-after('aa-bb','a')
>> a-bbsubstring-after('aa-bb','b')
>> bsubstring-after('aa-bb','q')
>> (empty string)
#页面案例 url:https://www.chinabgao.com/info/1247147.html
#想要拿到页面中 "2023-11-16 10:33:50报告大厅(www.chinabgao.com)"--> "报告大厅"
#首先用xpath获取该行数据
//p[contains(text(), "本文来源")]/text()[1] #--> 本文来源:报告大厅
#然后再用substring-after
substring-after(//p[contains(text(), "本文来源")]/text()[1],":") #--> 报告大厅
如图: