正则表达式匹配换行符
一开始没有发现html文档中有很多\n
,结果用模式
<table[^>]>.*</table>
得到的table间的数据不正确,根据百度百科,可以看到解决方案是
\s
匹配任何空白字符,包括空格、制表符、换页符等等。等价于[ \f\n\r\t\v]
\S
匹配任何非空白字符。等价于[^ \f\n\r\t\v]
因此修改成模式:
<table[^>]+>[\\s\\S]*?</table>
?
是非贪婪模式,提醒正则匹配到第一个</table>
就停止。
时间:2021-03-22 03:46:01
一开始没有发现html文档中有很多\n
,结果用模式
<table[^>]>.*</table>
得到的table间的数据不正确,根据百度百科,可以看到解决方案是
\s
匹配任何空白字符,包括空格、制表符、换页符等等。等价于[ \f\n\r\t\v]
\S
匹配任何非空白字符。等价于[^ \f\n\r\t\v]
因此修改成模式:
<table[^>]+>[\\s\\S]*?</table>
?
是非贪婪模式,提醒正则匹配到第一个</table>
就停止。