Intro
场景: 网页解析
需求如下:
数据源:含有多个空格、换行符的多段文本文本处理过程:识别出这些空格、换行符(替换为统一的单个换行符,或HTML的<br />
标签)数据持久化 --> 数据库
中间的识别
可以利用正则表达式来做:[\ \r\n]+
以下为JavaScript范例:
var htmlCode = `臣本布衣, 躬耕于南阳先帝不以臣卑鄙, 咨臣以当世之事。后来 ……今当远离,临表涕零,不知所言。`;var result = htmlCode.replace(/[\ \r\n]+/g, "<br/>");console.log(result);// <br/>臣本布衣,<br/>躬耕于南阳<br/>先帝不以臣卑鄙,<br/>咨臣以当世之事。<br/>后来<br/>……<br/>今当远离,临表涕零,不知所言。<br/>