使用Regex.Replace()方法可以剔除字符串中的HTML代码,例如在text数据类型的数据库字段,中存放的字符串格式如下:一、学术研究课题
如果这段字符串不经过处理显示出来就是加粗的字体,如下:“一、学术研究课题”
如果现在想更改这个字符串显示的格式,将字号设置成13px,颜色设置成黑色。那要怎么做?
在这个时候可以使用Regex.Replace()方法,并且配合使用正则表达式来实现。
在使用这个方法之前首先要在命名控件中添加以下引用:
using System.Text.RegularExpressions;
这个是Regex的命名空间。
首先声明string str字符串变量,str的值如下:str=<DIV><B><FONT color=blue><FONT size=2>一、学术研究课题</FONT></FONT></B></DIV>
首先替换掉<B>(粗体)得到如下格式的字符串:<DIV><FONT color=blue><FONT size=2>一、学术研究课题</FONT></FONT></DIV>
方法:str = Regex.Replace(str, @"<B[\s\S]*?>([\s\S]*?)</B>", "$1", RegexOptions.IgnoreCase);
其次替换掉<FONT color=blue><FONT size=2>(字体的颜色和大小),得到如下格式的字符串:<DIV>一、学术研究课题</DIV>
方法:
str = Regex.Replace(str, @"<font[\s\S]*?>([\s\S]*?)</font>", "$1", RegexOptions.IgnoreCase);
str = Regex.Replace(str, @"<font[\s\S]*?>([\s\S]*?)</font>", "$1", RegexOptions.IgnoreCase);
注意:在此使用两个Replace方法,是因为在字符串中有两个FONT,每次替换掉一个,感觉此处很麻烦,如果有多个FONT那怎么办那?这个问题仍然在思考中……也敬请指教!
最后为这个替换过的字符串添加上自己设置的格式(行高15px,字号13px,颜色黑色):
方法如下:
str = "<font style=" + "line-height:15px; font-size:13px; color:#000000" + ">" + str + "</font>";
整体过程写成函数如下:
public string cleartag(string str)
{
str = Regex.Replace(str, @"<font[\s\S]*?>([\s\S]*?)</font>", "$1", RegexOptions.IgnoreCase);
str = Regex.Replace(str, @"<font[\s\S]*?>([\s\S]*?)</font>", "$1", RegexOptions.IgnoreCase);
str = Regex.Replace(str, @"<B[\s\S]*?>([\s\S]*?)", "$1", RegexOptions.IgnoreCase);
str = "<font style=" + "line-height:15px; font-size:13px; color:#000000" + ">" + str + "</font>";
return str;
}