PHP提取HTML中的文本作为网页描述,去除字符串

$text = '<p><span class=\"txt-14 ft-gray\" style=\"line-height:1.5em;\">熊伟,财富中文网专栏作家,现任《中国信息化》杂志执行社长,电子工业出版社研究院首席分析师。微信公号:蛮夷大熊。</span></p><p>类似Facebook学微信、谷歌学百度的现象,未来会越来越多。</p><p><br/></p><p><!--enpproperty<articleid>245007</articleid><date>2015-07-29 21:25:00.0</date><author>熊伟</author><title>抄袭逆转:中国互联网开始为全球提供创新“基因”</title><keyword>抄袭,互联网,创新,Facebook,微信,谷歌,百度</keyword><subtitle></subtitle><introtitle></introtitle><siteid>1</siteid><nodeid>8240<deid><nodename>科技<dename><nodesearchname><desearchname>/enpproperty--><!--enpcontent--> <!--enpcontent--></p><p> 西学东渐,不唯社会理论、自然科学传入,企业模式、管理方法也从西方舶来。这是一个百年历程,延续到以信息社会为面相的新世纪。从西到东,向来如此,直到最近出现一些转向。';

从这提取出纯文本,去除一堆字符串,及图片链接,试了一天也没试成功,实在太菜了,求救啊
不是完全针对该段内容,而且是所有类似网页抓取的HTML内容

实际的字符串是这,有转义字符串

第1个回答  2015-08-02
有一种最好的方法,就是将你搞过来的文件保存到记事本中,然后再取出来就OK了,顶多再去除一个换行符就OK本回答被网友采纳
第2个回答  2015-08-02
去掉所有尖括号里面的东西不久好咯。追问

如何去啊?

追答

字符串处理不会?

本回答被提问者采纳

相关了解……

你可能感兴趣的内容

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 非常风气网