如何从HTML中获取内容,删除其周围的元素.
我正在寻找一个使用VB6的例子
您可以将Internet Explorer用作COM对象(不在屏幕上显示).例如,获取HTML的纯文本版本:
Public Function Html2Text(ByVal Data _ As String) As String Dim obj As Object On Error Resume Next Set obj = _ CreateObject("htmlfile") obj.Open obj.Write Data Html2Text = obj.Body.InnerText End Function
你也可以走元素树来做一些更复杂的事情.
图片来源:Visual Studio Magazine中的 Karl Peterson .