加入收藏 | 设为首页 | 会员中心 | RSS
您当前的位置:首页 > 技术在线 > Asp

ASP取出HTML里面的图片地址的函数

时间:2008-06-12 07:33:06  来源:  作者:
以下是取出HTML里面的图片地址的函数:

主要原理就是用正则判断 <img> 的<src>属性。这在采集程序中将非常有用。

函数如下(以下是引用片段):  

程序代码 程序代码

 
  Function ShowPic(str)
  Set objRegExp = New Regexp'设置配置对象  
  objRegExp.IgnoreCase = True'忽略大小写  
  objRegExp.Global = True'设置为全文搜索  
  objRegExp.Pattern = "<img.+?>"


为了确保能准确地取出图片地址所以分为两层配置:首先找到里面的<img>标签,然后再取出里面的图片地址后面的getimgs函数就是实现后一个功能的。  

程序代码 程序代码

 strs=trim(str)  
Set Matches =objRegExp.Execute(strs)'开始执行配置  
For Each Match in Matches  
RetStr = RetStr &getimgs( Match.Value )'执行第二轮的匹配  
Next  
ShowPic = RetStr
End Function


Function getimgs(str)  
getimgs=""  
Set objRegExp1 = New Regexp  
objRegExp1.IgnoreCase = True  
objRegExp1.Global = True  
objRegExp1.Pattern = "http://.+?"""'取出里面的地址  
set mm=objRegExp1.Execute(str)  
For Each Match1 in mm  
getimgs=getimgs&left(Match1.Value,len(Match1.Value)-1)&"||"'把里面的地址串起来备用  
next  
End Function  


'取得图片内容
function getHTTPPage(url)  
on error resume next  
dim http  
set http=server.createobject("MSXML2.XMLHTTP")'使用xmlhttp的方法来获得图片的内容  

Http.open "GET",url,false  
Http.send()  
if Http.readystate<>4 then  
exit function  
end if  
getHTTPPage=Http.responseBody  
set http=nothing  
if err.number<>0 then err.Clear  
end function


'保存图片
function saveimage(from,tofile)  
dim geturl,objStream,imgs  
geturl=trim(from)  
imgs=gethttppage(geturl)'取得图片的具休内容的过程  
Set objStream = Server.CreateObject("ADODB.Stream")'建立ADODB.Stream对象,必须要ADO 2.5以上版本  
objStream.Type =1'以二进制模式打开  
objStream.Open  
objstream.write imgs'将字符串内容写入缓冲  
objstream.SaveToFile server.mappath(tofile),2'-将缓冲的内容写入文件  
objstream.Close()'关闭对象  
set objstream=nothing  
end function  


'调用实例
Dim strpic,i,fname
strpic = ShowPic("<DIV align=center><IMG src=""http://img.knowsky.com/img/knowskylogo.gif"" border=0></DIV>")
strpic = Split(strpic,"||")
If UBound(strpic) > 0 Then  
For i = 0 To UBound(strpic) - 1
'保存图片
fname=cstr(i&mid(strpic(i),instrrev(strpic(i),".")))  
saveimage(strpic(i),fname)
Next
Else
End If


来顶一下
近回首页
返回首页
发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表
推荐资讯
消息称雅虎和谷歌或于下周推开放广告平台
消息称雅虎和谷歌或于
成功的站长应是全才
成功的站长应是全才
探秘Google数据中心:运行服务器远超20万台
探秘Google数据中心:
地震中的程序人生-《疯狂的程序员》作者绝影
地震中的程序人生-《
相关文章
    无相关信息
栏目更新
栏目热门
关于我们 - 联系我们 - 广告服务 - 友情链接 - 网站地图 - 版权声明 - 人才招聘 - 帮助