Sign-up....

网站数据抓取

这个是网络公司要我笔试的题目,把指定商业贸易网站上公司的信息包括公司名,地址等抓取出来,写进数据库,最重要的E-mail地址,我是个应届毕业生,查了很多资料,请教了很多人都没找到合适的办法,还请各位高手帮忙啊!不胜感激.

[112 byte] By [msdn] at [2007-8-14 9:45:27]
# 1 Re: 网站数据抓取

不想贴代码了,搜索一下XMLHTTP吧

poron9 at 2005-4-7 13:32:03 >
# 2 Re: 网站数据抓取

有些商贸网是不能抓的。

mrshelly at 2005-4-7 13:36:46 >
# 3 Re: 网站数据抓取

有的站点限制XMLHTTP抓取

chzxq at 2005-4-8 10:35:24 >
# 4 Re: 网站数据抓取

你用的是.net?

haolaiwu at 2005-4-8 17:23:50 >
# 5 Re: 网站数据抓取

你用什么服务端语言?

一般用正则+xmlhttp就差不多了

网上很多教程啊,怎么会没有合适的,当然你得会改一改,直接用不太可能,

除了抓新闻的cms

lawyu at 2005-4-8 17:38:12 >
# 6 Re: 网站数据抓取

我觉得你可能会被别人利用来做事情,但是就是不一定会雇佣你

javaoaout at 2005-4-11 13:17:36 >
# 7 Re: 网站数据抓取

同意javaoaout(javaoaout)

foolishidea at 2005-4-11 13:32:20 >
# 8 Re: 网站数据抓取

不给他写,他们要的是程序,不是人,真他*妈的卑鄙

cnredarrow at 2005-4-11 13:44:57 >
# 9 Re: 网站数据抓取

你还是别做了。浪费你的时间和精力。给人家当牛使唤

life360 at 2005-4-18 11:48:33 >
# 10 Re: 网站数据抓取

没想那么多,而且过公司给的期限很久了,做一下对自己也是个锻炼吗,我代码完成的差不多了,就是不知道如何让程序在一个限定的范围去寻找合适的http-host,请大家帮个忙把!

url=Request.ServerVariables("remote_host")

response.write url

start=Newstring(url,".")+1

behindurl=mid(wstr,start,13)

if (behindurl="21trader.com/") then

for circle=1 to 40000

yinuo8202 at 2005-4-19 10:37:07 >
# 11 Re: 网站数据抓取

程序实现了,不过还是有些问题不能解决,谢谢各位了

yinuo8202 at 2005-4-26 22:24:52 >
# 12 Re: 网站数据抓取
我写过VC的类似的程序。
MMX at 2005-05-13 09:39:00 >

Web

All Classified