搜索资源列表
ThemeCrawler
- 现在常见的搜索策略主要分为两种:一种是基于网页链接结构的搜索策略,另一种是基于内容评价的搜索策略。第一种是通过网页之间的链接关系来确定网页的重要性,从而决定链接访问的顺序。此方法虽然考虑了网页链接结构和网页之间的链接关系,但忽略了网页内容与主题的相关度,容易出现网页搜索“主题漂移”。第二种主要考虑网页内容,好处就是思路清晰且计算简单。但这种方法忽略了网页的链接关系,故在预测链接网页价值方面存在不足。考虑到这些问题,提出将布谷鸟搜索算法应用到主题爬虫中。-Now the common search
pachongtest2
- 运用python爬取知乎日报的内容,对知乎日报网页中的每一个子链接进行爬取,并对内容进行修改,运用re,urllib2,BeautifulSoup模块。-Use python to crawl the contents of daily news, to know every page in the daily sub-links to crawl, and to modify the content, the use of re, urllib2, BeautifulSoup module.
GetMP4ba
- 前两天看到MP4ba竟然加入了各种广告!!!故写了此爬虫来爬取所有的电影磁力链接。 可以爬取所有mp4ba的磁力链接喔(Two days ago, I saw MP4ba join all kinds of ads!!! So I wrote this crawler to climb up all the movie magnetic links. You can climb up all of mp4ba's magnetic links)
djeefcy
- FFT 算法的动态链接库 自己做的 算法复杂度一般()
herdwarriteratzon
- 自己编写的,TSP问题的各种近似算法,有最近邻策略,最短链接策略()
ZYLRD831
- 用com实现的等值线追踪算法,生成动态链接库,供客户程序调用,()
