搜索资源列表
PonySE
- PonySE基于GPLv3发布,这意味着它是免费的,开源的,并且你可以在GPLv3的限制下重新发布你的搜索引擎产品. 目标 小巧,PonySE适合于解决站内搜索,小型图书馆图书搜索等数据量在百万级数据的搜索 你可以把它安装在一台普通的服务器甚至是PC机上 为了节省成本,你甚至可以将PonySE与你的站点服务器安装到一起[取决于数据量的大小]. -PonySE based on the GPLv3 release, which means that it is free, open s
zhizhu
- 一款蜘蛛程序,国外开源.适合二次开发.一个JAVA开发的简单网络爬虫 可以实现对指定站点新闻内容的获取 程序很简单 大家一起学习.-<!-- You may freely edit this file. See commented blocks below for --> - <!-- some examples of how to customize the build. --> - <!-- (If you delete it
totsearch
- 淘特站内搜索引擎(C#版)基于Lucene.Net核心,通过高效的中文分词算法将数据库中内容进行分析、索引并保存至硬盘中。前台搜索时,通过读取索引文件查询,避免了传统数据库查询在高并发及海量数据下的性能问题。因前台搜索不在连接数据库,为不希望数据库放到前台的特殊用户群体提供了数据快速查询解决方案-Amoy Special Search Engine (C# Edition) Based on Lucene.Net core, through the effective Chinese word
UniWebCrawler
- 搜索引擎网络爬虫程序,可以在指定网站上搜索想要的信息,存储在文件中。-This is a search engine program. It can find what you want in specified web site, and save the information in the file.
python_sina_crawl
- 新浪微博的爬虫程序。程序运行方式:保存所有代码后,打开Main.py,修改LoginName为你的新浪微博帐号,PassWord为你的密码。运行Main.py,程序会在当前目录下生成CrawledPages文件夹,并保存所有爬取到的文件在这个文件夹中。-Sina microblogging reptiles. Program operation: save all the code, open Main.py, modify LoginName for your Sina Weibo accou
Python-Spider
- 针对“天天美剧”,Coursera,豆瓣 Top 250 电影列表,“免费文档”,“糗事百科”以及“挖段子”等网站的 Python 爬虫。 主要实现网站资源链接和文本内容爬取及保存。 具体用法见代码注释。-Python Reptile for " everyday drama" , Coursera, watercress Top 250 list of movies, " free document" , " embarrassmen
