搜索资源列表
aspseek
- ASPSeek是一个C++编写的互联网搜索引擎,并使用了STL库。它主要包括一个检索机器人,一个搜索守护程序,和一个搜索前端(CGI或者是Apache模块)。它大概可以检索几百万个URLs,来查找给定的短语和单词,并使用通配符,进行布尔搜索。搜索结果可以限定在给定的时间或站点,站点空间,并按照相关性或者时间进行排序(这里面使用了一些非常酷的技术)。ASPSeek可以应用于很多语言和编码中(甚至包括多字节语言如中文)。它为多个站点做了优化。(多线程检索,同步DNS查询, 按站点将结果分组, Web
tspider
- TSpider is a application source code library that you can use in your own programs to scrape information from websites. If can be used to download whole websites, or just select information from specific pages. Source code is in Delphi-TSpider is a
SearchEngine1.0
- 实现搜索引擎最基本的下载网页、建立倒排索引、关键词查询功能。程序的实现借助了libcurl库。-Search engine to achieve the most basic functionality of downloading page, seting up inverted index, keyword querying. Program implementation with the libcurl library.
FlickrCrawler
- 用C#自行开发的Flickr爬虫代码,实现了一个HttpRequestHelper类来处理网络请求,调用Flickr的API库来搜索指定内容或者作者的照片,并将返回结果存储到excel文件中。-Flickr reptiles code developed in C#, a HttpRequestHelper class to handle network requests, call the Flickr API library to search for specific content or
pb_serach
- 可以实时从PB的代码库中快速搜索出查询的对象-In real time from the PB library code quick search of the query object
PonySE
- PonySE基于GPLv3发布,这意味着它是免费的,开源的,并且你可以在GPLv3的限制下重新发布你的搜索引擎产品. 目标 小巧,PonySE适合于解决站内搜索,小型图书馆图书搜索等数据量在百万级数据的搜索 你可以把它安装在一台普通的服务器甚至是PC机上 为了节省成本,你甚至可以将PonySE与你的站点服务器安装到一起[取决于数据量的大小]. -PonySE based on the GPLv3 release, which means that it is free, open s
AnalyzerViewer_source
- Lucene.Net is a high performance Information Retrieval (IR) library, also known as a search engine library. Lucene.Net contains powerful APIs for creating full text indexes and implementing advanced and precise search technologies into your programs.
STANN
- STANN是轻量级的邻域搜索C++库, 在低维空间性能极为卓越, 特别是3D空间, 比ann-1.1.1好.-STANN is a lightweight thread-safe library for doing Nearest Neighbor searches. It is designed for low dimensional data sets, preferably 3d
bismftpsearchconsolecode
- BISM菁搜FTP搜索引擎控制台源码 已经发布 里面有详细源码 开源项目:BISM“菁搜”FTP搜索引擎 borland c++ 2007开发平台 这里使用了boost库 联系EMAIL:BISM软件工作组 E-MAIL:Bismsotware@163.com 余文锋 E-MAIL:wenfeng610@yahoo.com.cn 陈鸿雏 E-MAIL:canzer@126.com.cn 吴侃侃 E-
google-blog-CodePub.tar
- Google “解放数据”(Data Liberation)团队今天正式发布 Google Blog Converters 1.0,该开源工具可以让你在不同博客服务之间自由转移文章和评论数据。第一个版本提供了 Python 程序库及相关可执行脚本,用于相互转换 Blogger、LiveJournal、MovableType 和 WordPress 导出的各种数据文件格式。-Google " the liberation of Data" (Data Liberation) te
mifluz-0.24.0.tar
- mifluz 的目的是提供一个存储倒排索引c++库,允许存放关键词以便事后进行搜索。-The purpose of mifluz is to provide a C++ library to store a full text inverted index. To put it briefly, it allows storage of occurrences of words in such a way that they can later be searched. The basic id
EasylanguageWebpagesoerated
- 易语言网页操作之网页框架操作+支持库-Easy language Web pages operated framework operation+ support library
video
- 做为独立主机的用户有开发基础的程序员,按照以下步骤操作: 做为独立主机的用户,您可以直接让托管商为您打的服务器系统和配置。所需软件提供如下:win2008 操作系统IIS、mysql 5.1.5.8[或最新版]、framework3.5 。 安装只需要4步。首先将 1、建立视频索引库:在大空间的盘符下建立:视频搜索/index 【索引库】如:F:/ 视频搜索/index 2、安装分词服务系统fenciserver3.1 双击: 安装分词服务器.bat 安装即可,然后点击:fenc
internet
- 图书管理系统的选项页面,internet动态网页制作。-Options page of the library management system, internet dynamic web page.
UpdateAddrIndex
- 电信行业,编写的地址搜索引擎的代码,功能是更新索引库的类-Telecommunications industry, to write the address of the search engine code update the index library class
GenAddrSegmIndex
- 电信行业,地址搜索的程序,此代码功能是根据区域,对更新索引库-Telecom industry, Address Search program, this code function is based on the region, the index is updated library
NwebCrawler
- NwebCrawler是用C#写的一款多线程网络爬虫程序,它的实现原理是先输入一个或多个种子URL到队列中,然后从队列中提取URL(先进先出原则),分析此网页寻找相应标签并获得其href属性值,爬取有用的链接网页并存入网页库中,其中用爬取历史来记录爬过的网页,这样避免了重复爬取。提取URL存入队列中,进行下一轮爬取。所以NwebCrawler的搜索策略为广度优先搜索。采用广度优先策略有利于多个线程并行爬取而且抓取的封闭性很强。-NwebCrawler is a multi-threaded w
searchengine
- 使用Lucence开发的一个简单离线搜索引擎,能在本地的网页库中进行索引建立并检索,提供网页地址的返回。-Use Lucence developed a simple off-line search engine, in a local library' s website for indexing and retrieval, provides web addresses returned.
httpclient4.0.1-tutorial
- httpclient4.0.1是一个客户端HTTP传输类库。HttpClient作用是传输和接收HTTP消息。-httpclient4.0.1 is a client-side HTTP transport library. HttpClient role is to transmit and receive HTTP messages.
