搜索资源列表
getContentWebPageApp
- 提取WEB页面主题内容的一个小例子,希望对大家有用。-A small example to extract the contents of the WEB page theme, we want to be useful. Thank you
YLZServer
- 手机服务器端,主要完成从WEB页面提取数据,与手机客户端建立通信,并将获得的WEB页面数据传递给客户端-The phone server side complete WEB page, extract data, and mobile phone client to establish communication, WEB page and the obtained data is passed to the client
slMVC
- 应用MVC2.0的3层框架,实现网页的设计,主要包括你控制器,模型,视图,来实现。从数据库中提取数据在网页上显示。-Application of the 3 layer framework MVC2.0, web design, mainly including your controller, model, view, to achieve. Extract data from the database and displayed on the page.
bugger
- 一个简单的网页信息抓取软件· 运用正则表达式抽取信息 保存到本地或者数据库 用了C#皮肤 功能完善 界面大方-A simple web information ripping software use regular expressions to extract information is saved to the local database with C# perfect skin function interface generous
design-documents
- 网页信息采集子系统: 网页采集:动态查找及实时分析新增网页,读取网页回帖信息。 网页过滤:,对获取的网页,通过网页清洗模块清除网页中的广告、导航信息、 图片、版权说明等噪声数据,萃取出相关网页的标题、正文、链接地址、采集时 间、回帖、发帖人数等数据。 网页信息预处理子系统: 网页审查脏字:主要功能包括中文分词、词性标注、命名实体识别、新词识别, 建立数据库说明每类词库,建立敏感词词库。 网页舆情监测:监测是否出现了一定影响的舆论,即回帖的回帖或支持、顶等 达到
NwebCrawler
- NwebCrawler是用C#写的一款多线程网络爬虫程序,它的实现原理是先输入一个或多个种子URL到队列中,然后从队列中提取URL(先进先出原则),分析此网页寻找相应标签并获得其href属性值,爬取有用的链接网页并存入网页库中,其中用爬取历史来记录爬过的网页,这样避免了重复爬取。提取URL存入队列中,进行下一轮爬取。所以NwebCrawler的搜索策略为广度优先搜索。采用广度优先策略有利于多个线程并行爬取而且抓取的封闭性很强。-NwebCrawler is a multi-threaded w
DM-
- 源码名称:DM文章管理系统源码 开发工具: VS2008+sql2005 开发语言: C# 所属专题: vs2008 源码版本: 开源程度: ★★★★★ 运行环境: NT/2000/XP/2003+IIS 更新时间: 2009-11-27 演示地址: http://www.52netweb.com 解压密码: 无 下载次数: 26 源码简介:DM文章管理系统源码 三层结构之下的文章管理系统的后台页面的大致搭建 这个版本只是初级的版本,还在不断的完善之中,由于要考研,这个东西也只能先写
wudizd
- 自动加入说明: 加入:在你的网页中加入指向本站的链接(可以是文字链接 <a href=http://www.zdl.cc/>自动链</a>,也可以是图片链接 获得图片链接)。然后你用浏览器打开自己的网站,点一下到本站的连接,本站即自动提取你的网址,网页标题和关键字(meta标签中keywords中的关键字),存入数据库中,并在本站显示。 分类:根据你首页的meta标签中keywords中的关键字,将你的网站加入相应的分类中。 关键字选择建议:选择通用词汇,比如,
fzlbz
- 服务器环境要求: win2003 + .net Framework 2.0 + sql server 2000/2005 1、把此程序解压到D:\web\hxdesk\文件夹下,没有这两个文件夹建立一下 2、把SQL_Data文件夹下的QYPR_Data.MDF数据附加到你的MSSQL数据库内并给一个管理用户 3、打开iis站点,点击“自定义错误”标签,找到404错误页, 4、打开web.config 修改 DefaultConnectionString 和 Connec
GAEPhotos
- 基于GAE的网络相册,支持外链,水印,防盗链等功能。 用GAEPhotos建立你自己的网络相册: 创建 GAE Python HRD 程序, HRD 是必须的. 从 http://code.google.com/p/gaephotos/downloads/list 下载最新版本的GAEPhotos. 解压到本地目录. 更改 app.yaml 文件的第一行: application: gaephotos2 改成 application: xxxxxx
Parse
- 网络爬虫,完成了页面解析,可以提取出想要的内容,使用的技术是jsoup,-Web crawler to complete the page resolution, can extract the desired content, use technology jsoup,
htmlparser1_6
- htmlparser环境配置,用于解析元数据,网页链接,提取网页纯文本-configured htmlparser environment for parsing metadata, web links, extract pages of plain text
face-recognition-final-version
- Face Recognition System based on LabVIEW The general process is as follows. Firstly, the original data is captured by a web camera and then transferred from RGB color space to YUV color space, where it is easier to tell the skin area from non-skin
RFQ_Applic
- 此应用程序的目的是操纵xml文件中提取信息并将其呈现给用户。RFQ(报价申请)是一个通用的EDI / XML应用程序,我认为会显示这些特性在一个全面的时尚。这个应用程序使用ASP、HTML、CSS、XML和XSL来操纵和呈现信息到web浏览器。该应用程序包括一个询价表代屏幕以及报告的报价申请可以开启和关闭-The purpose of this application is to manipulate the xml file to extract information and present
grab_link
- 用C语言写的多线程提取网页链接,代码是vc6++环境编写的,如果要增加线程数,还可以在config配置文件中修改相应值,使用起来十分方便。-Written in C language multithreaded extract web links, the code is written in vc6++ environment, if you want to increase the number of threads, you can also modify the configuratio
MyCrawlar
- 本程序的作用是抽取网络爬虫,利用eclipse软件即可成功运行。-The role of this program is to extract the web crawler using eclipse software to run successfully.
baiducd
- 基于网页处理 百度词典 自动搜索结果并提取关键内容 简单网页处理源码示例-Web-based processing Baidu Dictionary automated search results pages and extract key elements of simple processing source code examples
Mailex
- PHP邮箱地址采集程序,利用PHP正则技术截断字符,获取到邮箱地址,并显示给用户,只要被采集网址的内容中含有Email地址,就可以把邮箱地址准确的摘录出来。支持带有 ~!@#¥ …&*/(at) 以及各种符号的邮箱格式。它支持根据网址抓取邮件地址,还可以是帖入一段含有Email地址的文本,仅抓取出邮箱地址,实用十分方便。-PHP mail address acquisition process, use PHP regular technical truncation character, ac
gjshop3_1
- 1、下载完成后,直接解压下载的文件。 2、将解压后的文件web目录下的所有文件上传到网站空间上。(如果是mssql数据库版则需配置数据库,和修改db.config中的SQL用户名、密码和数据库名称) 3、默认后台/前台管理地址:你的网址/login.aspx 默认后台管理帐户:gjshop 默认后台管理密码:gjshop 4、登陆后台后进行相关网站设置和内容发布。 -1, the download is complete, extract the do
PDFRider06
- PDF Rider v0.6源码 PDF Rider 是一个可以简单操纵PDF文档的工具。它用C#/.net3.5(WPF)开发,目标做得简单和用户友好。 PDF Rider 功能: * 合并PDF文档 * 从另一个PDF文件中插入页面 * 从PDF文档中提取页面到一个新文档 * 删除页面 * 页面选装 * 加密和解密pdf文件 * 文档分页 * Version 0.5启用了自动更新检查 PDFRider 使用了一个web浏览器