- BookCode 骨骼动画源代码 从.X文件原理剖析开始到制作各种动画 VC++/DirectX9.0实现
- b1820 基于STC89C52的ds18b20的程序
- TravelPlan 该程序实现了旅行者规划的基本功能
- Myphotos 一个用flashdevelop开发的相册
- JavaApplication8 this a project which manages the gold medalist of olympics .. you just need a ojdbc14.jar to run it.can be run directly from netbeans ide
- waveletpackage 使用小波包变换分析信号的MATLAB程序
文件名称:url
介绍说明--下载内容来自于网络,使用问题请自行百度
用JavaURL编程爬取并分析网页敏感词
1.编写界面,输入一个网址,能够爬取该网址上所有的HTML源代码。
2.对网址中的文本进行提取。
3.建立敏感词库,用文本文件保存。
4.将该网址所对应的文本中的敏感词提取并高亮显示。
5.编写文本文件,可以存入多个网址;程序可爬取这些网址中的文本内容,将敏感词记录存入另一个文件,格式自定。
6.编写一个主界面,整合上述功能。(Crawling and analyzing web sensitive words with Java URL programming
1. Write the interface, input a web address, and be able to crawl all HTML source code on the web address.
2. Extract the text in the website.
3. establish sensitive thesaurus and save it in text file.
4. Extract and highlight the sensitive words in the text corresponding to the website.
5. Write a text file, which can be stored in multiple web sites; the program can crawl the text content in these web sites, and store the sensitive word record in another file, with a format of its own.
6. Write a main interface to integrate the above functions.)
1.编写界面,输入一个网址,能够爬取该网址上所有的HTML源代码。
2.对网址中的文本进行提取。
3.建立敏感词库,用文本文件保存。
4.将该网址所对应的文本中的敏感词提取并高亮显示。
5.编写文本文件,可以存入多个网址;程序可爬取这些网址中的文本内容,将敏感词记录存入另一个文件,格式自定。
6.编写一个主界面,整合上述功能。(Crawling and analyzing web sensitive words with Java URL programming
1. Write the interface, input a web address, and be able to crawl all HTML source code on the web address.
2. Extract the text in the website.
3. establish sensitive thesaurus and save it in text file.
4. Extract and highlight the sensitive words in the text corresponding to the website.
5. Write a text file, which can be stored in multiple web sites; the program can crawl the text content in these web sites, and store the sensitive word record in another file, with a format of its own.
6. Write a main interface to integrate the above functions.)
相关搜索: Java;爬虫;敏感词
(系统自动生成,下载前可以参看下载内容)
下载文件列表
文件名 | 大小 | 更新时间 |
---|---|---|
url.java | 8353 | 2019-11-07 |
1999-2046 搜珍网 All Rights Reserved.
本站作为网络服务提供者,仅为网络服务对象提供信息存储空间,仅对用户上载内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。