CDN加速镜像 | 设为首页 | 加入收藏夹
当前位置: 首页 资源下载 WEB源码 JSP源码/Java

文件名称:zhengdike

  • 所属分类:
  • 标签属性:
  • 上传时间:
    2012-11-16
  • 文件大小:
    1.42mb
  • 已下载:
    0次
  • 提 供 者:
  • 相关连接:
  • 下载说明:
    别用迅雷下载,失败请重下,重下不扣分!

介绍说明--下载内容来自于网络,使用问题请自行百度

(个人原创)《中文网页自动分类》

牵扯的技术有:分词,统计词频,踢出网页中一些特殊字符(用正则表达式),还有需要提取培训集等等!!



此软件禁止商业活动,版权所属“qyTT论坛--www.qyclass.org/bbs”

本文来自: qyTT论坛 http://www.qyclass.org/bbs 我们的使命:让世界认识qyTT,让qyTT认识世界!



结果分析的思想:就是把得到的词频与建立的词库里每一类进行比较,如果存在一个最大匹配程度,就去这个类作为结果,如果存在多个最大值,那么就去词库里特征词最少的一个!!

-(Individual original) " Chinese Web Page Automatic Classification" involves technology are: Word, word frequency statistics, kicked out the page number of special characters (using regular expressions), and need to extract the training set and more! ! Results of the idea: is to get the word frequency and the establishment of the vocabulary in each category of comparison, if there is a maximum matching degree, and went to the class as a result, if there is more than the maximum, then go inside thesaurus features at least one word! !
相关搜索: 词频 中文分词算法

(系统自动生成,下载前可以参看下载内容)

下载文件列表

zhengdike/build.xml
zhengdike/ceshi/1/www.txt
zhengdike/ceshi/2/www.txt
zhengdike/ceshi/3/www.txt
zhengdike/ceshi/4/WWW.txt
zhengdike/ceshi/5/www.txt
zhengdike/ceshi/6/www.txt
zhengdike/ceshi/7/WWW.txt
zhengdike/ceshi/8/www.txt
zhengdike/jar/filterbuilder.jar
zhengdike/jar/htmllexer.jar
zhengdike/jar/htmlparser.jar
zhengdike/jar/smallseg4j_0.6.jar
zhengdike/jar/thumbelina.jar
zhengdike/manifest.mf
zhengdike/nbproject/build-impl.xml
zhengdike/nbproject/genfiles.properties
zhengdike/nbproject/private/private.properties
zhengdike/nbproject/private/private.xml
zhengdike/nbproject/project.properties
zhengdike/nbproject/project.xml
zhengdike/src/zhengdike/classbao/getcharset.java
zhengdike/src/zhengdike/classbao/getfilelist.java
zhengdike/src/zhengdike/classbao/getunicode.java
zhengdike/src/zhengdike/classbao/htmlparser.java
zhengdike/src/zhengdike/classbao/segtext.java
zhengdike/src/zhengdike/classbao/state.java
zhengdike/src/zhengdike/classbao/stateline.java
zhengdike/src/zhengdike/hztounicode.form
zhengdike/src/zhengdike/hztounicode.java
zhengdike/src/zhengdike/mainframe.form
zhengdike/src/zhengdike/mainframe.java
zhengdike/xlciku/1.txt
zhengdike/xlciku/2.txt
zhengdike/xlciku/3.txt
zhengdike/xlciku/4.txt
zhengdike/xlciku/5.txt
zhengdike/xlciku/6.txt
zhengdike/xlciku/7.txt
zhengdike/xlciku/8.txt
zhengdike/src/zhengdike/classbao
zhengdike/ceshi/1
zhengdike/ceshi/2
zhengdike/ceshi/3
zhengdike/ceshi/4
zhengdike/ceshi/5
zhengdike/ceshi/6
zhengdike/ceshi/7
zhengdike/ceshi/8
zhengdike/nbproject/private
zhengdike/src/zhengdike
zhengdike/bin
zhengdike/build
zhengdike/ceshi
zhengdike/jar
zhengdike/nbproject
zhengdike/src
zhengdike/test
zhengdike/xlciku
zhengdike

相关说明

  • 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
  • 搜珍网是交换下载平台,只提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度。更多...
  • 本站已设置防盗链,请勿用迅雷、QQ旋风等下载软件下载资源,下载后用WinRAR最新版进行解压.
  • 如果您发现内容无法下载,请稍后再次尝试;或换浏览器;或者到消费记录里找到下载记录反馈给我们.
  • 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
  • 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.

相关评论

暂无评论内容.

发表评论

*快速评论: 推荐 一般 有密码 和说明不符 不是源码或资料 文件不全 不能解压 纯粹是垃圾
*内  容:
*验 证 码:
搜珍网 www.dssz.com