本站首页    管理页面    写新日志    退出


«August 2025»
12
3456789
10111213141516
17181920212223
24252627282930
31


公告
暂无公告...

我的分类(专题)

日志更新

最新评论

留言板

链接

DMman's Blog

idmer's Blog

DHTML

eYou帮

Java国内站

Java国外站

PHP博客

PHP国内站点

PHP国外站点

Unix C/C++

Unix/Linux

程序设计

大牛blog

实用网站

网络安全

在线手册


Blog信息
blog名称:
日志总数:18
评论数量:37
留言数量:0
访问次数:136782
建立时间:2007年7月19日




[data mining]The Easy Way to Extract Useful Text from Arbitrary HTML
其他

jdilt 发表于 2007/8/31 7:36:22

You’ve finally got your hands on the diverse collection of HTML documents you needed. But the content you’re interested in is hidden amidst adverts, layout tables or formatting markup, and other various links. Even worse, there’s visible text in the menus, headers and footers that you want to filter out. If you don’t want to write a complex scraping program for each typ


阅读全文(2778) | 回复(1) | 编辑 | 精华 | 删除
 


[data mining]比价网与深度网络
其他

jdilt 发表于 2007/8/25 17:39:54

1、比较购物       
        随着国内电子商务的发展,越来越多的用户开始体验网上购物,除了著名的TaoBao和Ebay,国内还有很多中小型的B to C 专业网站,在众多的网站中,如何货比三家,不需要登陆每个网站来查看自己想要购买的商品呢?这样就孕育了比较购物的设想,所谓比较购物就是为消费者提供从多种在线零售网站中进行商品价格、网站信誉、购物方便性等方面的比较资料,随着比较购物网站的发展,其作用不仅表现在为在线消费者提供方便,也为在线销售上推广产品提供了机会,实际上也就等类似于一个搜索引擎的作用了,并且处于网上购物的需要,从比较购物网站获得的搜索结果比通用搜索引擎获得的信息更加集中,信息也更全面(如有些比较购物网站除了产品价值信息之外,还包含了包含对在线销售商的评价等),于


阅读全文(1764) | 回复(0) | 编辑 | 精华 | 删除
 


[data mining]MetaQuerier: Exploring and Integrating the Deep Web
其他

jdilt 发表于 2007/7/26 13:20:58

MetaQuerier: Exploring and Integrating the Deep Web ||  Projects  ||  Funding  ||  People  ||  Publications  ||
阅读全文(2033) | 回复(0) | 编辑 | 精华 | 删除
 


[data mining]【转】查找"看不见的网页"的途径与工具
其他

jdilt 发表于 2007/7/26 12:38:11

查找"看不见的网页"的途径与工具 邢志宇   "看不见的网页"(The Invisible Web)是指搜索引擎商出于自身考虑不愿索引的某些网络内容,或是因为技术原因普通搜索引擎(popular search engines)无法索引的网络内容。这些普通搜索引擎的"蜘蛛"不容易接近的"深层网络"(deep Web)的数量,要比搜索引擎索引的网页(visible Web)多出500多倍。如何搜索Invisible Web 已经引起国内外学者和网络搜索爱好者的关注。就搜索技术而言,搜索网站和搜索引擎商正在寻求构建能够揭示Invisible Web的目录指南,或改进搜索技术,增加搜索功能等多种对策;就具体搜索而言,用户应注意调整搜索策略,熟悉相关目录和专用搜索引擎,掌握相应的搜索技巧。一般来说,搜索

阅读全文(1402) | 回复(0) | 编辑 | 精华 | 删除
 


[data mining]3
其他

jdilt 发表于 2007/7/25 16:03:54

第三章  数据预处理
阅读全文(1786) | 回复(0) | 编辑 | 精华 | 删除
 


[data mining]Data Mining 学习笔记【一】
其他

jdilt 发表于 2007/7/22 13:09:50

第一章 引言
阅读全文(1395) | 回复(0) | 编辑 | 精华 | 删除
 


[data mining]A Roadmap to Text Mining and Web Mining
其他

jdilt 发表于 2007/7/21 15:09:26

A Roadmap to Text Mining and Web Mining - Under Construction, Last Modified: Jan 8, 2002 - Text Mining in General M. Hearst, Untangling Text Data Mining, ACL99 Mining in Textual Mountains: An Interview with Marti Hearst,

阅读全文(1702) | 回复(0) | 编辑 | 精华 | 删除
 


« 1



站点首页 | 联系我们 | 博客注册 | 博客登陆

Sponsored By W3CHINA
W3CHINA Blog 0.8 Processed in 0.070 second(s), page refreshed 144768551 times.
《全国人大常委会关于维护互联网安全的决定》  《计算机信息网络国际联网安全保护管理办法》
苏ICP备05006046号