以文本方式查看主题

-  中文XML论坛 - 专业的XML技术讨论区  (http://bbs.xml.org.cn/index.asp)
--  『 Web挖掘技术 』   (http://bbs.xml.org.cn/list.asp?boardid=69)
----  Web 文本挖掘技术研究  (http://bbs.xml.org.cn/dispbbs.asp?boardid=69&rootid=&id=33821)


--  作者:wuchenlu
--  发布时间:6/5/2006 10:28:00 AM

--  Web 文本挖掘技术研究

摘 要 作为从浩瀚的W eb 信息资源中发现潜在的、有价值知识的一种有效技术,W eb 挖掘正悄然兴起, 倍受关注. 目前,W eb 挖掘的研究正处于发展阶段, 尚无统一的结论, 需要国内外学者在理论上开展更多的讨论. 同时,W eb 挖掘系统的开发对其研究也将起到很大推进作用. 首先探讨了W eb 挖掘的有关理论, 从W eb 挖掘的定义、W eb 挖掘与W eb 信息检索的关系、W eb 挖掘任务的分类与功能等方面加以阐述. 然后重点分析了W eb 文本挖掘的方法, 包括: 文本的特征表示、文本分类与文本聚类. 在此基础上简单介绍了一个W eb 文本挖掘系统原型WebMiner. W ebM iner 采用了多agent 体系结构, 将多维文本分析与文本挖掘这两种技术有机地结合起来, 以帮助用户快速、有效地挖掘W eb 上的HTML 文档.
关键词 W eb 挖掘, 文本挖掘, 文本分类, 文本聚类, 多维文本分析



--  作者:wuchenlu
--  发布时间:6/5/2006 10:29:00 AM

--  
2000年的有点早了
--  作者:liangchenshell
--  发布时间:7/27/2006 9:53:00 AM

--  
太早了,还是非常感谢
--  作者:eviltear
--  发布时间:10/10/2006 5:45:00 PM

--  
知识普及了
--  作者:suiyun0234
--  发布时间:11/29/2006 2:14:00 PM

--  
赫赫,多谢楼主,不用筛选了
--  作者:侬侬
--  发布时间:8/6/2007 11:17:00 AM

--  
我有一个问题想请教大家:我现在想选一个方向写论文,但是我的计算机基础很差(因为我是半路出家的),你们觉的我写哪方面的比较容易呢?哪方面的理论性较强一点呢?
--  作者:DMman
--  发布时间:8/6/2007 9:23:00 PM

--  
以下是引用侬侬在2007-8-6 11:17:00的发言:
我有一个问题想请教大家:我现在想选一个方向写论文,但是我的计算机基础很差(因为我是半路出家的),你们觉的我写哪方面的比较容易呢?哪方面的理论性较强一点呢?


觉得您先了解一下可能的方向吧 看看哪个更有兴趣。。。
--  作者:chairmanwei
--  发布时间:8/19/2007 9:50:00 AM

--  
学习ing。。。
--  作者:BlueSky_DM
--  发布时间:8/31/2007 3:51:00 PM

--  
呵呵,这个网站上介绍的文章比较多,不错的。
关于Web信息提取的综述的文章,比较旧了:
--  作者:BlueSky_DM
--  发布时间:8/31/2007 3:56:00 PM

--  
A Brief Survey of Web Data Extraction Tools.pdf
http://homepages.dcc.ufmg.br/~berthier/books_journal_papers/sigmod_record_2002.pdf

http://www.fullsearcher.com/n200511171744735.asp
网上信息抽取技术纵览
http://www.fullsearcher.com/down/InformationExtraction/1.doc

最近开题中,狂读了100多篇提取相关的文章。


--  作者:faithg
--  发布时间:1/15/2008 1:39:00 PM

--  
学习中…………
--  作者:lixuezhu18
--  发布时间:5/15/2008 4:21:00 PM

--  
不错,抱走了!谢谢!
W 3 C h i n a ( since 2003 ) 旗 下 站 点
苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
5,375.000ms