--lucene-2.0.0的基本应用

本站首页 管理页面写新日志退出

« August 2025 »
日一二三四五六
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31

公告

我的分类（专题）

首页(1304)
Eclipse(8)
J2ME(3)
OpenSymphony(16)
Hibernate(97)
Tapestry(23)
J2SE(72)
Symbian(2)
eXtremeComponents(13)
JBoss(33)
Javascript(13)
MySQL(72)
Java Open Source(104)
DWR(Ajax)(29)
Spring(61)
WebWork(15)
Apache(jakarta)(77)
软件设计(6)
算法(22)
Acegi(2)
Subversion(44)
Dojo(Ajax)(2)
Wicket(3)
IDEA(2)
ESB(6)
TinyMCE+FCKeditor(20)
Grails(1)
Prototype(Ajax)(32)
设计模式(20)
Prototype(0)
FreeMarker(17)
集成测试(14)
codehaus.org(2)
AOP(13)
Java代码(7)
Struts 2.0(6)
Groovy(5)
Linux(10)
网站架构(70)
Cache(11)
Python(40)
网络与系统管理(34)
shell/bash(4)
Pylons学习(2)
Django(88)
Ruby on Rails(120)
Ubuntu(4)
Quixote(3)
视频处理(20)
Web(UI+UE)(2)
TurboGears(25)
jQuery(2)
iBatis(7)
CentOS(2)
MySQL集群(1)
SELinux(1)

日志更新

Java中压缩与解压--中文文件名乱码解
对当前目录下所有文件进行压缩代码
java zip 中文问题
iBatis for Paging
再析在spring框架中解决多数据源的问
如何在spring框架中解决多数据源的问
SELinux 的配置小解
apache+mod_ssl中证书生成方
StatSVN的使用（续）
[原创]MySQL的LIST分区体验与总

留言板

签写新留言

我也想装饰元件
谢谢
飘过！
模板的问题
mule 求助
extremecomponents.cs
搜索呢？
[Apache(jakarta)]Apa
jsper报表的制作!
求助一下,关于compass的

链接

SpringSide
SpringFramework中文论坛
 BlogJava
Java开源大全
 Java视线论坛
 CSDN Java频道
 JavaScud开源平台
 JavaAPI中文文档
 一个不错的提供代码示例的站点
 Spring 中文开发手册(1.1.PR)
Springframework
Hibernate
Java版模式速查手册
 良葛格學習筆記
 javareference
java2s
GRAILS

Blog信息

blog名称:
日志总数:1304
评论数量:2242
留言数量:5
访问次数:7586522
建立时间:2006年5月29日

[Spring]lucene-2.0.0的基本应用
软件技术

lhwork 发表于 2006/7/31 11:47:49

终于出2。0了很兴奋，可是也很郁闷；兴奋的是有新功能了，应该去看看；郁闷的是，找了几个小时没找到一个完整的代码，在部长的强烈要求下，只好硬着头皮看文档。。。。。。。好，终于看懂了，该写代码了。首先肯定是建立索引了啊 public void creatIndex() { File indexDir = new File(getPathIndex()); try {List<Article> listArticle = getArticleDao().search(null, null,null, null, null, null, null, null, new Boolean(true)); for (int i = 0; i < listArticle.size(); i++) { Document doc = new Document(); Article article = listArticle.get(i);//我的配置是追加方式的建立索引，所以为了不重复数据，只好先删除再添加 deleteAllIndex(article); Field fieldId = new Field("id", article.getId().toString(), Field.Store.COMPRESS, Field.Index.TOKENIZED, Field.TermVector.YES); Field fieldTitles = new Field("title", article.getTitle(), Field.Store.COMPRESS, Field.Index.TOKENIZED, Field.TermVector.YES);//我没有用任何的分析器，所以只好用HTMLParser 把HTML分析成文本在索引 String contentHtml = article.getContent(); Reader read = new StringReader(contentHtml); HTMLParser htmlParser = new HTMLParser(read); BufferedReader breader = new BufferedReader(htmlParser.getReader());String htmlContent = ""; String tempContent = breader.readLine(); while (tempContent != null && tempContent.length() > 0) { htmlContent = htmlContent + tempContent; tempContent = breader.readLine(); }//下面的是Field 我找了半天可是没有找到存储object的方法，本想自己写，可是没时间，就把对象切开放Field fieldContents = new Field("content", htmlContent, Field.Store.COMPRESS, Field.Index.TOKENIZED,Field.TermVector.YES); Field fieldTime = new Field("time", article.getUpdateTime().toString(), Field.Store.YES, Field.Index.TOKENIZED,Field.TermVector.YES); Field fieldAuthor = new Field("author", article.getAuthor(), Field.Store.COMPRESS, Field.Index.TOKENIZED, Field.TermVector.YES); Field fieldCategory = new Field("category", article.getCategory().getOutsideName(), Field.Store.COMPRESS, Field.Index.TOKENIZED, Field.TermVector.YES); String path = "/" + article.getCategory().getCategoryUrl()+ "/" + article.getId() + ".html"; Field fieldPath = new Field("path", path, Field.Store.COMPRESS, Field.Index.TOKENIZED, Field.TermVector.YES); doc.add(fieldId); doc.add(fieldPath);doc.add(fieldCategory); doc.add(fieldTime); doc.add(fieldAuthor); doc.add(fieldContents); doc.add(fieldTitles); indexWriter.addDocument(doc);} indexWriter.optimize(); indexWriter.close();} catch (IOException e) { e.printStackTrace();}}到这里索引已经建立了，下面要做的就是搜索 public List<Document> searchDoc(String type, String queryString) { List<Document> fileList = new ArrayList<Document>();//其实这里是不需要的，因为lucene默认是调用它的，当然还有另外一个,我这里只是为了下面的高亮显示Analyzer analyzer = new StandardAnalyzer(); try {Directory fsDir = FSDirectory.getDirectory(getPathIndex(), false); IndexSearcher searcher = new IndexSearcher(fsDir);QueryParser queryParse = new QueryParser(type, analyzer);Hits hits = searcher.search(queryParse.parse(queryString)); for (int i = 0; i < hits.length(); i++) { Document doc = hits.doc(i); String value = doc.get(type);//对要高亮显示的字段格式化，我这里只是加红色显示和加粗 SimpleHTMLFormatter sHtmlF = new SimpleHTMLFormatter("<b><font color='red'>", "</font></b>");Highlighter highlighter = new Highlighter(sHtmlF,new QueryScorer(queryParse.parse(queryString))); highlighter.setTextFragmenter(new SimpleFragmenter(100)); if (value != null) {TokenStream tokenStream = analyzer.tokenStream(type,new StringReader(value)); Field tempField = new Field(type, highlighter.getBestFragment(tokenStream, value),Field.Store.NO,Field.Index.TOKENIZED,Field.TermVector.YES); doc.removeField(type); doc.add(tempField); }//这里取的是Document 对象哦，里面的东西还需要你自己抽取呵，代码我就不写了 fileList.add(doc); } searcher.close(); } catch (IOException e) { e.printStackTrace(); } catch (ParseException e) { e.printStackTrace(); } return fileList;}OK，这里索引就做好了，当时我给我们前台程序员说，好了，我给你2个方法，你调用吧。以为我轻松了吧，其实没有呢，我只是加了一点必要的存储字段，那个兄弟要求高着呢，最后加了很多，后来还要我用多条件查询（网上应该有这样的教材吧，我后来用的是compass实现的，原理是一样）在这里我好象少了一个东西，呵呵发现了么？没有么？发现了吧呵呵我用的是spring配置所以没有indexwriter,下面是配置文件<bean id="indexWriter" class="org.apache.lucene.index.IndexWriter"> <constructor-arg index="0" type="java.io.File"> <bean class="java.io.File"> <constructor-arg value="E:/Projects/netSchool/indexDatas" /> </bean> </constructor-arg> <constructor-arg index="1" > <bean class="org.apache.lucene.analysis.standard.StandardAnalyzer" /> </constructor-arg> <constructor-arg index="2" type="boolean" value="true"/> </bean>好了不知道还有什么没说的，不懂的留言呵别不厚道！！！！看帖要回帖的！

阅读全文(3234) | 回复(1) | 编辑 | 精华

回复:lucene-2.0.0的基本应用
软件技术

JackyLee(游客)发表评论于2006/8/11 15:53:23

呵呵看了下先保存刚开始想不留言的一看一句经典话我就留了 :) 继续努力

个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除

» 1 »

发表评论：

昵称：
密码：
主页：
标题：

验证码： (不区分大小写,请仔细填写,输错需重写评论内容！)

站点首页 | 联系我们 | 博客注册 | 博客登陆

Sponsored By W3CHINA
W3CHINA Blog 0.8 Processed in 0.330 second(s), page refreshed 144765340 times.
《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
苏ICP备05006046号