티스토리 뷰

Lucene Java 2.3.0 released!
루씬 자바 2.3.0 공개!

요즘 관심있는 프로젝트들이 새 버전들을 내놓고 있네요.

루씬의 가장 중요한 프로젝트인 루씬 자바의 마이너 버전 업데이트가 있었습니다. 2007년 6월에 2.2 버전이 발표되고 반 년 정도 지났군요.

루 씬은 오픈소스 검색 프로젝트입니다. 복잡하고 어려운 수많은 기술들의 집합체인 인덱싱과 검색 기술을 모아 오픈소스로 내놓다니 정말 대단하죠. 여러 곳에서 다양한 방법으로 활용되고 있다고 합니다. 한글 서적으로는 오래전에 Lucene in action책이 발매되어 있습니다. 요즘 이 책을 보면서 공부하고 있는 중인데 재미있습니다.

루씬은 규모가 꽤 있는 프로젝트라서 다양한 서브 프로젝트를 가지고 있습니다. 기본적으로 루씬은 자바 언어를 사용하여 코딩되어 있지만 C#언어로 포팅한 Lucene.net도 있고 크롤링같은 웹 검색을 위한 기술을 포함한 웹 검색엔진을 만드는 프로젝트인 Nutch등이 있습니다.

이번 버전의 변동 사항은 다음과 같습니다. 제가 이 분야의 컨텍스트가 부족해 해석이 맞지 않을 수 있습니다. 지적해 주세요.
  • 확연히 향상된 인덱싱 퍼포먼스
  • 백그라운드 스레드에서의 세그먼트 병합(Segment merging)
  • 재갱신 가능한 인덱스리더(refreshable IndexReaders)
  • 더 빨라진 StandardAnalyzer와 향상된 토큰 API
  • 어떤 방법으로 텀 벡터들(term vectors)을 로드하는지 커스터마이징하기 위한 TermVectorMapper 추가
  • SnapshotDeletionPolicy를 이용한 라이브 백업 (인덱싱 멈춤 없음)
  • 오류가 발생한 인덱스의 테스트와 복구를 위한 CheckIndex 툴 추가
  • 추가하여 쓸 수 있는(pluggable) MergePolicy 와 MergeScheduler
  • "partial" optimize(int maxNumSegments) method
  • 위키피디아 컨텐츠와 함께 동작하는 새로운 모듈
더 상세한 내용은 아래 링크를 참조하십시오.
http://svn.apache.org/repos/asf/lucene/java/tags/lucene_2_3_0/CHANGES.txt

하나더, 인덱스 포맷의 변화로 이전 버전으로는 2.3 버전의 인덱스 데이터를 읽을 수 없다고 합니다. 물론 2.3 버전은 예전의 인덱스를 읽을 수 있지만요.

소스및 바이너리 다운로드는 아래 링크를 참조하세요
http://www.apache.org/dyn/closer.cgi/lucene/java/

루씬 프로젝트 홈페이지
http://lucene.apache.org/


댓글
댓글쓰기 폼
«   2019/12   »
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31        
Total
48,228
Today
0
Yesterday
11