Author Archives: kuro

今度の Lucene Revolution は、サンフランシスコで5月開催

昨年10月にボストンにて開催された Lucene/Solr 開発者の祭典、Lucene Revolution ですが、今年は場所をサンフランシスコ(†)に移し、5月下旬に行なわれます。去年と同じフォーマットで、最初の2日間(5月23日、24日)が 研修、後半2日間(5月25日、26日)が講演の日となっています。

今回の研修には、4つのコースが用意されています。そのうち目をひくのが、Scaling Search with Big Data and Solr (巨大データと Solr で検索をスケールする方法)と名付けられたコース。今流行の Hadoop と Solr を組み合わせてどう巨大データを扱うか、というホットな内容のようです。

後半1日目(5月25日)の講演では、分科会の方で、弊社の Steve Kearns が、Integrating Advanced Text Analytics into Solr (高度なテキスト解析技術を Solr に取り入れる方法)という題名で講演を行います。

そして最終日の講演リストをのぞいてみると、何と mixi の伊藤敬彦様が、Handy Installation Tool “Anuenue” for Solr Cluster, and Implementation of “Did you mean” Facility for Queries in Japanese(使いやすい Solr クラスターのインストール・ツール Avenue と、日本語での「もしかして」機能の実現)という題名でご講演となっています!このカンファレンスでは初の日本人による講演です!皆で行って、応援しようではありませんか。

今回は、会場がサンフランシスコということで、日本からも行きやすくなっています。最新の Lucene/Solr の機会に触れ、直接 Lucene/Solr 開発者と話のできる機会です。日本からの参加をお待ちしています。参加登録等は、Lucene Revolution のウェブサイトをご覧下さい。

注† サンフランシスコ市外にあるサンフランシスコ国際空港隣接のホテルで行なわれます。サンフランシスコ中心部へは、混雑時でなければ車で15〜20分、電車で30分ぐらいで行けます。

Solr 3.1.0 リリース

3月31日(日本時間4月1日)、Solr 3.1.0 がリリースになりました。ここからダウンロードできます。

主な改良点・変更点は、以下のようになります。

  • 数値範囲によるファセット機能(日付範囲に類似)
  • 空間検索。空間フィルター、ブースト、ソート機能付き。
  • Velocity の例題検索 UI (http://localhost:8983/solr/browse)
  • 項ベクトル利用の新強調表示機構
  • 拡張 dismax (edismax) パーサー
  • TermsComponent、SpellCheckComponent でも分散検索をサポート
  • 自動示唆(Auto Suggeset) 機能
  • 関数ソート
  • JSON 文書索引
  • CSV 応答書式
  • メタデータ抽出のための Apache UIMA との統合
  • Lucene 3.1 の改善点の利用。特に最適化、バグ修正、そしてアナライザーの新機能。
  • その他数々の改善、バグ修正、最適化

質問: Solr 1.5.0 はどうなったんですか?
答え: 以前 Solr 1.5.0 になるはずだったものが、Solr 3.1.0 という名前になりました。この版からは、Solr のバージョン番号は、その基盤の Lucene のバージョンと同一にすることになったからです。

技術系記事2本追加!

技術系記事を2本追加しました。

Solr チュートリアルは、初めて Solr を体験する人向け。Solr 本家のチュートリアルを日本語訳し、さらに日本語処理の初歩も追記しました。

Lucene と Solr のスケーラビリティーは、Solr を効率よく使用する方法、大規模索引に対応する方法、大量クエリーに対応する方法を解説しています。大規模商用システム開発に携わる方必見の記事です。

日本での Solr 導入事例のご紹介

日本での Solr 導入事例記事の第一弾として、サイバーエージェント様とマピオン様での事例をお届けします。

皆様の Solr 導入計画のご参考にどうぞご活用ください。

また、皆様の Solr 導入事例や体験談も同時募集中。info@lucidimagination.jp まで、お気軽にご応募ください。

ホワイトペーパー「オープンソース検索アプリケーション事例集」追加

Lucene と Solr の導入事例満載のホワイトペーパー、オープンソース検索アプリケーション事例集 を掲載しました。

特報:待望の LWE、ついに発表!

Lucene Revolution 二日目の10月6日(東海岸時間)、ルーシッド・イマジネーション社初の本格的ソフトウェア製品、LucidWorks Enterprise (略称 LWE)が翌日の一般公開に先立って、パートナー限定で公開された。

LWE は、関係者の間では、Solr++ というニックネームで知られていたことからもわかるように、Solr を基盤にして、それを大幅拡張改善した、検索アプリケーション。Solr の最新版(安定リリース版よりも新しい)に、インストーラー、クローラー、GUI 管理画面、等をつけたものと考えることができる。宣伝文句は:

  • Search Within Reach(カンタン。誰でも使える検索ソフト。)
  • Better. Faster Solr.(改良高速 Solr)
  • Lowest Cost of Growth(高スケール性、データ課金なし)

となっている。

製品をダウンロード後は、unzip ではなく、専用インストーラーでインストールされる。続いて、専用設定画面で、検索対象文書集合の指定を行う。例えば、データベースの指定、ファイルシステム上の親ディレクトリーの指定、あるいは、インターネットまたはイントラネットの親 URL を指定する。クロールのスケジュール管理もこの時点で行える。

Solr のフィールド指定は、schema.xml を直接編集する代わりに、わかりやすい GUI による設定画面で行う。これにより、入力間違いを防止し、最小の専門知識で定義ができる。

その他の機能としては、

  • アラート:検索式を記録し、一定時間毎に実行して新規に一致した文書をメールで知らせる
  • 機密管理:ユーザーの役割毎に、閲覧可能な文書と可能でない文書が決まる。ユーザー情報は、LDAP で管理。
  • 改良版検索式パーサー:よりわかりやすい構文。
  • 関連度計算の改善:CLICK というアルゴリズムにより、関連度の計算が改善される。
  • 追加機能のほとんどは、ReST API により外部から使用可能。

等があげられる。

検索画面については、従来と同様、それなりに作り込む必要はあるが、全体の設定と索引作成の部分が強化されたため、全体としての検索アプリ作成に要する時間は大幅に削減されることが期待される。

本製品は、ルーシッド社初の有償ソフトウェアとなる。ライセンス形態は、年次サポート契約(サブスクリプション)による。料金は、稼働サーバー台数とサポート条件に応じて決定される。

* * * * *
ルーシッド社の公式情報は、以下のページ(英語)をご覧下さい:

http://www.lucidimagination.com/enterprise-search-solutions/open-source-software

LWE の日本での販売は、日本語対応の準備が整ってからとなります。今しばらくお待ちください。

次回 Solr トレーニング日付決定

第1回 Solr トレーニングは、無事終了致しました。参加者の皆様、お疲れ様でした。Yonik サイン入り修了証は、大事にかざってくださいね。

さて、早速です、次回トレーニング日付が決定しました。11月16日(火)〜18日(木)です。前回参加者の方々からは、「このトレーニングは、Solr 全般の機能をきちんと学習できて、効率的。」、「今まで Solr を使ってきたが、こんな便利な機能があるなんて知らなかった。」との声を賜っております。Solr をこれから始める方は勿論、すでにお使いの方々もふるってご参加ください。