rroonga でインデックスカラムから転置インデックスを参照しようとしたが出来なかった
2012/08/16 groonga 1.0.0
rroonga でわかち書きされた文章を取りだして、それを集計しようと考えてたけど、転置インデックスが見つからなかったので苦戦。未解決です。
rroongaはgroongaのrubyバインディング。転置インデックスで高速に検索できるらしい。転置インデックスから分割された文章が参照できるはずと予想。
groongaにデータを登録してからインデックスが更新されるまでの流れ - ククログ(2011-10-05)を参考にインデックスカラムに転置インデックスの場所を探す。
転置インデックスを見つけて一番目の中身を返してみる。
~~ irb(main):116:0> terms = Groonga["Terms"] => #<Groonga::PatriciaTrie id: <276>, name: <Terms>, path: </tmp/tmpdb/test3.db.0000114>, domain: <ShortText>, range: (nil), flags: <KEY_NORMALIZE|WITH_SECTION>, encoding: <:utf8>, size: <198048>> irb(main):117:0> terms.columns => [#<Groonga::IndexColumn id: <277>, name: <Terms.Comments_comment>, path: </tmp/tmpdb/test3.db.0000115>, domain: <Terms>, range: <Comments>, flags: <>>] irb(main):118:0> terms.columns[0][1] => 472
期待した動作では、転置インデックスの配列が返ってくると思ってたけど、なにかのIDひとつが返ってきた。
インデックスカラムのデータ構造がさっぱり分からない。。