PGroongaのインデックスを常に使う方法。

PGroongaJSON(B)に対しても全文検索できるのが便利ですが、レコード数が少ないとこんな感じで困ったことになる。
チュートリアルにあるサンプルスキーマとデータを投入した状態で、

test=# SELECT record FROM logs WHERE record @@ 'paths @ ".code" && number >= 200 && number < 300';
ERROR:  pgroonga: operator @@ is available only in index scans

レコード数が少ないので全件舐めたほうが速いからプランナがインデックスを使おうとせずにこうなる。

test=# explain SELECT record FROM logs WHERE record @@ 'paths @ ".code" && number >= 200 && number < 300';
                                   QUERY PLAN                                   
--------------------------------------------------------------------------------
 Seq Scan on logs  (cost=0.00..26.38 rows=655 width=32)
   Filter: (record @@ 'paths @ ".code" && number >= 200 && number < 300'::text)
(2 rows)

チュートリアルにあるとおり、

SET enable_seqscan = off;

すれば動くけど、本番でこれやるのはちょっとどうかと。かと言って、レコード数が増えてきてからPGroongaを使うようにアプリケーションを改修するっていうのも乗り気がしない。最初から@@演算子を使ったクエリを書きたい。


ってことでどうするか。要は常にインデックスを使うようにすればいいので、pg_hint_planを使う。
インストールした上で、クエリにヒント句を足してやるだけ。

test=# /*+ IndexScan(logs) */ SELECT record FROM logs WHERE record @@ 'paths @ ".code" && number >= 200 && number < 300';

record                                            
----------------------------------------------------------------------------------------------
 {"code": 200, "host": "www.example.com", "tags": ["web", "example.com"], "message": "GET /"}
(1 row)

これでレコードが1つしかなかろうが常にインデックスが使用され、@@演算子を使ったクエリが常に通るようになる。

BDへの安全なバックアップ方法。


というのを契機にしてバックアップ方法を再考してたんですが、堅牢なBD書き出し方法を考えたので書き留めます。

要求

  • メディアの劣化・破損の対策を講じる
  • メディアが第三者に渡った場合のデータ漏洩を防止する
  • 利便性のため、ディスクから直接ファイルを読み出せる
  • アクセスに必要なツールはすべてフリーソフトで構成されていること

構成

上記の要求を踏まえ、このような構成でディスクを作成することにしました。

  1. ファイルをEXT4フォーマットのイメージに格納(a)
  2. イメージはLUKSにて暗号化
  3. イメージをBDに書き出す際、エラー訂正情報を付与する

依存

  • cryptsetup
  • dvdisaster
  • mdadm

作成手順

EXT4ディスクイメージの作成
cd /tmp
dd if=/dev/zero bs=1M count=3500 of=disk.img.0
dd if=/dev/zero bs=1M count=3500 of=disk.img.1
dd if=/dev/zero bs=1M count=3500 of=disk.img.2
dd if=/dev/zero bs=1M count=3500 of=disk.img.3
dd if=/dev/zero bs=1M count=3500 of=disk.img.4

sudo losetup /dev/loop0 disk.img.0
sudo losetup /dev/loop1 disk.img.1
sudo losetup /dev/loop2 disk.img.2
sudo losetup /dev/loop3 disk.img.3
sudo losetup /dev/loop4 disk.img.4

sudo mdadm --create /dev/md/md0 -l linear -n 5 /dev/loop0 /dev/loop1 /dev/loop2 /dev/loop3 /dev/loop4
sudo cryptsetup luksFormat /dev/md/md0
sudo cryptsetup luksOpen /dev/md/md0 disk
sudo mkfs.ext4 /dev/mapper/disk
mkdir mount
sudo mount /dev/mapper/disk mount
sudo chown USERNAME mount

単一のrawイメージではなく複数のイメージをRAID0で束ねているのは、ISO9660フォーマットの仕様上4GB以上のファイルを格納できないため。単一イメージにしてしまうとファイル分割の必要がある。

ディスクイメージにファイルを投入

/tmp/mountに書き出したいファイルをコピーする

ISOイメージを作成
sudo umount mount
sudo cryptsetup luksClose disk
sudo mdadm --stop /dev/md/md0
sudo losetup -d /dev/loop0
sudo losetup -d /dev/loop1
sudo losetup -d /dev/loop2
sudo losetup -d /dev/loop3
sudo losetup -d /dev/loop4
mkisofs -L -R -o disk.iso -V DISKNAME disk.img.*
dvdisaster -c -i disk.iso -mRS02 -n BD

上記のパラメータだと、30%ほどの冗長性が確保できる。あとは作成したISOイメージをBD-Rに書き出せばよい。

マウント方法
sudo losetup /dev/loop0 /path/to/disk.img.0
sudo losetup /dev/loop1 /path/to/disk.img.1
sudo losetup /dev/loop1 /path/to/disk.img.2
sudo losetup /dev/loop1 /path/to/disk.img.3
sudo losetup /dev/loop1 /path/to/disk.img.4
sudo mdadm --assemble --force /dev/md/md0 /dev/loop0 /dev/loop1 /dev/loop2 /dev/loop3 /dev/loop4
sudo cryptsetup luksOpen /dev/md/md0 disk
mkdir /tmp/mount
sudo mount /dev/mapper/disk /tmp/mount

PGroonga on Travis CI

2015年2月13日追記: 公式な使い方が発表されました。以下の手順は用済みです。

今回はTravis CIを使うので、無理矢理ですがPGroongaを使えるようにしてみました。
最初は.travis.ymlのbefore_installでpgroongaのドキュメントにあるようにソースからのインストールをやろうとしたんですが、makeに必要なpostgresql-server-dev-9.4をaddonsに書いて入れてやろうとしても、
Disallowing packages: postgresql-server-dev-9.4
と言われてmake出来ないので、checkinstallで.debを作ってやることにしました。


Travis CIのワーカはUbuntu 12.04 LTS 64bitなので、同じ環境でVMを作り、それにPostgreSQL 9.4をインストール。その上でPGroongaをソースからインストールする手順を流し、

$ sudo make install

の代わりに

$ sudo checkinstall

をやってpgroonga_0.3.0-1_amd64.debを作ります。
作ったら、それを適当な場所に置き、.travis.ymlのbefore_installに

  - wget http://path/to/pgroonga_0.3.0-1_amd64.deb
  - sudo dpkg -i pgroonga_0.3.0-1_amd64.deb

と記述してやります。これでPGroongaのインストールができるので、あとはbefore_scriptで

  - psql -d データベース名 --command 'CREATE EXTENSION pgroonga;' -U postgres

と書いてやれば準備完了。あとはマイグレーション定義中でusing pgroongaでcreate indexしてやれば使えるはずです。

PGroongaを使うための調査。

こないだリニューアルした読書びよりでは全文検索エンジンGroongaを使用していて、Rroonga gemを使って全文検索用の処理を実装してあります。ただ、この実装だとPostgresに格納されている商品情報と、Groongaが使う検索用のインデックスが別管理になるので扱いが煩雑なんですよね。そこで、現在開発中の次期カケラの樹 "Sone"ではPGroongaを使おうかなと考えてます。これならActiveRecordから%%演算子を使ったクエリを投げてやれば全文検索できて、実装も管理も簡単になりそうなので。
使うにあたって、レプリケーションに非対応という点が検証必要だったので、試してみました。

前提

  • PostgreSQLで、streaming replicationを使ってアクティブ/スタンバイ構成を組む
  • 障害発生時、インデックスの再生成が必要なのは許容する

小さな個人サービスで、アップタイムを追わないぬるい環境なのでこの程度で大丈夫です。

結果

active側
test=# select * from memos;
-[ RECORD 1 ]----------------------------------------------------------------------
id      | 1
content | PostgreSQLはリレーショナル・データベース管理システムです。
-[ RECORD 2 ]----------------------------------------------------------------------
id      | 2
content | Groongaは日本語対応の高速な全文検索エンジンです。
-[ RECORD 3 ]----------------------------------------------------------------------
id      | 3
content | PGroongaはインデックスとしてGroongaを使うためのPostgreSQLの拡張機能です。

test=# explain analyze SELECT * FROM memos WHERE content %% '全文検索';
-[ RECORD 1 ]-------------------------------------------------------------------------------------------------------------------------------
QUERY PLAN | Bitmap Heap Scan on memos  (cost=8.91..26.60 rows=615 width=36) (actual time=1.332..1.333 rows=1 loops=1)
-[ RECORD 2 ]-------------------------------------------------------------------------------------------------------------------------------
QUERY PLAN |   Recheck Cond: (content %% '全文検索'::text)
-[ RECORD 3 ]-------------------------------------------------------------------------------------------------------------------------------
QUERY PLAN |   Heap Blocks: exact=1
-[ RECORD 4 ]-------------------------------------------------------------------------------------------------------------------------------
QUERY PLAN |   ->  Bitmap Index Scan on pgroonga_content_index  (cost=0.00..8.76 rows=615 width=0) (actual time=1.318..1.318 rows=1 loops=1)
-[ RECORD 5 ]-------------------------------------------------------------------------------------------------------------------------------
QUERY PLAN |         Index Cond: (content %% '全文検索'::text)
-[ RECORD 6 ]-------------------------------------------------------------------------------------------------------------------------------
QUERY PLAN | Planning time: 0.428 ms
-[ RECORD 7 ]-------------------------------------------------------------------------------------------------------------------------------
QUERY PLAN | Execution time: 1.740 ms

test=# SELECT * FROM memos WHERE content %% '全文検索';
-[ RECORD 1 ]----------------------------------------------
id      | 2
content | Groongaは日本語対応の高速な全文検索エンジンです。

当然ながら、全文検索可能。

standby側
test=# select * from memos;
-[ RECORD 1 ]----------------------------------------------------------------------
id      | 1
content | PostgreSQLはリレーショナル・データベース管理システムです。
-[ RECORD 2 ]----------------------------------------------------------------------
id      | 2
content | Groongaは日本語対応の高速な全文検索エンジンです。
-[ RECORD 3 ]----------------------------------------------------------------------
id      | 3
content | PGroongaはインデックスとしてGroongaを使うためのPostgreSQLの拡張機能です。

test=# explain analyze SELECT * FROM memos WHERE content %% '全文検索';
ERROR:  pgroonga: object isn't found: <IDs16537>

test=# SELECT * FROM memos WHERE content %% '全文検索';
ERROR:  pgroonga: object isn't found: <IDs16537>

レコード自体はレプリケートされている。全文検索は出来ない。

pg_ctl promote後のstandby
test=# SELECT * FROM memos WHERE content %% '全文検索';
ERROR:  pgroonga: object isn't found: <IDs16537>

test=# drop index pgroonga_content_index;
DROP INDEX

test=# CREATE INDEX pgroonga_content_index ON memos USING pgroonga (content);
CREATE INDEX

test=# explain analyze SELECT * FROM memos WHERE content %% '全文検索';
-[ RECORD 1 ]-----------------------------------------------------------------------------------------------------------------------------
QUERY PLAN | Index Scan using pgroonga_content_index on memos  (cost=0.13..8.17 rows=2 width=36) (actual time=0.390..0.391 rows=1 loops=1)
-[ RECORD 2 ]-----------------------------------------------------------------------------------------------------------------------------
QUERY PLAN |   Index Cond: (content %% '全文検索'::text)
-[ RECORD 3 ]-----------------------------------------------------------------------------------------------------------------------------
QUERY PLAN | Planning time: 0.175 ms
-[ RECORD 4 ]-----------------------------------------------------------------------------------------------------------------------------
QUERY PLAN | Execution time: 0.546 ms

test=# SELECT * FROM memos WHERE content %% '全文検索';
-[ RECORD 1 ]----------------------------------------------
id      | 2
content | Groongaは日本語対応の高速な全文検索エンジンです。

障害発生時にstandbyを昇格させ、インデックスを張り直せば全文検索が可能になる。


ウチの環境では問題なさそうなので、使ってみることにします。

長い旅の終わりと、「はじまりのそらから」の、新しい旅――天体のメソッド13話。

天体のメソッド 1(特装限定版) [Blu-ray]
天体のメソッド 2(特装限定版) [Blu-ray]
天体のメソッド 3(特装限定版) [Blu-ray]
天体のメソッド 4(特装限定版) [Blu-ray]
天体のメソッド 5(特装限定版) [Blu-ray]
天体のメソッド 6(特装限定版) [Blu-ray]

乃々香は強くあれたのは、友達があってこそのこと。乃々香は汐音を寂しがり屋と評していたけど、乃々香も一人では立っていられない。冒頭、汐音が来てくれたからこそ乃々香は立ち直れたし、汐音が言葉を重ねて背中を押してくれなければ、乃々香はノエルの存在を信じ直すだけで立ち止まってしまったはず。そんな乃々香が、とうとう汐音とかつてのように、分かつことの出来ない二人で一つに戻れたあの湖畔のシーン、本当に良かった。7年越しの再会、いや、ひょっとすると円盤の町と円盤のない町での合計、14年分の旅の終着点かもしれない。語らう二人の姿が暖かくて、甘くて、もうこの二人が道を分かつことは永遠にないんだって分かって、長い長い旅の終わりにふさわしい光景だと感じた。
また、桟橋のシーン。今まではみんなが動き出すのは、乃々香の言葉が決め手だった。けど今回は違った。「みんなで、円盤を呼ぼう」という乃々香の台詞はあれども、今回はそれが決め手ではない。乃々香がいつもやっていた、皆の背中を押す役割を、今度は汐音が果たす。雄弁に、皆が思っていること、けれど一歩踏み出せないことを、語り、背中を押す。引っ込み思案だった汐音が、乃々香にもらったもので大きく変われたことを象徴しているよう。乃々香にとっても、ただ単に助けられたよりもずっとほっと出来たんじゃないかな、と思う。
4話冒頭、身も心もボロボロになった乃々香にとどめを刺すような捨て台詞を投げつけていた汐音が、こうまで乃々香をひたすら信じ支える唯一無二の親友に戻れたのだから、乃々香、本当によく頑張ったよね。もちろん汐音が乃々香を信じていたのも大きいのだけど、乃々香が折れてしまわずに頑張ったから汐音も救われることができた。本当に良かった。


12話の記事で書いたとおり、円盤の町の記憶は乃々香の夢という疑惑があった。汐音に助けられる直前、乃々香の心が折れてしまいそうだったのはその疑念がやたらと説得力を持って彼女を苛んでいたからだろうけど、それは汐音が同じ記憶を持っていたことによって払拭された。冒頭、「夢じゃ、なかった」と一言つぶやいてへたりこむ乃々香の姿、それまで彼女が抱えていた重荷、辛さが感じられてズキッと心が痛んだと同時に、それらからやっと解放されたんだって安堵が広がって、安心した。
そして、たちの悪い疑念はその時点で払拭されたのだから、それ以上に否定材料は必要ではないのだけど、今回乃々香が連れ帰った汐音への父の行動も、あの町の実在の裏付けになっていてうれしかった。
円盤の町での出来事、つまり、"最初の"町への帰還後、父が料理をしようとしたのはオリエンテーリングの次の日。しかも目玉焼きという単純なもの。それが今回は、始業式の日。内容も、ずっと複雑。次にはオムライスまで。焦がしたりとロクな事してないとはいえ、円盤の町での父よりは料理の上達が早いように思える。これは、意識には上らずとも円盤の町での経験が残っていて、それが円盤のない町でも影響していたんじゃないか。つまりこれも、円盤の町が実在した、乃々香の夢なんかじゃなかったっていう裏付けだと思う。
乃々香はそれに気づいていたのかな。父にあきれつつ、汐音との幸せな時間を過ごしているのだから、そんなことまで気は回らなかったかもしれない。別に、そこに気づかなくとも汐音の記憶の存在だけで十分だろうから、良いのだけど。


円盤の町では柚季の行動を苦々しく思ったり諫めたりしていた湊太が、円盤のない町では乃々香の行動にいらだって諫めようとするとか、前回に引き続き以前の柚季の立場と今の乃々香の立場が重なるんですよね。突っ走る柚季を助けようとする乃々香の関係が、ノエルと会いたい一心の乃々香を支える汐音と重なる。
柚希は乃々香が諦めなかったからこそ救われた。じゃあ、今度も大丈夫。汐音はもう二度と乃々香から離れていくはずないのだから。
12話はホントどうしようかと思ったけれど、今回は安心して見られた。本当に、乃々香はいい人に巡り会えたと思う。本人も言っていたけれど、汐音にもし出会えなければ後悔どころの騒ぎではなかったよね、と思う。しかもその場合は何かを失ったことにすら気づかなかっただろうから、尚更。
自分が失ったものにも気づけず、おぼろげな、母への負い目、自責の念だけを抱え、どことなく薄っぺらい人生を送る羽目になったのだろうとしか想像できず、ぞっとする。
円盤の町で乃々香が汐音を救った時、汐音もまた乃々香を救ったんだ。そしてそれは、円盤のない町でも繰り返された。


特殊エンディングに突入した時は少し驚いたけど、よく考えたらなぜ通常じゃなかったのかわかったように思う。
通常エンディングで描かれているのは、幼き頃の願いに導かれて5人が湖畔に集まり、再び再会できるということ。
これは11話で達成され、12話で一度壊れるも、再び13話で達成された話。
だからこそ13話では、それを繰り返すことはしなかった。代わりに、再び一つになった5人が、最後のピースになるノエルを探すこととなる。これは、新しい旅の始まりにふさわしいな、と思った。

この物語は、徹底して"奇跡"だの"不思議なこと"が排除された物語で、唯一のそれは円盤の出現だとずっと思ってた。しかしそれすらも本当はなかった。いや、円盤は来たしノエルも本当にいるのだけど、それは円盤がある世界のことで、円盤のない世界では何も奇跡は起こらなかった。
そんな中で、最後に、唯一起こった奇跡。 一面のひまわりの中で、ひまわりみたいな女の子が、最後になくしたものを再びみつける。それは、奇跡が一つだけ起こるならこれしかない、という感じで、これ以上の結末はないだろうな、と思った。


この作品を観られて、本当に良かったと思う。ここまで好きになれる作品は、最初で最後じゃないかな、とさえ思った。