RVS技術は、印刷された紙の文書情報とインターネット上のデジタル情報やサービスを結び付けることができる技術です。本技術は、米国シリコンバレーにあるRicoh Innovations, Inc.で開発されたものです。2次元バーコードなどを付ける必要はなくなり、リンク情報を印刷後に追加していくことも可能なので、自由度が高く従来ない新しいタイプのアプリケーションやサービスの可能性が広がります。
先日公開されたRICOH TAMAGO Clickerが気になったので調べてみた。
特徴点を指紋のようにして保存しておいて、取られた写真と特徴点をマッチングさせてコンテンツを表示させるんだろう。
たしかにこれだと、電子透かしのようにあらかじめ印刷は必要ないし、電子透かしのノイズが気になる、ってことはないけど、特徴点を蓄えて置かなければならないストレージがいるってことだ。個人的にはあまりそう言うのは好きじゃない。そこで完結していて欲しいのだ。何十年先でも、電子透かしであれば読めるのだ。
この論文はないかなと思って検索したが、見つけられなかった。近いもので、特徴点の高速照合とその文書画像検索への応用というのも見つけたが、先日学会誌捨てちゃった。。。Abstractでは、かなり高速に検索できそうなんだな。
(追記)
上記の文献が、自分のうちのトイレに積まれていた。
この手の最新の手法はLocally Likely Arrangement Hashing(LLAH)というらしい。詳細は読んでもよくわからなかったが、例えば、
文書画像からページあたり600点程度の特徴点が取り出される。データベースの大きさは1,000万ページである。これはデータベースに60億個の特徴点が含まれることを意味する。検索質問の600点とデータベースの60億の特徴点の照合は単一CPUの処理で60ms以内に完了する。必要なメモリ数は163GByte、文書画像検索の精度は99%以上である。(用いたCPUはAMD Opteron 2.2GHzである)
らしい。
基本的には、
異なる対象から同じ座標の特徴点が偶然得られることは十分あり得るが、これが複数の特徴点に「同時に」成り立つ可能性は低くなる
ことを利用した、投票アルゴリズムらしい。これより古い従来手法として、Geometric Hashingと呼ばれるものがあるようで、こちらの方が理解しやすそう…。