2
17 回画像の認識・理解シンポジウム Google Glass で動作するポスターアノテーションシステム 1,a) カイ クンツェ 2,b) 2,c) 2,d) 2,e) 1. はじめに におけるポスター に対 する意 アイデアを るため ある.しか し,ポスター ,そこ あるこ が多く, わされた意 アイデア が他 され いう 題がある.こ するため, ェアラブルデバイ ある Google Glass するポスターアノテーショ ンシステムを 案する.これ ,ユーザがポスターに対し てコメント アノテーションをディジタル して し,それを他 きる いう ある. システム ,まずユーザに Google Glass ポスターを 影して らい,Locally Likely Arrangement Hashing (LLAH)[1] れる いて から対 するポスターを するこ ポス ター ディジタル けを している. システムが しているユースケースシナリオ システム について る. 2. 関連研究 “PaperUI”[2] をディスプレイ, をマ ように するインターフェイス ある.PaperUI するために QR コード SIFT[3] いている.QR コード きる いう があるが, める があり,ま にプリントする があるため すぎる いう 題がある.SIFT レイア によらず するこ き, にマーカーをプリ ントする いが, がかかるため ハード ェア しい ェアラブルデバイス いう 題がある. 1 大学 599–8531 学園 1–1 2 大学大学院 599–8531 1–1 a) [email protected] b) [email protected] c) [email protected] d) [email protected] e) [email protected] 3. シナリオ ここ システム よう あるかについて する. 3.1 コメントの追加 1 すように,ユーザ ポスターに対してコメン トを するこ きる.これにより, ポスター ためにコメントを したり,ポスター しておいたりする えられる.Google Glass イン ターフェースを いため,コメント Google Glass いる. 3.2 音声の追加 ポスターに いコメントを したい する ある.そ ため, システ 2 よう ,ユーザが して きる している.これにより, しポスターに しておくこ から すこ る. 3.3 関連情報へのアクセス システム ポスターにコンテンツ するこ きる. ,デモ ファ イルをポスターに しておくこ 3 ようにユー ザがポスターを がらデモ したり, った メールアドレス宛に いったこ る. 3.4 アノテーションを後から参照する ポスター りをす するこ だが, システム コメント して しておけ から Web インターフェースを して閲 するこ きる ( 4).これにより, から れたフィードバックを しておき, から きに するこ きるように る. 1

Google Glass で動作するポスターアノテーションシ …Google Glass で動作するポスターアノテーションシステム 田中克磨1,a) カイ クンツェ2,b)

  • Upload
    others

  • View
    5

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Google Glass で動作するポスターアノテーションシ …Google Glass で動作するポスターアノテーションシステム 田中克磨1,a) カイ クンツェ2,b)

第 17回画像の認識・理解シンポジウム

Google Glass で動作するポスターアノテーションシステム

田中 克磨1,a) カイ クンツェ2,b) 岩田 基2,c) 岩村 雅一2,d) 黄瀬 浩一2,e)

1. はじめに

学会におけるポスター発表は,研究者が自身の研究に対

する意見やアイデアを得るための重要な場である.しか

し,ポスター発表の性質上,そこでの議論は少人数の間で

のやり取りであることが多く,交わされた意見やアイデア

が他の参加者と共有されないという問題がある.この問題

を解決するため,本研究では,眼鏡型ウェアラブルデバイ

スである Google Glass で動作するポスターアノテーショ

ンシステムを提案する.これは,ユーザがポスターに対し

てコメントや音声などのアノテーションをディジタル情報

として付加し,それを他の参加者と共有できるというもの

である.本システムでは,まずユーザに Google Glass で

ポスターを撮影してもらい,Locally Likely Arrangement

Hashing (LLAH)[1]と呼ばれる文書画像検索を用いて撮影

画像から対応するポスターを特定することで,紙のポス

ターとディジタル情報の関連付けを実現している.本稿で

は,本システムが想定しているユースケースシナリオや,

システムの実装・性能について述べる.

2. 関連研究

“PaperUI”[2]は,紙をディスプレイ,携帯端末をマウス

のように使用するインターフェイスである.PaperUI で

は,文書を特定するために QRコードや SIFT[3]などの局

所特徴量を用いている.QRコードは高速に認識できると

いう利点があるが,埋め込める情報量には限界があり,ま

た文書上にプリントする必要があるため視覚的に目立ち

すぎるという問題がある.SIFT特徴量は文書のレイアウ

ト等によらず使用することができ,文書にマーカーをプリ

ントする必要はないが,特徴量の計算に時間がかかるため

ハードウェア資源の乏しいウェアラブルデバイスでは十分

な速度を出せないという問題がある.

1 大阪府立大学工学部 〒 599–8531 大阪府堺市中区学園町 1–12 大阪府立大学大学院工学研究科 〒 599–8531 大阪府堺市中区学園町 1–1

a) [email protected]) [email protected]) [email protected]) [email protected]) [email protected]

3. シナリオ

ここでは,本システムの各機能がどのような場合に有用

であるかについて考察する.

3.1 コメントの追加

図 1 に示すように,ユーザはポスターに対してコメン

トを追加することができる.これにより,例えばポスター

を後で読むときのためにコメントを残したり,ポスター

の発表者が不在の場合に質問を残しておいたりするとい

う使い方が考えられる.Google Glass は文字入力のイン

ターフェースを持たないため,コメントの入力には Google

Glass の持つ音声認識の機能を用いる.

3.2 音声の追加

ポスターに長いコメントを追加したい場合,音声入力だ

けで完璧に入力するのは困難である.そのため,本システ

ムでは図 2のような,ユーザが音声を録音して追加できる

機能を実装している.これにより,例えば発表者との議論

を録音しポスターに追加しておくことで,後から誰でもそ

の議論を聞き直すことが可能になる.

3.3 関連情報へのアクセス

本システムでは,発表者も自らのポスターにコンテンツ

を追加することができる.例えば,デモ動画や論文のファ

イルをポスターに登録しておくことで,図 3のようにユー

ザがポスターを読みながらデモ動画を同時に再生したり,

気に入った研究の論文を自分のメールアドレス宛に送信す

るなどといったことが可能になる.

3.4 アノテーションを後から参照する

ポスター発表でのやり取りをすべて記憶することは困難

だが,本システムでコメントや音声として記録しておけば,

後からWebインターフェースを通して閲覧することがで

きる (図 4).これにより,例えば発表者が参加者から得ら

れたフィードバックを残しておき,後から好きなときに参

照することができるようになる.

1

Page 2: Google Glass で動作するポスターアノテーションシ …Google Glass で動作するポスターアノテーションシステム 田中克磨1,a) カイ クンツェ2,b)

第 17回画像の認識・理解シンポジウム

図 1 音声入力によるコメントの追加

図 2 発表者との議論を録音する

図 3 ポスターを見ながらデモ動画を再生する

図 4 Web インターフェース

4. ソフトウェア

4.1 実装

本システムでは文書画像検索として LLAHを利用する

が,ハードウェア資源の少ない Google Glass 上で検索処

理をすべて行うことは困難である.そこで,Google Glass

では撮影画像からの特徴点抽出のみを行い,検索処理はあ

らかじめ用意されたサーバ上で行うこととする.このサー

バは,ポスターの文書画像データベースと前述のWebイ

ンターフェースを保持している.

4.2 検索性能

本システムで文書画像検索の手法として用いる LLAHに

ついては,1億ページの文書画像を登録したデータベース

を使った実験において,必要メモリ量 236[GB],検索精度

98.7[%],処理時間 26.8[ms]での検索が可能であることが

確認されている [5].そのため,ポスター発表の規模 (ポス

ター 30~50枚)においても十分に実用的な速度と精度で検

索可能である.

5. まとめ

本研究では Google Glass上で動作するポスターアノテー

ションシステムを提案した.本システムを利用することで,

従来のポスター発表の形式を壊すことなく,ポスター発表

の参加者同士が議論を簡単に共有できるようになる.また

本稿では,本システムがどのようなケースで有用であるか

について考察した.今後の課題としては,実際のポスター

発表でソフトウェアを配布してユーザからフィードバック

を集め,アプリケーションのユーザインタフェースとユー

ザビリティを向上させることが挙げられる.

参考文献

[1] T. Nakai, K. Kise, and M. Iwamura, “Use of Affine Invari-ants in Locally Likely Arrangement Hashing for Camera-Based Document Image Retrieval,” Proc. DAS 2006, 3872,pp. 541–552, Feb. 2006.

[2] Q. Liu and Chunyuan Liao, “PaperUI,” Proc. 4th Inter-national Workshop on Camera-Based Document Analysisand Recognition, pp. 3–10, Sep. 2011.

[3] D.G. Lowe, “Distinctive image features from scale-invariant keypoints,” Int. J. Comput. Vision, vol. 60,pp. 91–110, Nov. 2004.

[4] K. Takeda, K. Kise, and M. Iwamura, “Real-time doc-ument image retrieval on a smartphone,” Proc. IAPR,pp. 225–229, 2012.

[5] 竹田 一貴,黄瀬 浩一,岩村 雅一,“1 億ページのデータベースを対象とした大規模文書画像検索,” パターン認識・メディア理解研究会 (PRMU2012),pp. 131–136,2012年.

2