視覚障害者の撮影サポートシステム、被写体の撮影部分に課題
大阪公立大学は12月22日、全方位カメラを用いた写真撮影システム「VisPhoto」を開発したと発表した。この研究は、同大大学院情報学研究科の岩村雅一准教授、平林直樹氏(同大大学院工学研究科修了)ら、大学入試センター研究開発部の南谷和範教授らの研究グループによるもの。研究成果は、「Proceedings of the 25th International ACM SIGACCESS Conference on Computers and Accessibility」に掲載されている。
画像はリリースより
(詳細は▼関連リンクからご確認ください)
視覚障害者にはさまざまな困り事があり、その一つに写真撮影がある。撮影の目的の中には、スマートフォンアプリによる文字の読み取りや、目の前の箱が何の箱なのか、何色なのかといった視覚的な情報を得ることが挙げられる。これらは、すでに人工知能(AI)により実現されている。一方、旅行などで思い出を記録することも撮影目的の一つだ。視覚障害者の撮影をサポートするため、音声ガイド付き撮影システムの開発が進んでおり、同研究グループもスマートフォン用アプリを提供している。しかし、従来の撮影システムでは一度被写体をカメラで写さなければ音声ガイドが動作せず、また被写体が複数ある場合や動いている場合は上手く撮影ができないという制約があった。
被写体にカメラを向けず簡単に撮影、全方位カメラの新システム「VisPhoto」
今回の研究では、全方位カメラ(全天球カメラ)を用いることで、従来手法とは異なり、視覚障害者が被写体にカメラを向けずに撮影できる新システム「VisPhoto」を提案した。全方位カメラでの360度撮影により、被写体にカメラを向けることなく、簡単に撮影ができる仕組みだ。
AI物体検出で対象物の位置・種類を把握、写真に残す部分をピンポイントで切り取り
「VisPhoto」では、まず、全方位カメラを用いて周囲を撮影する。全方向を一度に撮影できるため、被写体が物陰に隠れていない限り、周囲の物体が写真に写る。次に、全方位カメラで撮影した写真の中から視覚障害者が写真に残したいものを選択する。AI技術の物体検出技術を用いて、写真に写る物体の位置と名前をスクリーンリーダーで読み取り、音声や点字ディスプレイにより視覚障害者に伝える。それを確認した視覚障害者が、例えば「バナナとオレンジ」など、写真として残したい部分をコンピュータに指示する。その結果、バナナとオレンジが写った写真が切り出され、写真として保存される。
今回の研究で開発した新システムにより、被写体にカメラを向けることなく、簡単に写真撮影することが可能となった。なお、実際に同手法を体験した視覚障害者から、「VisPhotoによって保存した写真が、どのように写っているかを知りたい」という声があったという。今後はこの課題を解決すべく、研究を進めていく、と研究グループは述べている。
▼関連リンク
・大阪公立大学 プレスリリース