日立製作所(古川一夫社長)は3月17日、映像テロップの文字を高い精度で読み取る技術を開発したと発表した。複数行にわたるテロップや明暗が反転した文字が混在する複雑なテロップに対して、文字抽出を行うことができるのが特徴。

 まず、映像からテロップ出現時刻とテロップ領域を検出し、次にテロップの領域から文字列部分を抽出、そして文字列部分から各文字画像を抽出、という3ステップで文字情報を抽出する。今回、文字列部分を抽出する技術として、文字ではない図形を検出して除去するための新アルゴリズムを開発。また、明暗反転文字が混在したテロップに対応するために、文字であるのか背景であるのかを判別する新しいアルゴリズムもつくった。新技術を組み合わせてテロップ文字認識の評価実験を行ったところ、90%以上の精度で映像中のテロップから文字認識できたという。

 同社では、本技術を用いてテロップを文字データに自動的に変換して映像コンテンツのシーン検索を行うなど、テロップを用いた映像検索の実現に応用する計画。