kindle OCRアプリ開発 新アルゴリズム検討

・別のアルゴリズムの検討

ダメだと思っていたkindleのOCRアプリだが、こういうアルゴリズムを考えました。

1. kindleテキストやテキストを選択。そのとき、コピーなどのウィンドウが表示される
2. イラストはグレーで大きく囲われるので、その部分の4点の座標をグレーの色を指定して取得
色指定がミソ。指定なしだとコピーなどのウィンドウも巻き込んでしまう
3. スクショをとり、その4点の長方形を白で塗りつぶす
4. そのイラストが除外された画像をOCR読み取り

こうすればテキストやイラストを選択したときに表示されてしまうウィンドウやイラストを無視してOCR読み取りができ、またページの末端の行の文字の選択問題も回避できると思われます。

タイトルとURLをコピーしました