未分類

新しいパソコン(macbook Air M1)での不具合1

・OCRアプリ mac OSをアップグレードしてtime machineを使って他のパソコンに移行したら以下の箇所が動かなくなってしまいました。 pyautogui.press('right') pyautoguiのバージョンは新旧同じ0....
Python

kindle OCRアプリ開発 ピッチ変更

テキストファイルを音声ファイルに変換する機能を作っています。 変換そのものは簡単だが、音の高さを変えずにピッチを変えるのが難しいです。 ネットで見つけたコードを参考にしたら実現できたが、10秒くらいの音声を変換するのに1分くらいかかっていて...
Python

kindle OCRアプリ開発 文章選択の問題

・文章選択の問題について 画面を上エリア、下エリアに二分割すれば解決できそうです。 例えば以下のように、上エリアをまず選択します。 上エリア ●●●●●●●●●● ●●●●●●●●●● ●●●●●●●●●● 下エリア ●●●●●● ◯◯◯◯...
Python

kindle OCRアプリ開発 画像OCRの不具合

・処理工程の案 スクリーンショット撮影、OCR処理、chatGPTによる修正の工程がありますが、それら処理を一括でやって次の処理をするか、撮影・OCR・修正を1ページずつやる1サイクルごとにするか迷いました。 結果、処理を一括にすることにし...
Python

kindle OCRアプリ開発 chatGPT導入

・画像を除外するアルゴリズムの検討 最初にスクリーンショットをとり、フォントサイズを変更してもう一度スクリーンショットをとります。 書籍中の画像は変わらないから、変わらないもの=画像と判断して除外ないし、グレースケール塗りつぶしができるかも...
Python

kindle OCRアプリ開発 Llama 2はまだ日本語には使えない

chatGPTに渡す際、以下のこともやろうと思う。 ・目次の削除 ・参考文献の削除 ・巻末の記載の削除 地頭で文字のある部分だけ切り取りができないことを除けば、kindleテキスト抽出アプリの大枠はできた。 残す問題はAIにデータを渡して文...
Python

kindle OCRアプリ開発 OCR処理の懸念

OCR処理機能を作ります。 pytesseract でテキスト抽出を試みたが、英語しか読み取ってくれませんでした。 日本語で読み取りを可能にするため、tesseract-ocr-jpn をダウンロードします。 日本語で読み取りできるようにな...
未分類

kindle OCRアプリ開発 同一画像の判定

pythonでkindleのスクリーンショットをとっていき、最後までいったらストップするプログラムを書いていきます。 そのストップする処理をスクリーンショットが同じ画像という判定にします。 しかし、以下のプログラムでは違うスクリーンショット...
Python

kindle OCRアプリ開発 今まで使えていたpillow,PILが使えなくなる2

以下のプログラムを走らせます。 import pyautogui import time # Kindleアプリがアクティブになるのを待つための遅延 time.sleep(5) pyautogui.press('right') すると以下の...
Python

kindle OCRアプリ開発 今まで使えていたpillow,PILが使えなくなる

・今まで使えていたpillow,PILが使えなくなる 以下のようにエラーが出る。 ライブラリはインストールできていて、特にPIL,Pillowを使ったプログラムは今まで動いていたのに動作しなくなった。 Traceback (most rec...