Python

Python

macbook Air M1でのDockerの利用

・Docketを試す Dockerをダウンロード、インストールします。 ・Dockerfileを記述する FROM python:3.11-slim # 作業ディレクトリの設定 WORKDIR /app # 必要なパッケージやライブラリをこ...
Python

kindle OCRアプリ開発 選択した範囲を除外・取得

ようやく新しいパソコン(macbook Air M1)で開発できるようになりました。別の用事などもあり、2週間もかかってしまいました。 肝心のkindle OCRアプリを作っていきます。 ・kindleで選択した範囲を取得or除外します k...
Python

新しいパソコン(macbook Air M1)での不具合2

・numpyライブラリが使えない numpyライブラリを使うコードが以前動いていたのに動かなくなりました。 原因はPCをMacBook Air M1に変えましたが、Apple Silicon(ARMベース)のプロセッサを使用しているためらし...
Python

kindle OCRアプリ開発 ピッチ変更

テキストファイルを音声ファイルに変換する機能を作っています。 変換そのものは簡単だが、音の高さを変えずにピッチを変えるのが難しいです。 ネットで見つけたコードを参考にしたら実現できたが、10秒くらいの音声を変換するのに1分くらいかかっていて...
Python

kindle OCRアプリ開発 文章選択の問題

・文章選択の問題について 画面を上エリア、下エリアに二分割すれば解決できそうです。 例えば以下のように、上エリアをまず選択します。 上エリア ●●●●●●●●●● ●●●●●●●●●● ●●●●●●●●●● 下エリア ●●●●●● ◯◯◯◯...
Python

kindle OCRアプリ開発 画像OCRの不具合

・処理工程の案 スクリーンショット撮影、OCR処理、chatGPTによる修正の工程がありますが、それら処理を一括でやって次の処理をするか、撮影・OCR・修正を1ページずつやる1サイクルごとにするか迷いました。 結果、処理を一括にすることにし...
Python

kindle OCRアプリ開発 chatGPT導入

・画像を除外するアルゴリズムの検討 最初にスクリーンショットをとり、フォントサイズを変更してもう一度スクリーンショットをとります。 書籍中の画像は変わらないから、変わらないもの=画像と判断して除外ないし、グレースケール塗りつぶしができるかも...
Python

kindle OCRアプリ開発 Llama 2はまだ日本語には使えない

chatGPTに渡す際、以下のこともやろうと思う。 ・目次の削除 ・参考文献の削除 ・巻末の記載の削除 地頭で文字のある部分だけ切り取りができないことを除けば、kindleテキスト抽出アプリの大枠はできた。 残す問題はAIにデータを渡して文...
Python

kindle OCRアプリ開発 OCR処理の懸念

OCR処理機能を作ります。 pytesseract でテキスト抽出を試みたが、英語しか読み取ってくれませんでした。 日本語で読み取りを可能にするため、tesseract-ocr-jpn をダウンロードします。 日本語で読み取りできるようにな...
Python

kindle OCRアプリ開発 今まで使えていたpillow,PILが使えなくなる2

以下のプログラムを走らせます。 import pyautogui import time # Kindleアプリがアクティブになるのを待つための遅延 time.sleep(5) pyautogui.press('right') すると以下の...