Python

Python

kindle OCRアプリ開発 chatGPT-3.5の要約は学習に向かない

kindleの画面をOCRで処理して、文章を取得 その文章を適度に分割してchatGPTで要約 要約された文章を音声にする という機能のアプリを作ってきました。 まず2,3の機能を作ったのですが、どうもchatGPT-3.5の要約は要約とし...
Python

kindle OCRアプリ開発 である調をですます調に変換するコード

chatGPT-3.5を使うにあたり、である調で出力されることがあったので、ですます調に変換するコードを書きました。 一定のアルゴリズムさえ抑えておけば大丈夫だろうと思いきや、言い回しや法則で決まっていない活用形があるため、完全に法則化はで...
Python

kindle OCRアプリ開発 chatGPTのAPI制限

以下の工程のコードを作りました。 テキストデータを改行6回などで章ごと、段落ごとに分割 その分割したデータをchatGPTに渡して要約 返ってきた要約テキストをgttsで音声化する(高速化のため並列処理で実施) ところが、chatGPTのA...
Python

kindle OCRアプリ開発 音声データの高速生成

音声データを作るのは簡単だが、遅いです。 そこで高速化するための並列処理のコードを書いたが、エラーが出ました。 ・コード # テキストを音声に変換 def text_to_speech(segment, lang='ja'): tts = ...
Python

kindle OCRアプリ開発 テキストデータの分割

OCR機能ができてきたので、次は文章を分割するコードを作成することにしました。 2000文字などで区切ると文章の意味が繋がりません。 そのため一定の文字数以上取得したら、つぎに現れる句点(。)で区切ることを検討しました。 また、句点で区切っ...
Python

kindle OCRアプリ開発 OCR後のテキストの修正

GoogleのAPIを使うことで画像から意図するテキストを得ることができました。 それについて、半角スペースが随所に入っていたり、UnicodeのU+FEFFが入っていたりしていました。 URLもいらないのでそれらを除去するコードを作成しま...
Python

kindle OCRアプリ開発 新アルゴリズム検討

・別のアルゴリズムの検討 ダメだと思っていたkindleのOCRアプリだが、こういうアルゴリズムを考えました。 1. kindleテキストやテキストを選択。そのとき、コピーなどのウィンドウが表示される 2. イラストはグレーで大きく囲われる...
Python

kindle OCRアプリ開発 Google Drive APIの導入

・Google Drive APIを使った読み取りプログラム Google Drive API導入に必要なライブラリをインストールします(Anaconda環境)。 conda install google-auth conda instal...
Python

macbook Air M1でのAnacondaの利用

・Anacondaを使う Anacondaを試しました。 割りと簡単にインストール、Visual Studio Codeの起動やライブラリのインストールができました。 しかし、pyautoguiだけインストールが上手くいきません。 以下のコ...
Python

kindle OCRアプリ開発 選択範囲の問題

kindleのテキストを抽出するプログラムを書いていましたが、問題が発生しました。 プログラムそのものは動く見通しが立ちました。 kindleの書籍にはテキストとイラストが混在し、それらを選択することでグレーで囲います。 イラストは大きいの...