Python kindle OCRアプリ開発 chatGPT-3.5の要約は学習に向かない kindleの画面をOCRで処理して、文章を取得 その文章を適度に分割してchatGPTで要約 要約された文章を音声にする という機能のアプリを作ってきました。 まず2,3の機能を作ったのですが、どうもchatGPT-3.5の要約は要約とし... 2023.11.04 Python
Python kindle OCRアプリ開発 である調をですます調に変換するコード chatGPT-3.5を使うにあたり、である調で出力されることがあったので、ですます調に変換するコードを書きました。 一定のアルゴリズムさえ抑えておけば大丈夫だろうと思いきや、言い回しや法則で決まっていない活用形があるため、完全に法則化はで... 2023.10.27 Python
Python kindle OCRアプリ開発 chatGPTのAPI制限 以下の工程のコードを作りました。 テキストデータを改行6回などで章ごと、段落ごとに分割 その分割したデータをchatGPTに渡して要約 返ってきた要約テキストをgttsで音声化する(高速化のため並列処理で実施) ところが、chatGPTのA... 2023.10.25 Python
Python kindle OCRアプリ開発 音声データの高速生成 音声データを作るのは簡単だが、遅いです。 そこで高速化するための並列処理のコードを書いたが、エラーが出ました。 ・コード # テキストを音声に変換 def text_to_speech(segment, lang='ja'): tts = ... 2023.10.22 Python
Python kindle OCRアプリ開発 テキストデータの分割 OCR機能ができてきたので、次は文章を分割するコードを作成することにしました。 2000文字などで区切ると文章の意味が繋がりません。 そのため一定の文字数以上取得したら、つぎに現れる句点(。)で区切ることを検討しました。 また、句点で区切っ... 2023.10.20 Python
Python kindle OCRアプリ開発 OCR後のテキストの修正 GoogleのAPIを使うことで画像から意図するテキストを得ることができました。 それについて、半角スペースが随所に入っていたり、UnicodeのU+FEFFが入っていたりしていました。 URLもいらないのでそれらを除去するコードを作成しま... 2023.10.19 Python
Python kindle OCRアプリ開発 新アルゴリズム検討 ・別のアルゴリズムの検討 ダメだと思っていたkindleのOCRアプリだが、こういうアルゴリズムを考えました。 1. kindleテキストやテキストを選択。そのとき、コピーなどのウィンドウが表示される 2. イラストはグレーで大きく囲われる... 2023.10.17 Python
Python kindle OCRアプリ開発 Google Drive APIの導入 ・Google Drive APIを使った読み取りプログラム Google Drive API導入に必要なライブラリをインストールします(Anaconda環境)。 conda install google-auth conda instal... 2023.10.16 Python
Python macbook Air M1でのAnacondaの利用 ・Anacondaを使う Anacondaを試しました。 割りと簡単にインストール、Visual Studio Codeの起動やライブラリのインストールができました。 しかし、pyautoguiだけインストールが上手くいきません。 以下のコ... 2023.10.15 Python
Python kindle OCRアプリ開発 選択範囲の問題 kindleのテキストを抽出するプログラムを書いていましたが、問題が発生しました。 プログラムそのものは動く見通しが立ちました。 kindleの書籍にはテキストとイラストが混在し、それらを選択することでグレーで囲います。 イラストは大きいの... 2023.10.14 Python