Python

kindle OCRアプリ開発 chatGPT-3.5の要約は学習に向かない

kindleの画面をOCRで処理して、文章を取得その文章を適度に分割してchatGPTで要約要約された文章を音声にするという機能のアプリを作ってきました。まず2,3の機能を作ったのですが、どうもchatGPT-3.5の要約は要約とし...

2023.11.04

Python

kindle OCRアプリ開発である調をですます調に変換するコード

chatGPT-3.5を使うにあたり、である調で出力されることがあったので、ですます調に変換するコードを書きました。一定のアルゴリズムさえ抑えておけば大丈夫だろうと思いきや、言い回しや法則で決まっていない活用形があるため、完全に法則化はで...

2023.10.27

Python

kindle OCRアプリ開発 chatGPTのAPI制限

以下の工程のコードを作りました。テキストデータを改行6回などで章ごと、段落ごとに分割その分割したデータをchatGPTに渡して要約返ってきた要約テキストをgttsで音声化する（高速化のため並列処理で実施）ところが、chatGPTのA...

2023.10.25

Python

kindle OCRアプリ開発音声データの高速生成

音声データを作るのは簡単だが、遅いです。そこで高速化するための並列処理のコードを書いたが、エラーが出ました。・コード # テキストを音声に変換 def text_to_speech(segment, lang='ja'): tts = ...

2023.10.22

Python

kindle OCRアプリ開発テキストデータの分割

OCR機能ができてきたので、次は文章を分割するコードを作成することにしました。 2000文字などで区切ると文章の意味が繋がりません。そのため一定の文字数以上取得したら、つぎに現れる句点（。）で区切ることを検討しました。また、句点で区切っ...

2023.10.20

Python

kindle OCRアプリ開発 OCR後のテキストの修正

GoogleのAPIを使うことで画像から意図するテキストを得ることができました。それについて、半角スペースが随所に入っていたり、UnicodeのU+FEFFが入っていたりしていました。 URLもいらないのでそれらを除去するコードを作成しま...

2023.10.19

Python

kindle OCRアプリ開発新アルゴリズム検討

・別のアルゴリズムの検討ダメだと思っていたkindleのOCRアプリだが、こういうアルゴリズムを考えました。 1. kindleテキストやテキストを選択。そのとき、コピーなどのウィンドウが表示される 2. イラストはグレーで大きく囲われる...

2023.10.17

Python

kindle OCRアプリ開発 Google Drive APIの導入

・Google Drive APIを使った読み取りプログラム Google Drive API導入に必要なライブラリをインストールします（Anaconda環境）。 conda install google-auth conda instal...

2023.10.16

Python

macbook Air M1でのAnacondaの利用

・Anacondaを使う Anacondaを試しました。割りと簡単にインストール、Visual Studio Codeの起動やライブラリのインストールができました。しかし、pyautoguiだけインストールが上手くいきません。以下のコ...

2023.10.15

Python

kindle OCRアプリ開発選択範囲の問題

kindleのテキストを抽出するプログラムを書いていましたが、問題が発生しました。プログラムそのものは動く見通しが立ちました。 kindleの書籍にはテキストとイラストが混在し、それらを選択することでグレーで囲います。イラストは大きいの...

2023.10.14

Python

Python

kindle OCRアプリ開発 chatGPT-3.5の要約は学習に向かない

kindle OCRアプリ開発 である調をですます調に変換するコード

kindle OCRアプリ開発 chatGPTのAPI制限

kindle OCRアプリ開発 音声データの高速生成

kindle OCRアプリ開発 テキストデータの分割

kindle OCRアプリ開発 OCR後のテキストの修正

kindle OCRアプリ開発 新アルゴリズム検討

kindle OCRアプリ開発 Google Drive APIの導入

macbook Air M1でのAnacondaの利用

kindle OCRアプリ開発 選択範囲の問題

kindle OCRアプリ開発である調をですます調に変換するコード

kindle OCRアプリ開発音声データの高速生成

kindle OCRアプリ開発テキストデータの分割

kindle OCRアプリ開発新アルゴリズム検討

kindle OCRアプリ開発選択範囲の問題