pdf-speak/pdf-speak.py

from pypdf import PdfReader
import subprocess
import argparse


def tts(text):
    piper_model_json_path = "piper-models/ihfq9facjxhl8b8z3afhn1kisq5wsghg-hfc_female-medium-en_US-hfc_female-medium.onnx.json"
    piper_model_path = "piper-models/dy5s1ri7ixy1c27fg4adaf8ji3hmqiic-hfc_female-medium-en_US-hfc_female-medium.onnx"
    command = f"echo \"{text}. \" | piper -q -m {piper_model_path} -c {piper_model_json_path} --output-raw | aplay -q -r 22050 -f S16_LE -t raw -"
    process = subprocess.run(command, shell=True, check=True)

def read_pdf(pdf_name, page_num):
    reader = PdfReader(pdf_name)
    page = reader.pages[page_num-1]
    text = page.extract_text().replace("\n","").split(". ")
    
    for sentence in text:
        print(sentence)
        tts(sentence)

if __name__ == "__main__":
    parser = argparse.ArgumentParser(description='Read PDF and convert to speech')
    parser.add_argument("-f", '--pdf-file', type=str, help='Path to the PDF file')
    parser.add_argument("-p", '--page', type=int, default=1, help='Page number to read from the PDF')

    args = parser.parse_args()
    pdf = args.pdf_file
    page = args.page
    read_pdf(pdf, page)
init proof of consept 2024-05-04 16:58:14 +02:00			`from pypdf import PdfReader`
			`import subprocess`
			`import argparse`


			`def tts(text):`
			`piper_model_json_path = "piper-models/ihfq9facjxhl8b8z3afhn1kisq5wsghg-hfc_female-medium-en_US-hfc_female-medium.onnx.json"`
			`piper_model_path = "piper-models/dy5s1ri7ixy1c27fg4adaf8ji3hmqiic-hfc_female-medium-en_US-hfc_female-medium.onnx"`
			`command = f"echo \"{text}. \" \| piper -q -m {piper_model_path} -c {piper_model_json_path} --output-raw \| aplay -q -r 22050 -f S16_LE -t raw -"`
			`process = subprocess.run(command, shell=True, check=True)`

			`def read_pdf(pdf_name, page_num):`
			`reader = PdfReader(pdf_name)`
			`page = reader.pages[page_num-1]`
			`text = page.extract_text().replace("\n","").split(". ")`

			`for sentence in text:`
			`print(sentence)`
			`tts(sentence)`

			`if __name__ == "__main__":`
			`parser = argparse.ArgumentParser(description='Read PDF and convert to speech')`
			`parser.add_argument("-f", '--pdf-file', type=str, help='Path to the PDF file')`
			`parser.add_argument("-p", '--page', type=int, default=1, help='Page number to read from the PDF')`

			`args = parser.parse_args()`
			`pdf = args.pdf_file`
			`page = args.page`
			`read_pdf(pdf, page)`