Я использую Linux; печать необработанных данных на порт 9100 возвращает тип «байты». Мне было интересно, можно ли перейти от этого прямо к PyPDF2, вместо того, чтобы сначала создавать файл PDF и использовать метод PdfFileReader?
Спасибо за ваше время.
Решение проблемы
PyPDF2.PdfFileReader()
определяет свой первый параметр как:
поток — объект File или объект, который поддерживает стандартные методы чтения и поиска, аналогичные объекту File. Также может быть строкой, представляющей путь к файлу PDF.
Таким образом, вы можете передавать ему любые данные, если к ним можно получить доступ как к файловому потоку. Идеальный кандидат для этого io.BytesIO()
. Запишите на него полученные необработанные байты, затем вернитесь к 0
, передайте объект, PyPDF2.PdfFileReader()
и все готово.
Комментариев нет:
Отправить комментарий