PDF (Portable Document Format) является одним из самых популярных форматов для обмена документами. Часто возникает необходимость объединить несколько PDF-файлов в один. В этой статье мы рассмотрим, как сделать это с помощью языка программирования Python и библиотеки PyPDF2.
pip install pypdf2
import PyPDF2, os
pdf_merger = PyPDF2.PdfMerger()
folder = 'pdfs'
for file in os.listdir(folder):
if file.endswith('.pdf'):
with open(folder + os.sep + file, 'rb') as file_pdf:
pdf_merger.append(file_pdf)
output_pdf = 'merged.pdf'
with open(output_pdf, 'wb') as merged_pdf:
pdf_merger.write(merged_pdf)
print(f"Successfully completed: {output_pdf}")
import PyPDF2
Мы импортируем библиотеку, чтобы иметь доступ к её функциональности.
2. Определение функции merge_pdfs:pdf_merger = PyPDF2.PdfMerger()
Мы создаем функцию merge_pdfs, которая принимает два аргумента: список PDF-файлов для объединения и имя выходного файла.
3. Чтение и добавление PDF-файлов:folder = 'pdfs'
for file in os.listdir(folder):
if file.endswith('.pdf'):
with open(folder + os.sep + file, 'rb') as file_pdf:
pdf_merger.append(file_pdf)
Для каждого PDF-файла в списке мы открываем его в режиме чтения бинарных данных ('rb') и добавляем в объект pdf_merger.
4. Запись объединенного PDF:output_pdf = 'merged.pdf'
with open(output_pdf, 'wb') as merged_pdf:
pdf_merger.write(merged_pdf)
После добавления всех файлов, мы открываем выходной файл в режиме записи бинарных данных ('wb') и записываем в него объединенный PDF.
С помощью библиотеки PyPDF2 и Python можно легко объединять PDF-файлы. Данный инструмент пригодится как для автоматизации рабочих процессов, так и для выполнения одноразовых задач. Надеемся, что это руководство было полезным и поможет вам эффективно работать с PDF-документами.
Для более сложных операций с PDF можно изучить дополнительные возможности библиотеки PyPDF2 или рассмотреть другие библиотеки, такие как reportlab и PyMuPDF.*текст*
- жирный,
~текст~
- курсивный,
-текст-
- _текст_
- подчеркнутый