← К списку

Извлечение данных из PDF через ИИ

Извлечение данных из PDF через ИИ

От PDF к таблице без ручного ввода

Счета, накладные, договоры приходят в PDF, а нужны - строки в базе. Я извлекаю текст из PDF и прошу модель вернуть строгий JSON по схеме.

const prompt = "Верни JSON: {number, date, total, counterparty}. " +
  "Если поля нет - null. Текст документа:\n" + pdfText;

Чтобы данным можно было верить

  • Задаю жёсткую схему и прошу null вместо догадок.
  • Проверяю результат: суммы и даты валидирую кодом.
  • Сомнительные документы отправляю на ручную проверку, а не молча сохраняю.

Связка "автосбор из почты + извлечение через ИИ" закрывает рутину с документами почти целиком.

// обсуждение

Комментарии (0)

Будьте первым, кто оставит комментарий.

Чтобы оставить комментарий, войдите через Discord.

Войти через Discord