Извлечение данных из PDF через ИИ
От PDF к таблице без ручного ввода
Счета, накладные, договоры приходят в PDF, а нужны - строки в базе. Я извлекаю текст из PDF и прошу модель вернуть строгий JSON по схеме.
const prompt = "Верни JSON: {number, date, total, counterparty}. " +
"Если поля нет - null. Текст документа:\n" + pdfText;
Чтобы данным можно было верить
- Задаю жёсткую схему и прошу null вместо догадок.
- Проверяю результат: суммы и даты валидирую кодом.
- Сомнительные документы отправляю на ручную проверку, а не молча сохраняю.
Связка "автосбор из почты + извлечение через ИИ" закрывает рутину с документами почти целиком.
Чтобы оставить комментарий, войдите через Discord.
Войти через Discord