Если высуществовать寻找一款高精度、Запускать локально、поддерживатьсложныймакетиз OCR инструмент, то Zerox OCR
Несомненно, отличный выбор.
Zerox OCR Сначала будет PDF файлы преобразуются в изображения, которые затем GPT-4o-mini
Модель Определить и вывести Markdown и, наконец, все страницы, соответствующие Markdown Результаты, собранные вместе, образуют полную Markdown документ.
Он не только поддерживает распознавание текста с нулевой выборкой, но также может легко обрабатывать сложные макеты, такие как таблицы и диаграммы. Он также выводит результаты распознавания в формате Markdown, оптимизируя удобство извлечения информации.
1、Оптическое распознавание текста с нулевой выборкой
использовать GPT-4o-mini
Модель выполняет распознавание текста и может обрабатывать совершенно незнакомые Типы документов, такие как PDF, изображения и т. д.,Никакие данные о предварительном обучении не требуются,Готов предоставитьВысокоточные результаты оптического распознавания символов。
2、Markdown Выходной формат
существовать OCR В процессе конвертации Zerox Преобразуйте каждую идентифицированную страницу в краткую Markdown
формат для облегчения постобработки и организации текста.
Для разработчиков или обработчиков документов этот формат чрезвычайно практичен и его легко импортировать в другие системы.
3、поддерживать сложный документ
Zerox может обрабатывать не только простой текст, но и файлы, содержащие сложные макеты, такие как таблицы, диаграммы и т. д. Независимо от того, являются ли они отсканированными PDF-файлами или другими форматами, Zerox может распознать их и создать точный текстовый контент.
4、Запускать локально с помощью API поддерживать
поддерживатьЗапускать локально,Не нужно беспокоиться об утечке конфиденциальности. также,Он также обеспечивает API Интерфейс, легко интегрируемый в ваше приложение, повысит автоматизацию и эффективность бизнес-процессов.
Помимо предоставления демо-версии существования и использования, Zerox OCR также предоставляет пакеты API Node и Python для вызова.
pip install py-zerox
Использование (сначала необходимо настроить необходимые параметры, такие как GPT API):
from pyzerox import zerox
import os
import json
import asyncio
async def main():
file_path = "https://omni-demo-data.s3.amazonaws.com/test/cs101.pdf" ## local filepath and file URL supported
## process only some pages or all
select_pages = None ## None for all, but could be int or list(int) page numbers (1 indexed)
output_dir = "./output_test" ## directory to save the consolidated markdown file
result = await zerox(file_path=file_path, model=model, output_dir=output_dir,
custom_system_prompt=custom_system_prompt,select_pages=select_pages, **kwargs)
return result
# run the main function:
result = asyncio.run(main())
# print markdown result
print(result)
результат:
Zerox OCR
это мощный локальный инструмент с открытым исходным кодом, основанный на GPT-4o-mini может эффективно обрабатывать сложные документы и Markdown Формат вывода, подходящий для точного OCR Обработанный пользователь. Независимо от того, являетесь ли вы разработчиком или профессионалом, которому необходимо иметь дело с большими объемами документов, Zerox OCR Оба решения стоит попробовать.
Загрузите сейчас и попробуйте,Или испытайте онлайн-версию существования,Откройте больше возможностей в обработке документов!
Адрес проекта: https://github.com/getomni-ai/zerox
существоватьонлайн-опыт:https://getomni.ai/ocr-demo