Spaces:
Paused
Paused
A newer version of the Gradio SDK is available:
6.8.0
metadata
title: PaddleOCR VL 0.9B
emoji: 📄
colorFrom: blue
colorTo: indigo
sdk: gradio
app_file: app.py
pinned: false
license: apache-2.0
models:
- PaddlePaddle/PaddleOCR-VL
short_description: Ultra-compact vision-language model for document parsing
PaddleOCR-VL (0.9B) Demo
Это демонстрационное пространство (Space) для модели PaddleOCR-VL. Модель специализируется на парсинге документов: текст, таблицы, формулы и графики. Она мультизычная и оптимизирована для работы с изображениями высокого разрешения.
Оригинальная модель: PaddlePaddle/PaddleOCR-VL
Возможности
- OCR: Распознавание текста на 100+ языках.
- Table: Преобразование изображений таблиц в Markdown/HTML структуру.
- Formula: Распознавание сложных математических формул (LaTeX).
- Chart: Описание графиков и диаграмм.
Использование через API
Вы можете использовать этот Space как API endpoint для ваших скриптов.
Python (Gradio Client)
from gradio_client import Client, file
# Замените на ваш ID спейса и токен
client = Client("ВАШ_USERNAME/НАЗВАНИЕ_SPACE", hf_token="hf_...")
result = client.predict(
image=file("path/to/invoice.jpg"),
task_name="OCR (Текст)", # Варианты: "OCR (Текст)", "Таблица (Table)", "Формула (Formula)"
api_name="/predict"
)
print(result)