Whitepaper v1.0

OMRA AI Gateway

Мультитенантная платформа оркестрации LLM с интеллектуальной маршрутизацией, токен-экономикой O₮ и автономными агентами

Апрель 2026 — Версия 1.0

10+
Провайдеров LLM
26+
Интеграций
O₮
Токен-экономика
70/30
Доля дохода

Содержание

1. Проблема

Для бизнеса

  • Vendor lock-in — компания подключает GPT-4, а через 3 месяца DeepSeek оказывается дешевле в 10 раз. Переписывать интеграцию — дорого.
  • Неконтролируемые расходы — один misconfigured agent может сжечь бюджет за ночь.
  • Разрозненные инструменты — CRM, ERP, маркетплейсы, бухгалтерия — всё через разные API. AI-ассистент не может действовать, только отвечать.
  • Безопасность — API-ключи в коде, нет аудита, нет approval gates для критичных операций.

Для разработчиков

  • Каждый LLM-провайдер — свой SDK, свой формат ответа, свои лимиты.
  • RAG приходится строить с нуля для каждого проекта.
  • Нет стандартного способа создать tool marketplace.

2. Решение

OAG — это AI Operating System для B2B, которая решает эти проблемы архитектурно.

Единый API-шлюз

Клиент использует стандартный OpenAI SDK — OAG совместим на уровне протокола Assistants v2. Переключение модели — одна строка конфига.

Client (OpenAI SDK) → OAG Gateway → Routing Engine → LLM Provider                                     ├── Billing Middleware                                     ├── RAG Engine                                     └── Tool Sandbox

Интеллектуальная маршрутизация

контент Изображения → Gemini Flash
объём > 50k токенов → long-context
время 22:00–06:00 → DeepSeek
клиент Enterprise → Claude Opus
fallback Провайдер лёг → авто-переход

Orchestrator

Реал-тайм чат через WebSocket. Полный prompt stack: системный промпт → компания → роль → RAG → инструменты. Стриминг токенов.

Sub-Agents

Автономные воркеры по расписанию или событиям. Легковесный промпт, fire-and-forget, полное логирование.

26+ интеграций

E-Commerce
Ozon, Wildberries, Class365
Платежи
YooKassa, Tinkoff, MercadoPago
Логистика
CDEK
Продуктивность
Google Workspace
Налоги
AFIP/ARCA
Media & AI
OCR, Vision, Scraper

3. Архитектура

Technology Stack

Runtime: Python 3.12 async
API: FastAPI + Uvicorn
ORM: SQLAlchemy 2.0
Database: PostgreSQL 16 + pgvector
Cache: Redis 7
Storage: MinIO (S3)
Frontend: Jinja2 + HTMX + Tailwind
Encryption: AES-256-GCM
Scheduling: APScheduler + croniter

Multi-Tenancy

Каждый ресурс привязан к company_id. Нет общих пространств имён. Данные компаний полностью изолированы.

Безопасность

  • API-ключи зашифрованы (AES-256-GCM)
  • Group + Tag ACL для инструментов и файлов
  • Иммутабельный audit log (90 дней)
  • HITL approval gates для критичных операций

4. Токен-экономика O₮

O₮ (Omra Token) — внутренняя валюта платформы, нормализующая стоимость разных провайдеров к единой шкале.

O₮ USD
1$0.001
1,000$1.00
100,000$100.00

Revenue Sharing

Создатель
Платформа
Внешний вызов
70%
30%
Собственный
0%
100%

5. Мульти-агентная система

Delegation

Синхронный map-reduce. Родительский агент порождает воркеров, собирает результаты.

Event Bus

Асинхронный Pub/Sub. Агенты подписываются на топики через glob-паттерны.

Webhooks

Внешние системы запускают агентов по HTTP. Нулевая связность.

HITL Approval Gates

Для операций с высокими ставками (оплата, генерация VEP, массовые рассылки) агент запрашивает человеческое одобрение. Уведомления через Telegram, решения в Cockpit UI или inline-кнопками.


6. RAG Pipeline

Upload
PDF, DOCX, XLSX, TXT, MD
Parse
Чанки
Embed
pgvector 1536-dim
Retrieve
cosine ≥ 0.28
Inject
system prompt

7. Целевые рынки

E-Commerce (RU/LATAM)

Синхронизация с маркетплейсами (Ozon, Wildberries, MercadoLibre), управление заказами, автоматизация ценообразования.

Финансы и налоги

Автоматизация налоговой отчётности (AFIP/ARCA), мониторинг задолженностей, генерация VEP.

B2B SaaS

White-label AI-ассистент — подключи провайдера, загрузи знания, настрой инструменты. Полная изоляция данных.

Создатели AI-инструментов

Маркетплейс с revenue sharing — создай полезный tool, получай 70% от каждого вызова.


8. Конкурентные преимущества

Аспект OAG Альтернативы
Мульти-провайдер 10 провайдеров, единый API 1-2 провайдера
Маршрутизация Правила по контенту, времени, бюджету Ручной выбор модели
Биллинг Нативная токен-экономика O₮ Внешний биллинг
Инструменты Sandbox + маркетплейс + revenue sharing Hardcoded function calls
Агенты Cron + Event Bus + HITL + delegation Только чат
Self-hosted Docker Compose, полный контроль Только SaaS

9. Заключение

OAG — это не обёртка над ChatGPT. Это полноценная операционная система для AI-агентов в бизнесе:

  • Один API вместо десяти SDK
  • Умная маршрутизация вместо ручного выбора модели
  • Токен-экономика вместо неконтролируемых расходов
  • Автономные агенты вместо только чата
  • Маркетплейс инструментов вместо hardcoded интеграций
  • Полный audit trail вместо чёрного ящика

Платформа уже работает в продакшене, обслуживая e-commerce и финансовые процессы для компаний в России и Латинской Америке.

Готовы начать?

Оставьте заявку — мы свяжемся в течение 24 часов.