Whitepaper v1.0

OMRA AI Gateway

Plataforma multi-tenant de orquestación LLM con enrutamiento inteligente, economía de tokens O₮ y agentes autónomos

Abril 2026 — Versión 1.0

10+
Proveedores LLM
26+
Integraciones
O₮
Economía de tokens
70/30
Reparto de ingresos

Índice

1. El Problema

Para el negocio

  • Vendor lock-in — integras GPT-4 y tres meses después DeepSeek es 10x más barato. Reescribir la integración es costoso.
  • Costos descontrolados — un agente mal configurado puede quemar el presupuesto en una noche.
  • Herramientas aisladas — CRM, ERP, marketplaces, contabilidad a través de APIs diferentes. El asistente IA solo responde, no actúa.
  • Seguridad — claves API en el código, sin auditoría, sin puertas de aprobación para operaciones críticas.

Para desarrolladores

  • Cada proveedor LLM tiene su propio SDK, formato de respuesta y límites.
  • RAG hay que construirlo desde cero para cada proyecto.
  • No hay forma estándar de crear un marketplace de herramientas.

2. La Solución

OAG es un Sistema Operativo de IA para B2B que resuelve estos problemas arquitectónicamente.

Gateway API Unificado

Los clientes usan el SDK estándar de OpenAI — OAG es compatible a nivel del protocolo Assistants v2. Cambiar de modelo es un solo cambio de config.

Client (OpenAI SDK) → OAG Gateway → Routing Engine → LLM Provider                                     ├── Billing Middleware                                     ├── RAG Engine                                     └── Tool Sandbox

Enrutamiento Inteligente

contenido Imágenes → Gemini Flash
volumen > 50k tokens → contexto largo
horario 22:00–06:00 → DeepSeek
cliente Enterprise → Claude Opus
fallback Proveedor caído → failover auto

Orchestrator

Chat en tiempo real vía WebSocket. Prompt stack completo: sistema → empresa → persona → RAG → herramientas. Streaming de tokens.

Sub-Agents

Workers autónomos por cron o eventos. Prompt ligero, fire-and-forget, logging completo.

26+ integraciones

E-Commerce
Ozon, Wildberries, Class365
Pagos
YooKassa, Tinkoff, MercadoPago
Logística
CDEK
Productividad
Google Workspace
Impuestos
AFIP/ARCA
Media & AI
OCR, Vision, Scraper

3. Arquitectura

Technology Stack

Runtime: Python 3.12 async
API: FastAPI + Uvicorn
ORM: SQLAlchemy 2.0
Database: PostgreSQL 16 + pgvector
Cache: Redis 7
Storage: MinIO (S3)
Frontend: Jinja2 + HTMX + Tailwind
Encryption: AES-256-GCM
Scheduling: APScheduler + croniter

Multi-Tenancy

Cada recurso está vinculado a company_id. Sin namespaces compartidos. Datos completamente aislados entre empresas.

Seguridad

  • Claves API cifradas (AES-256-GCM)
  • ACL Group + Tag para herramientas y archivos
  • Log de auditoría inmutable (90 días)
  • Puertas HITL para operaciones críticas

4. Economía de tokens O₮

O₮ (Omra Token) es la moneda interna de la plataforma que normaliza los costos de diferentes proveedores en una escala única.

O₮ USD
1$0.001
1,000$1.00
100,000$100.00

Revenue Sharing

Creador
Plataforma
Llamada externa
70%
30%
Propia
0%
100%

5. Sistema Multi-Agente

Delegation

Map-reduce sincrónico. El agente padre genera workers, recopila resultados.

Event Bus

Pub/Sub asincrónico. Los agentes se suscriben a topics mediante patrones glob.

Webhooks

Sistemas externos activan agentes por HTTP. Acoplamiento cero.

HITL Approval Gates

Para operaciones de alto riesgo (pagos, generación VEP, envíos masivos) el agente solicita aprobación humana. Notificaciones vía Telegram, decisiones en Cockpit UI o botones inline.


6. RAG Pipeline

Upload
PDF, DOCX, XLSX, TXT, MD
Parse
Fragmentos
Embed
pgvector 1536-dim
Retrieve
cosine ≥ 0.28
Inject
system prompt

7. Mercados Objetivo

E-Commerce (RU/LATAM)

Sincronización con marketplaces (Ozon, Wildberries, MercadoLibre), gestión de pedidos, automatización de precios.

Finanzas e impuestos

Automatización fiscal (AFIP/ARCA), monitoreo de deudas, generación VEP.

B2B SaaS

Asistente IA white-label — conecta proveedor, carga conocimiento, configura herramientas. Aislamiento total.

Creadores de herramientas IA

Marketplace con reparto de ingresos — crea una herramienta, gana 70% por cada llamada.


8. Ventajas Competitivas

Aspecto OAG Alternativas
Multi-proveedor 10 proveedores, API unificada 1-2 proveedores
Enrutamiento Reglas por contenido, hora, presupuesto Selección manual
Facturación Economía de tokens O₮ nativa Facturación externa
Herramientas Sandbox + marketplace + revenue sharing Function calls hardcoded
Agentes Cron + Event Bus + HITL + delegation Solo chat
Self-hosted Docker Compose, control total Solo SaaS

9. Conclusión

OAG no es un wrapper de ChatGPT. Es un sistema operativo completo para agentes IA en el negocio:

  • Una API en lugar de diez SDKs
  • Enrutamiento inteligente en lugar de selección manual
  • Economía de tokens en lugar de costos descontrolados
  • Agentes autónomos en lugar de solo chat
  • Marketplace de herramientas en lugar de integraciones hardcoded
  • Audit trail completo en lugar de caja negra

La plataforma ya está en producción, sirviendo procesos de e-commerce y finanzas para empresas en Rusia y Latinoamérica.

¿Listo para empezar?

Dejá tus datos — te contactamos en 24 horas.