[ad_1]

Para ayudar a las empresas a escalar su uso de IA sin sobrecargar sus presupuestos, agregamos dos nuevas formas de reducir el costo de cargas de trabajo consistentes y asincrónicas:

  • Uso con descuento con rendimiento garantizado: Los clientes con uso persistente de token por minuto (TPM) en GPT-4 o GPT-4 Turbo pueden solicitar acceso al rendimiento aprovisionado para recibir descuentos que van del 10 % al 50 % según el tamaño del compromiso.
  • Costos reducidos para cargas de trabajo asincrónicas: Los clientes pueden utilizar nuestra nueva API Batch para ejecutar cargas de trabajo no urgentes de forma asincrónica. Las solicitudes de API por lotes cuestan el 50% de los precios comunes, ofrecen límites de tarifas mucho más altos y entregan resultados en 24 horas. Esto es ideal para casos de uso como evaluación de modelos, clasificación fuera de línea, resumen y generación de datos sintéticos.


Planeamos continuar agregando nuevas características enfocadas en seguridad de nivel empresarial, controles administrativos y gestión de costos. Para obtener más información sobre estas presentaciones, consulte nuestra documentación de API o comuníquese con nuestro equipo para analizar soluciones personalizadas para su negocio.

[ad_2]