[ad_1]
Nos complace anunciar una versión simplificada del SDK JumpStart de Amazon SageMaker que facilita la creación, el entrenamiento y la implementación de modelos base. El código de predicción también está simplificado. En esta publicación, mostramos cómo puede comenzar a usar modelos básicos con solo unas pocas líneas de código usando el SDK simplificado de SageMaker Jumpstart.
Para obtener más información sobre el SDK JumpStart de SageMaker simplificado para implementación y capacitación, consulte Implementación de código bajo con la clase JumpStartModel o Ajuste de código bajo con la clase JumpStartEstimator.
Descripción general de la solución
SageMaker JumpStart proporciona modelos previamente entrenados de código abierto para una variedad de tipos de problemas para ayudarlo a comenzar con el aprendizaje automático (ML). Puede entrenar y perfeccionar gradualmente estos modelos antes de implementarlos. JumpStart también ofrece plantillas de soluciones que configuran la infraestructura para casos de uso comunes, así como cuadernos de ejemplo ejecutables para ML con Amazon SageMaker. Puede acceder a los modelos, plantillas de soluciones y ejemplos previamente entrenados desde la página de inicio de SageMaker JumpStart en Amazon SageMaker Studio o utilizar el SDK de SageMaker Python.
Para demostrar las nuevas características del SDK JumpStart de SageMaker, le mostraremos cómo usar el modelo Flan T5 XL previamente entrenado de Hugging Face para generar texto para tareas de resumen. También mostramos cómo optimizar el modelo Flan T5 XL para tareas de resumen con solo unas pocas líneas de código. Puede utilizar cualquier otro modelo de generación de texto, como por ejemplo: B. Llama2, Falcon o Mistral AI.
El cuaderno para esta solución con Flan T5 XL se puede encontrar en el repositorio de GitHub.
Implementar e invocar el modelo.
Los modelos de Foundation alojados en SageMaker JumpStart tienen ID de modelo. Para obtener la lista completa de ID de modelos, consulte Algoritmos integrados con tabla de modelos previamente entrenados. Para esta publicación, usaremos el ID del modelo de generación de texto Flan T5 XL. Creamos una instancia del objeto modelo y lo implementamos en un punto final de SageMaker llamándolo deploy
Método. Vea el siguiente código:
A continuación, llamamos al modelo para crear un resumen del texto proporcionado utilizando el modelo Flan T5 XL. La nueva interfaz del SDK le facilita llamar al modelo: solo necesita pasar el texto al predictor y este devolverá la respuesta del modelo como un diccionario de Python.
El siguiente es el resultado de la tarea de resumen:
Ajustar e implementar el modelo
El SDK JumpStart de SageMaker le ofrece una nueva clase: JumpStartEstimator
, lo que facilita el ajuste. Puede especificar la ubicación de los datos de ajuste y, opcionalmente, también pasar registros de validación. Después de refinar el modelo, use el método de implementación del objeto Estimator para implementar el modelo refinado:
Personalice las nuevas clases en SageMaker SDK
El nuevo SDK facilita la implementación y el ajuste de los modelos JumpStart al establecer muchos parámetros predeterminados. Aún tiene la opción de anular la configuración predeterminada y personalizar la implementación y visualización según sus necesidades. Por ejemplo, puede personalizar el tipo de formato de carga útil de entrada, el tipo de instancia, la configuración de VPC y más para su entorno y caso de uso.
El siguiente código muestra cómo anular el tipo de instancia al implementar su modelo:
El SDK JumpStart de SageMaker deploy
La función selecciona automáticamente un tipo de contenido y un serializador predeterminados. Si desea cambiar el tipo de formato de la carga útil de entrada, puede utilizar lo siguiente serializers
Y content_types
Objetos para comprobar las opciones disponibles para usted pasando el model_id
el modelo con el que estás trabajando. En el siguiente código, configuramos el formato de entrada de la carga útil configurándolo en JSON. JSONSerializer
como serializer
Y application/json
como content_type
:
A continuación, puedes invocar el modelo Flan T5 XL para la tarea de resumen con una carga útil en formato JSON. En el código siguiente, también pasamos parámetros de inferencia en la carga útil JSON para que las respuestas sean más precisas:
Si busca más formas de personalizar las entradas y otras opciones de alojamiento y ajuste, consulte la documentación de las clases JumpStartModel y JumpStartEstimator.
Diploma
En esta publicación, le mostramos cómo utilizar el SDK JumpStart de SageMaker simplificado para crear, entrenar e implementar modelos fundamentales y basados en tareas en solo unas pocas líneas de código. Tenemos las nuevas clases como se demuestra. JumpStartModel
Y JumpStartEstimator
usando el modelo Hugging Face Flan T5-XL como ejemplo. Puede utilizar cualquiera de los otros modelos básicos de SageMaker JumpStart para casos de uso como redacción de contenido, generación de código, respuesta a preguntas, resumen, clasificación, recuperación de información y más. Para obtener la lista completa de modelos disponibles con SageMaker JumpStart, consulte Algoritmos integrados con tabla de modelos previamente entrenados. SageMaker JumpStart también admite modelos de tareas específicas para muchos tipos de problemas comunes.
Esperamos que la interfaz de usuario simplificada de SageMaker JumpStart SDK le ayude a empezar rápidamente y le permita realizar entregas más rápido. ¡Esperamos escuchar cómo utiliza el SDK JumpStart simplificado de SageMaker para crear aplicaciones interesantes!
Sobre los autores
Evan Kravitz es ingeniero de software en Amazon Web Services y trabaja en SageMaker JumpStart. Está interesado en la confluencia del aprendizaje automático y la computación en la nube. Evan recibió su licenciatura de la Universidad de Cornell y su maestría de la Universidad de California, Berkeley. En 2021, presentó un artículo sobre redes neuronales adversarias en la conferencia ICLR. En su tiempo libre, Evan disfruta cocinar, viajar y correr en la ciudad de Nueva York.
Rachna Chadha Es arquitecto principal de soluciones AI/ML en Cuentas Estratégicas en AWS. Rachna es una optimista que cree que el uso ético y responsable de la IA puede mejorar la sociedad en el futuro y generar prosperidad económica y social. En su tiempo libre, Rachna disfruta pasar tiempo con su familia, hacer senderismo y escuchar música.
Jonathan Guineagagne es ingeniero de software sénior en Amazon SageMaker JumpStart en AWS. Recibió su maestría de la Universidad de Columbia. Sus intereses incluyen el aprendizaje automático, los sistemas distribuidos y la computación en la nube, además de democratizar el uso de la IA. Jonathan es originario de Francia y ahora vive en Brooklyn, Nueva York.
Dr. ashish khetan es un científico aplicado senior con algoritmos integrados en Amazon SageMaker y ayuda a desarrollar algoritmos de aprendizaje automático. Recibió su doctorado en la Universidad de Illinois Urbana-Champaign. Es un investigador activo en aprendizaje automático e inferencia estadística y ha publicado numerosos artículos en las conferencias NeurIPS, ICML, ICLR, JMLR, ACL y EMNLP.
[ad_2]