[ad_1]
Nos complace anunciar que Amazon Personalize ahora admite importaciones masivas incrementales de registros; una nueva forma de actualizar tus datos y mejorar la calidad de tus recomendaciones. Mantener sus registros actualizados es una parte importante para mantener la relevancia de sus recomendaciones. Antes de presentar esta nueva función, Amazon Personalize ofrecía dos mecanismos para recopilar datos:
- DatasetImportJob –
DatasetImportJob
es un mecanismo de ingesta masiva de datos diseñado para importar grandes conjuntos de datos en Amazon Personalize. Un viaje típico comienza con la importación de su registro de interacción histórico además de su catálogo de artículos y registro de usuario.DatasetImportJob
luego se puede usar para mantener sus registros actualizados mediante el envío masivo de registros actualizados. Antes de este lanzamiento, los datos recopilados a través de trabajos de importación anteriores se sobrescribían con todos los posteriores.DatasetImportJob
. - API de transmisión: Las API de Streaming (
PutEvents
,PutUsers
yPutItems
) están diseñados para actualizar incrementalmente cada registro respectivo en tiempo real. Por ejemplo, después de haber entrenado su modelo y lanzado su campaña, sus usuarios continuarán generando datos de interacción. Luego, estos datos se registran a través delPutEvents
API que actualiza gradualmente su conjunto de datos de interacción. Las API de transmisión le permiten ingerir datos a medida que los recibe, en lugar de recopilar los datos y programar la ingesta.
Con importaciones masivas incrementales, Amazon Personalize simplifica la ingesta de datos de conjuntos de datos históricos al permitirle importar cambios incrementales a sus conjuntos de datos de una sola vez DatasetImportJob
. Puede importar 100 GB de datos por COMPLETO DatasetImportJob
o 1 GB de datos por INCREMENTAL DatasetImportJob
. Datos añadidos a los registros INCREMENTAL
Las importaciones se agregan a sus registros existentes. Personalice los registros de actualizaciones con la versión actual cuando su importación incremental duplique los registros que se encuentran en su registro existente, lo que simplifica aún más el proceso de ingesta de datos. En las siguientes secciones, describimos los cambios en la API existente para admitir importaciones de conjuntos de datos incrementales.
CreateDatasetImportJob
Un nuevo parámetro llamado importMode
se agregó a la API CreateDatasetImportJob. Este parámetro es un tipo enumerado con dos valores: FULL
y INCREMENTAL
. El parámetro es opcional y su valor predeterminado es COMPLETO para mantener la compatibilidad con versiones anteriores. Que CreateDatasetImportJob
La solicitud es la siguiente:
La API de Boto3 es create_dataset_import_job y el comando de la interfaz de línea de comandos de AWS (AWS CLI) es create-dataset-import-job.
DescribeDatasetImportJob
Se expandió la respuesta a DescribeDatasetImportJob para indicar si la importación fue completa o incremental. El tipo de importación se muestra en uno nuevo importMode
Campo que es un tipo enumerado con dos valores: FULL
y INCREMENTAL
. Que DescribeDatasetImportJob
La respuesta es la siguiente:
La API de Boto3 es «describe_dataset_import_job» y el comando AWS CLI es «describe-dataset-import-job».
ListDatasetImportJob
Se expandió la respuesta a ListDatasetImportJob para indicar si la importación fue completa o incremental. El tipo de importación se muestra en uno nuevo importMode
Campo que es un tipo enumerado con dos valores: FULL
y INCREMENTAL
. Que ListDatasetImportJob
La respuesta es la siguiente:
La API de Boto3 es list_dataset_import_jobs y el comando de la AWS CLI es list-dataset-import-jobs.
ejemplo de código
El siguiente código muestra cómo crear un trabajo de importación de conjuntos de datos para la importación masiva incremental mediante SDK para Python (Boto3):
resumen
En esta publicación, describimos cómo puede usar esta nueva función en Amazon Personalize para realizar actualizaciones incrementales en un conjunto de datos importados en masa, manteniendo los datos actualizados y mejorando la relevancia de las recomendaciones de Amazon Personalize. Si tiene acceso diferido a sus datos, la importación masiva incremental facilita la importación de sus datos al agregarlos a sus conjuntos de datos existentes.
Pruebe esta nueva función accediendo a Amazon Personalize ahora.
Sobre los autores
neelam koshiya es arquitecto de soluciones empresariales en AWS. Su enfoque actual es ayudar a los clientes empresariales en su viaje de adopción de la nube para lograr resultados comerciales estratégicos. En su tiempo libre, le gusta leer y estar en la naturaleza.
james jory es Arquitecto Principal de Soluciones para IA Aplicada en AWS. Tiene un interés particular en la personalización y los sistemas de recomendación y experiencia en comercio electrónico, tecnología de marketing y análisis de datos de clientes. En su tiempo libre, le encantan las simulaciones de campamentos y carreras de autos.
daniel foley es gerente sénior de productos para Amazon Personalize. Se enfoca en desarrollar aplicaciones que aprovechan la inteligencia artificial para resolver los mayores desafíos de nuestros clientes. Fuera del trabajo, Dan es un ávido esquiador y excursionista.
Alex Berlingeri es un ingeniero de desarrollo de software en Amazon Personalize que trabaja en un servicio de recomendaciones basado en aprendizaje automático. En su tiempo libre le gusta leer, entrenar y ver fútbol.
[ad_2]