Más de cuatro mil millones de personas viven en ciudades de todo el mundo y, aunque la mayoría de las personas interactúan con otras personas a diario (en el supermercado, en el transporte público, en el trabajo), pueden apreciar sus interacciones frecuentes con las diversas plantas y animales que componen la frágil ciudad se compone, da por sentados los ecosistemas. Los árboles en las ciudades, los llamados bosques urbanos, ofrecen beneficios clave para la salud pública y el bienestar y demostrarán ser una parte integral de la adaptación al clima urbano. Filtran el aire y el agua, capturan la escorrentía del agua de lluvia, absorben el dióxido de carbono atmosférico y limitan la erosión y la sequía. La sombra de los árboles urbanos reduce los costos de enfriamiento que consumen energía y mitiga las islas de calor urbano. Solo en los EE. UU., los bosques urbanos cubren 127 millones de hectáreas y brindan servicios ecosistémicos por un valor de $ 18 mil millones. Pero con el cambio climático, estos ecosistemas están cada vez más amenazados.
![]() |
Los datos del censo generalmente no son completos y cubren un subconjunto de árboles públicos pero no los de los parques. |
Monitoreo de bosques urbanos – Medir el tamaño, la salud y la distribución de especies de árboles en las ciudades a lo largo del tiempo: permite a los investigadores y formuladores de políticas (1) cuantificar los servicios de los ecosistemas, incluidas las mejoras en la calidad del aire, el secuestro de carbono y los beneficios para la salud pública; (2) daños en las vías debido a eventos climáticos extremos; y (3) plantación dirigida para mejorar la resiliencia al cambio climático, enfermedades e infestaciones.
Sin embargo, muchas ciudades carecen incluso de datos básicos sobre la ubicación y el tipo de sus árboles. Recopilación de dichos datos a través de un censo de árboles es costoso (un censo reciente en Los Ángeles costó $ 2 millones y tomó 18 meses) y, por lo tanto, generalmente solo lo realizan ciudades con recursos significativos. Además, la falta de acceso a la vegetación urbana es un aspecto clave de la desigualdad social en las ciudades, incluida la desigualdad socioeconómica y racial. El monitoreo de los bosques urbanos permite cuantificar esta desigualdad y esforzarse por mejorarla, un aspecto clave del movimiento de justicia ambiental. Pero el aprendizaje automático podría reducir drásticamente los costos del censo de árboles mediante el uso de una combinación de imágenes aéreas y de calles. Un sistema automatizado de este tipo podría democratizar el acceso al monitoreo de los bosques urbanos, particularmente para las ciudades desatendidas que ya están desproporcionadamente afectadas por el cambio climático. Si bien ha habido esfuerzos anteriores para desarrollar la detección automatizada de especies de árboles urbanos a partir de imágenes aéreas o callejeras, una limitación importante ha sido la falta de conjuntos de datos etiquetados a gran escala.
Hoy presentamos el conjunto de datos de Auto Arborist, un conjunto de datos de clasificación de árboles urbanos de vista múltiple que es dos órdenes de magnitud más grande que el trabajo anterior en ~ 2.6 millones de árboles y> 320 géneros. Para crear el conjunto de datos, tomamos censos de árboles públicos de 23 ciudades de América del Norte (ver arriba) y fusionamos estos registros con Street View e imágenes RGB aéreas. Como el primer conjunto de datos de bosques urbanos que cubre varias ciudades, analizamos en detalle cómo se pueden generalizar los modelos forestales en términos de cambios de distribución geográfica, lo cual es crucial para construir sistemas escalables. Publicamos los 2,6 millones de registros de árboles junto con fotografías aéreas y terrestres de 1 millón de árboles.
![]() |
Las 23 ciudades en el conjunto de datos se distribuyen en América del Norte y se clasifican en regiones Oeste, Centro y Este para permitir el análisis de la generalización espacial y jerárquica. |
![]() |
El número de registros de árboles y géneros en el registro, por ciudad y por región. La ciudad reservada (que no se ve de ninguna manera durante el entrenamiento) para cada región está en negrita. |
El récord de Auto Arborist
Para seleccionar Auto Arborist, utilizamos censos de árboles existentes que muchas ciudades ofrecen en línea. Para cada censo de árboles considerado, verificamos que los datos contenían ubicaciones de GPS y designaciones de género/especie y estaban disponibles para uso público. Luego, analizamos estos datos en un formato común, arreglamos los errores de entrada de datos comunes (por ejemplo, latitud/longitud intercambiadas) y asignamos los nombres genéricos (y sus errores ortográficos comunes o nombres alternativos) a una taxonomía unificada. Hemos optado por centrarnos en la predicción del género (en lugar de la predicción a nivel de especie) como nuestra tarea principal para evitar la complejidad taxonómica que surge de los híbridos y las subespecies y el hecho de que existe un consenso más universal sobre los nombres de género que sobre los nombres de especies.
Luego, utilizando la geolocalización proporcionada, para cada árbol consultamos una imagen RGB aérea centrada en el árbol y todas las imágenes a nivel de calle tomadas dentro de un radio de 2 a 10 metros. Finalmente, filtramos estas imágenes para (1) maximizar nuestras posibilidades de que el árbol de interés sea visible desde cada imagen y (2) preservar la privacidad del usuario. Este último implicaba una serie de pasos que incluían la eliminación de imágenes que contenían personas, según lo determinado por la segmentación semántica y el desenfoque manual, entre otros.
![]() |
Imágenes de Street View seleccionadas del conjunto de datos de Auto Arborist. Los cuadros verdes representan detecciones de árboles (usando un modelo entrenado en imágenes abiertas) y los puntos azules representan la posición GPS proyectada del árbol etiquetado. |
Uno de los desafíos clave para vigilar los bosques urbanos es hacerlo bien en ciudades que no formaban parte del conjunto de capacitación. Los modelos de visión deben hacer frente a los cambios de distribución en los que la distribución de formación difiere de la distribución de prueba de una nueva ciudad. Las distribuciones genéricas varían geográficamente (por ejemplo, el oeste de Canadá tiene más abetos de Douglas que California) y también pueden variar según el tamaño de la ciudad (LA es mucho más grande que Santa Mónica y contiene muchos más géneros). Otro desafío es la naturaleza fina y de cola larga de los géneros arbóreos, que puede ser difícil de desambiguar incluso para los expertos humanos, ya que muchos géneros son bastante raros.
![]() |
La distribución de cola larga en las categorías Auto Arborist. La mayoría de los ejemplos provienen de unas pocas categorías comunes y muchas categorías tienen muchos menos ejemplos. Caracterizamos cada género como común, común o raro según la cantidad de ejemplos de entrenamiento. Tenga en cuenta que dentro de cada ciudad, los datos de prueba están separados espacialmente de los datos de entrenamiento, por lo que no todos los géneros raros se pueden ver en el conjunto de prueba. |
Finalmente, hay varias formas en que las imágenes de árboles pueden exhibir ruido. Primero, hay variaciones temporales en los árboles de hoja caduca (por ejemplo, cuando las fotos aéreas contienen hojas pero las fotos de la calle están desnudas). Además, los censos públicos de árboles no siempre están actualizados. Por lo tanto, en el tiempo transcurrido desde el censo de árboles, a veces los árboles han muerto (y ya no son visibles). Además, la calidad de los datos de la imagen aérea puede ser deficiente (ausente o oscurecida, por ejemplo, por las nubes).
Nuestro proceso de curación ha intentado minimizar estos problemas al (1) mantener solo imágenes con suficientes píxeles de árbol según lo determinado por un modelo de segmentación semántica, (2) mantener solo imágenes relativamente recientes y (3) mantener solo imágenes donde la posición del árbol era suficiente cerca de la cámara de la calle. También consideramos optimizar los árboles vistos en primavera y verano, pero decidimos que las variaciones estacionales podrían ser una pista útil, por lo que también publicamos la fecha de cada imagen para que la comunidad pueda explorar el impacto de las variaciones estacionales.
punto de referencia y evaluación
Para evaluar el conjunto de datos, desarrollamos un punto de referencia para medir la generalización del dominio y el rendimiento en el extremo largo de la distribución. Generamos divisiones de entrenamiento y prueba en tres niveles. Primero, dividimos dentro de cada ciudad (según la latitud o la longitud) para ver qué tan bien una ciudad se generaliza a sí misma. En segundo lugar, agregamos conjuntos de capacitación a nivel de ciudad en tres regiones, Oeste, Centro y Este, y capturamos una ciudad de cada región. Finalmente, fusionamos los conjuntos de entrenamiento en las tres regiones. Para cada una de estas divisiones, informamos tanto la precisión como el recuerdo promedio de clase para especies comunes, comunes y raras en los conjuntos de prueba retenidos correspondientes.
Usando estas métricas, creamos una línea de base de rendimiento utilizando modelos de convolución modernos estándar (ResNet). Nuestros resultados demuestran los beneficios de un gran conjunto de datos distribuidos geográficamente como Auto Arborist. Primero, vemos que más datos de entrenamiento ayudarán — La capacitación para todo el conjunto de datos es mejor que la capacitación para una región, que es mejor que la capacitación para una sola ciudad.
![]() |
Rendimiento en el conjunto de prueba de cada ciudad cuando se entrena en sí misma, en la región y en el conjunto de entrenamiento completo. |
Segundo, La formación en ciudades similares ayuda (y por lo tanto tener mayor cobertura de ciudades ayuda). Por ejemplo, si te concentras en Seattle, es mejor entrenar en los árboles de Vancouver que en Pittsburgh.
![]() |
Rendimiento de conjuntos cruzados, considera la combinación por pares de conjuntos de trenes y pruebas para cada ciudad. Tenga en cuenta la estructura de bloques diagonales que resalta la estructura regional en el conjunto de datos. |
Tercero, más modalidades de datos y vistas ayuda. Los modelos con mejor rendimiento combinan entradas de múltiples ángulos de Street View y vistas superiores. Sin embargo, todavía hay mucho margen de mejora, y aquí es donde creemos que la comunidad más grande de investigadores puede ayudar.
Únete a nosotros
Con el lanzamiento de Auto Arborist Dataset, avanzamos un paso más hacia el monitoreo asequible de bosques urbanos y permitimos que la comunidad de visión por computadora aborde el monitoreo de bosques urbanos a escala por primera vez. En el futuro, esperamos expandir la cobertura a más ciudades de América del Norte (particularmente el sur de EE. UU. y México) e incluso en todo el mundo. Además, estamos entusiasmados de llevar el conjunto de datos al nivel de especies de grano más fino e investigar un monitoreo más matizado, incluido el monitoreo de la salud y el crecimiento de los árboles a lo largo del tiempo y el examen del impacto de los factores ambientales en los bosques urbanos.
Consulte nuestro documento CVPR 2022 para obtener más detalles. Este conjunto de datos es parte del esfuerzo más amplio de Google para llevar datos de bosques urbanos a las ciudades a través del Environmental Insights Explorer Tree Canopy Lab y está disponible en nuestro repositorio de GitHub. Si representa a una ciudad interesada en ser incluida en el conjunto de datos, envíe un correo electrónico a auto-arborist+managers@googlegroup.com.
Gracias
Agradecemos a nuestros coautores Guanhang Wu, Trevor Edwards, Filip Pavetic, Bo Majewski, Shreyasee Mukherjee, Stanley Chan, John Morgan, Vivek Rathod y Chris Bauer. También agradecemos a Ruth Alcantara, Tanya Birch y Dan Morris de Google AI for Nature and Society, John Quintero, Stafford Marquardt, Xiaoqi Yin, Puneet Lall y Matt Manolides de Google Geo, Karan Gill, Tom Duerig, Abhijit Kundu y David Ross, Vighnesh birodkar, Yiwen Luo y Lily Pagan por Google Research (equipo de Perception) y Pietro Perona por su apoyo. Este trabajo fue apoyado en parte por el Resnick Sustainability Institute y se llevó a cabo mientras Sara Beery era estudiante investigadora en Google.