Un nuevo estudio propone una selección taxonómica automática basada en un conjunto de datos de imágenes fósiles (>415 000 imágenes) y redes neuronales convolucionales profundas

La paleontología es un campo fascinante que nos ayuda a comprender la historia de la vida en la Tierra mediante el estudio de formas de vida antiguas y su evolución. Sin embargo, uno de los principales desafíos en la investigación paleontológica es el proceso de determinación taxonómica que requiere mucho trabajo y tiempo, lo que requiere un amplio conocimiento y experiencia en un grupo taxonómico determinado. Además, los resultados de la identificación a menudo deben ser más consistentes entre investigadores y sociedades.

Las técnicas de aprendizaje profundo han surgido como una solución prometedora para respaldar la identificación taxonómica de fósiles. En este contexto, un equipo de investigación chino publicó recientemente un artículo que explora el potencial del aprendizaje profundo para mejorar la precisión de la identificación de clasificaciones.

La principal contribución de este documento es la generación y validación de un gran y completo conjunto de datos de imágenes fósiles (FID) utilizando rastreadores web y curación manual. El conjunto de datos incluye 415.339 imágenes de 50 grupos diferentes de fósiles, incluidos invertebrados, vertebrados, plantas, microfósiles y trazas de fósiles. Se utilizó una red neuronal convolucional (CNN) para clasificar imágenes de fósiles y se logró una alta precisión de clasificación, lo que demuestra el potencial de FID para la identificación y clasificación automatizadas de fósiles. Los autores también han puesto a disposición del público la FID para uso y desarrollo futuros.

🚀 Echa un vistazo a las herramientas de IA de 100 en el club de herramientas de IA

Este estudio investiga empíricamente el uso del aprendizaje por transferencia con modelos entrenados en ImageNet para identificar y clasificar fósiles en la base de datos de imágenes fósiles (FID). Los autores encontraron que congelar la mitad de las capas de la red como extractores de características y entrenar las capas restantes produjo el mejor rendimiento. El aumento y abandono de datos fueron métodos efectivos para prevenir el sobreajuste, mientras que el decaimiento de la tasa de aprendizaje iterativo y los grandes tamaños de conjuntos de entrenamiento contribuyeron a una convergencia más rápida y una alta precisión. El estudio también examinó el efecto de los datos desequilibrados en el algoritmo y los métodos de muestreo utilizados para el aprendizaje desequilibrado. La calidad del conjunto de datos fue importante para una identificación precisa, ya que los microfósiles funcionaron bien debido a la disponibilidad de imágenes de alta calidad, mientras que algunos fósiles con mala conservación y pocos especímenes funcionaron mal. Los autores también encontraron que la gran diversidad morfológica intraclase de ciertos clados impidió la precisión de la identificación debido a la dificultad de la estructura DCNN para extraer propiedades discriminatorias.

READ Mostrador de noticias | ILLINOIS

La arquitectura Inception-ResNet-v2 logró una precisión promedio de 0,90 en el conjunto de datos de prueba cuando se utilizó el aprendizaje de transferencia. Los microfósiles y los fósiles de vertebrados obtuvieron las puntuaciones de precisión de identificación más altas de 0,95 y 0,90, respectivamente. Sin embargo, formaciones como esponjas, algas y trazas de fósiles, que tenían diferentes formas o pocos especímenes en el conjunto de datos, tenían una precisión de menos de 0,80 para su identificación.

En conclusión, las técnicas de aprendizaje profundo, en particular el aprendizaje transformacional, han mostrado resultados prometedores para mejorar la precisión y la eficiencia de la identificación taxonómica de fósiles. Establecer y validar un conjunto de datos de imágenes fósiles grande y completo, como la base de datos de imágenes fósiles (FID), es fundamental para lograr una alta precisión de identificación. Su disponibilidad para uso público y desarrollo es beneficiosa para el avance del campo de la paleontología. Sin embargo, la precisión de los modelos de aprendizaje profundo depende de la calidad y la diversidad del conjunto de datos, y algunos bloques presentan desafíos debido a su diversidad morfológica intraclase o su mala conservación. Se necesita más investigación y desarrollo de técnicas de aprendizaje profundo y conjuntos de datos de imágenes fósiles a gran escala para superar estos desafíos y mejorar la precisión y la eficiencia de la investigación paleontológica.

Además, las técnicas de aprendizaje profundo en paleontología pueden transformar el campo más allá de la identificación taxonómica. Estas técnicas pueden extraer más información de los datos fósiles, como la fragmentación y reconstrucción de fósiles, la integración de datos fósiles con otros tipos de datos y la detección de patrones y anomalías en conjuntos de datos fósiles a gran escala. Esto amplía nuestra comprensión de la historia de la vida en la Tierra, allanando el camino para descubrimientos y desarrollos emocionantes.

READ Covid-19, una epidemia, nuevas cepas ... la humanidad está en alerta

escanear el papel. Todo el crédito por esta investigación es para los investigadores de este proyecto. Además, no olvides unirte Sub Reddit de 18k+MLY canal de discordiaY Boletín electrónicodonde compartimos las últimas noticias de investigación de IA, interesantes proyectos de IA y más.

🚀 Echa un vistazo a las herramientas de IA de 100 en el club de herramientas de IA

Mahmoud es investigador de doctorado en aprendizaje automático. Él también lleva un
Licenciado en Ciencias Físicas y Máster en
Sistemas y redes de comunicación. sus áreas actuales
La investigación se ocupa de la visión artificial, la previsión del mercado de valores y la
aprender. Produjo muchos artículos académicos sobre la persona re
Determinación y estudio de la estabilidad y robustez en profundidad
redes

🚀 Únete a la comunidad subreddit de ML más rápida

Pili Onate

«Alborotador. Amante de la cerveza. Total aficionado al alcohol. Sutilmente encantador adicto a los zombis. Ninja de twitter de toda la vida».

Un nuevo estudio propone una selección taxonómica automática basada en un conjunto de datos de imágenes fósiles (>415 000 imágenes) y redes neuronales convolucionales profundas

La Vía Láctea sobrevivió a una violenta batalla galáctica contra todo pronóstico científico

La NASA prueba helicópteros supersónicos para futuras misiones en Marte

La NASA descarta el impacto del asteroide 2024 YR4 contra la Luna en 2032

Corridas Generales de Bilbao 2026: ya tienen fechas oficiales para la próxima Aste Nagusia

La Vía Láctea sobrevivió a una violenta batalla galáctica contra todo pronóstico científico

Amazon pone a la venta una casa prefabricada expandible de dos plantas con hasta seis dormitorios por menos de 12.000 euros

La NASA prueba helicópteros supersónicos para futuras misiones en Marte

Entradas recientes

Deja una respuesta Cancelar la respuesta

More Stories

La Vía Láctea sobrevivió a una violenta batalla galáctica contra todo pronóstico científico

La NASA prueba helicópteros supersónicos para futuras misiones en Marte

La NASA descarta el impacto del asteroide 2024 YR4 contra la Luna en 2032

You may have missed

Corridas Generales de Bilbao 2026: ya tienen fechas oficiales para la próxima Aste Nagusia

La Vía Láctea sobrevivió a una violenta batalla galáctica contra todo pronóstico científico

Amazon pone a la venta una casa prefabricada expandible de dos plantas con hasta seis dormitorios por menos de 12.000 euros

La NASA prueba helicópteros supersónicos para futuras misiones en Marte