Cincuenta nuevos planetas confirmados en el aprendizaje de la máquina primero

Cincuenta planetas potenciales han sido confirmados por un nuevo algoritmo de aprendizaje de máquinas desarrollado por científicos de la Universidad de Warwick.

Por primera vez, los astrónomos han utilizado un proceso basado en el aprendizaje automático, una forma de inteligencia artificial, para analizar una muestra de planetas potenciales y determinar cuáles son reales y cuáles son “falsos” o falsos positivos, calculando la probabilidad de que cada candidato sea un planeta verdadero.

Sus resultados se dan a conocer en un nuevo estudio publicado en el Boletín Mensual de la Real Sociedad Astronómica, donde también se realiza la primera comparación a gran escala de tales técnicas de validación de planetas. Sus conclusiones abogan por el uso de múltiples técnicas de validación, incluido su algoritmo de aprendizaje automático, para confirmar estadísticamente futuros descubrimientos de exoplanetas.

Muchos estudios de exoplanetas buscan a través de enormes cantidades de datos de telescopios los signos de los planetas que pasan entre el telescopio y su estrella, lo que se conoce como tránsito. Esto da lugar a una caída reveladora de la luz de la estrella que el telescopio detecta, pero también podría ser causado por un sistema estelar binario, la interferencia de un objeto en el fondo, o incluso ligeros errores en la cámara. Estos falsos positivos pueden ser tamizados en un proceso de validación planetaria.

Investigadores de los departamentos de Física y Computación de Warwick, así como del Instituto Alan Turing, construyeron un algoritmo basado en el aprendizaje por máquina que puede separar los planetas reales de los falsos en las grandes muestras de miles de candidatos encontrados por las misiones de telescopios como el Kepler y el TESS de la NASA.

Fue entrenado para reconocer planetas reales usando dos grandes muestras de planetas confirmados y falsos positivos de la ahora retirada misión Kepler. Los investigadores utilizaron entonces el algoritmo en un conjunto de datos de candidatos planetarios aún no confirmados de Kepler, lo que dio como resultado cincuenta nuevos planetas confirmados y los primeros en ser validados por el aprendizaje automático. Las técnicas anteriores de aprendizaje automático han clasificado a los candidatos, pero nunca determinaron la probabilidad de que un candidato fuera un verdadero planeta por sí mismo, un paso necesario para la validación de los planetas.

Esos cincuenta planetas van desde mundos tan grandes como Neptuno hasta más pequeños que la Tierra, con órbitas tan largas como 200 días y tan poco como un solo día. Al confirmar que estos cincuenta planetas son reales, los astrónomos pueden ahora priorizarlos para futuras observaciones con telescopios dedicados.

El Dr. David Armstrong, del Departamento de Física de la Universidad de Warwick, dijo: “El algoritmo que hemos desarrollado nos permite llevar a 50 candidatos a través del umbral de validación de planetas, actualizándolos a planetas reales. Esperamos aplicar esta técnica a grandes muestras de candidatos de las misiones actuales y futuras como TESS y PLATO.

“En términos de validación de planetas, nadie ha usado una técnica de aprendizaje de máquinas antes. El aprendizaje automático se ha usado para clasificar candidatos planetarios, pero nunca en un marco probabilístico, que es lo que se necesita para validar realmente un planeta. En lugar de decir qué candidatos tienen más probabilidades de ser planetas, ahora podemos decir cuál es la probabilidad estadística precisa. Cuando hay menos de un 1% de probabilidad de que un candidato sea un falso positivo, se considera un planeta validado”.

El Dr. Theo Damoulas del Departamento de Ciencias Informáticas de la Universidad de Warwick, y Director Adjunto de Ingeniería Centrada en Datos y becario de Turing en el Instituto Alan Turing, dijo: “Los enfoques probabilísticos para el aprendizaje de la máquina estadística son especialmente adecuados para un problema tan apasionante como este en la astrofísica que requiere la incorporación de conocimientos previos – de expertos como el Dr. Armstrong – y la cuantificación de la incertidumbre en las predicciones. Un ejemplo perfecto cuando la complejidad computacional adicional de los métodos probabilísticos da resultados significativos”.

Una vez construido y entrenado, el algoritmo es más rápido que las técnicas existentes y puede ser completamente automatizado, lo que lo hace ideal para analizar los potencialmente miles de candidatos planetarios observados en estudios actuales como TESS. Los investigadores sostienen que debería ser una de las herramientas a ser usadas colectivamente para validar los planetas en el futuro.

El Dr. Armstrong añade: “Casi el 30% de los planetas conocidos hasta la fecha han sido validados usando un solo método, y eso no es lo ideal. El desarrollo de nuevos métodos de validación es deseable por esa sola razón. Pero el aprendizaje automático también nos permite hacerlo muy rápidamente y priorizar los candidatos mucho más rápido.

“Todavía tenemos que pasar tiempo entrenando el algoritmo, pero una vez hecho esto se hace mucho más fácil aplicarlo a los futuros candidatos. También puedes incorporar nuevos descubrimientos para mejorarlo progresivamente.

“Se predice que una encuesta como TESS tiene decenas de miles de candidatos planetarios y es ideal para poder analizarlos todos de forma consistente. Sistemas rápidos y automatizados como este que pueden llevarnos hasta planetas validados en menos pasos nos permiten hacerlo de forma eficiente”.