Clasificación del patrón de falla del mapa de obleas mediante transformación geométrica
Scientific Reports volumen 13, Número de artículo: 8127 (2023) Citar este artículo
349 Accesos
1 Altmetric
Detalles de métricas
La clasificación de patrones de defectos del mapa de obleas es esencial en los procesos de fabricación de semiconductores para aumentar el rendimiento y la calidad de la producción al proporcionar información clave sobre la causa raíz. Sin embargo, el diagnóstico manual por parte de expertos de campo es difícil en situaciones de producción a gran escala, y los marcos de aprendizaje profundo existentes requieren una gran cantidad de datos para el aprendizaje. Para abordar esto, proponemos un nuevo método invariable de rotación y volteo basado en la regla de etiquetado de que el patrón de defecto del mapa de obleas no tiene efecto en la rotación y volteo de las etiquetas, logrando un rendimiento discriminante de clase en situaciones de escasez de datos. El método utiliza una columna vertebral de red neuronal convolucional (CNN) con una transformación Radon y cambio de núcleo para lograr la invariancia geométrica. La característica de Radon sirve como un puente de rotación equivalente para las CNN invariantes de traducción, mientras que el módulo de volteo del núcleo permite que el modelo sea invariante de volteo. Validamos nuestro método a través de extensos experimentos cualitativos y cuantitativos. Para el análisis cualitativo, sugerimos una propagación de relevancia por capas de múltiples ramas para explicar adecuadamente la decisión del modelo. Para el análisis cuantitativo, la superioridad del método propuesto se validó con un estudio de ablación. Además, verificamos el rendimiento de generalización del método propuesto para rotar y voltear invariantes para datos fuera de distribución utilizando conjuntos de prueba de rotación y volteo aumentados.
La clasificación de patrones de mapas de contenedores de obleas está ganando atención como un enfoque crítico para aumentar el rendimiento y la calidad en los procesos de fabricación de semiconductores al permitir el análisis de causa raíz (RCA)1,2. Dado que los chips de circuitos integrados (IC), que están compuestos por circuitos electrónicos que permiten funciones deseadas en varios productos eléctricos, disminuyen continuamente de tamaño, su proceso de fabricación se vuelve más sofisticado, lo que hace que la causa de los defectos en el proceso sea más difícil de analizar3. En una etapa posterior del proceso de producción de semiconductores, antes del empaquetado, se llevan a cabo diferentes pruebas eléctricas y térmicas para evaluar si cada chip es normal al nivel de matriz de oblea en binario. Luego, los defectos se muestran chip por chip en la oblea, y esto forma un patrón de defectos. Debido a que este patrón de defectos es el resultado final de todo el procedimiento, es factible analizar la correlación entre el patrón de defectos y el historial y los detalles del proceso, lo que permite la RCA en el proceso. Por lo tanto, la clasificación del patrón de defectos del mapa de obleas es particularmente importante en este campo porque está fuertemente ligada a mejorar la calidad que la industria de los semiconductores busca al mismo tiempo que aumenta el rendimiento de la producción.
Además de la clasificación de defectos basada en patrones, ha habido una creciente demanda de automatización del proceso de clasificación. El proceso de etiquetado del patrón del mapa de obleas es realizado directamente por expertos en el campo, lo que requiere mucha mano de obra y costos, y el rendimiento del diagnóstico varía según los ingenieros. Se han llevado a cabo investigaciones recientes sobre el etiquetado automatizado utilizando el modelo de clasificación de mapas de obleas debido a las capacidades superiores de automatización del modelo de clasificación basado en datos en una variedad de sectores. Los enfoques existentes se pueden clasificar en dos categorías según el mecanismo de inferencia basado en datos: (1) basado en aprendizaje automático y (2) basado en aprendizaje profundo.
Los enfoques basados en el aprendizaje automático para la clasificación de patrones de defectos de obleas utilizan una variedad de modelos de predicción para extraer características discriminatorias de clase basadas en varias características hechas a mano derivadas del mapa de obleas. Yuan et al.4 propusieron la clasificación de patrones de defectos espaciales utilizando el agrupamiento de vectores de soporte y el método bayesiano. Wu et al.5 propusieron un método basado en una máquina de vectores de soporte (SVM) utilizando un conjunto de características invariantes de escala y Radon. Demostró que las características basadas en Radon se pueden utilizar para adquirir una respuesta equivalente a la rotación. Yu y Lu6 propusieron el uso de análisis discriminantes lineales locales y no locales conjuntos para la detección y el reconocimiento de defectos en mapas de obleas en función de múltiples características, incluidas características geométricas y de radón. Saqlain et al.7 propusieron un clasificador de conjunto de votación utilizando varias características, incluidas las características de Radon. Se han examinado activamente varios modelos que emplean características útiles para estos métodos basados en el conocimiento del dominio; sin embargo, existe una limitación en términos del rendimiento de la inferencia debido a la superficialidad de los modelos basados en aprendizaje automático.
A medida que aumenta la profundidad del modelo de inferencia debido al desarrollo de recursos computacionales, los métodos basados en el aprendizaje profundo se han estudiado activamente para la clasificación de patrones de defectos de obleas porque pueden aprender automáticamente características significativas a partir de datos sin la intervención de expertos, lo que permite mejorar el rendimiento de la clasificación de patrones. Este método basado en el aprendizaje profundo sigue dos pasos: primero, el marco de aprendizaje profundo se aplica simplemente al problema del patrón de defectos del mapa de obleas; en segundo lugar, se abordan problemas prácticos, como la escasez de datos y la eficiencia de la memoria. Con respecto a lo primero, las primeras investigaciones adoptaron modelos de redes neuronales de convolución (CNN), que muestran un rendimiento excepcional entre los modelos de aprendizaje profundo en la clasificación de imágenes, para la clasificación de mapas de obleas8,9. Kyeong et al.10 propusieron patrones de defectos de tipo mixto en mapas de contenedores de obleas usando múltiples modelos de CNN. Yu et al.11 propusieron dos etapas para reconocer y clasificar patrones de mapas de obleas. Sin embargo, la obtención de suficientes datos de mapas de obleas con etiquetas limpias y de alta calidad suele ser una limitación durante todo el proceso de fabricación; por lo tanto, se requiere un modelo que incluya enfoques adicionales al modelo tradicional de CNN. Respecto a esto último, varios estudios han propuesto modelos basados en que la etiqueta no se ve afectada por la rotación y el volteo, según la regla de etiquetado predefinida del mapa de obleas. Kang et al.12 propusieron un método de aumento de datos para aprender la representación invariante de rotación y volteo a través del aumento a lo largo de una dirección de ángulo discreta. Kahng et al.13 propusieron el aprendizaje autosupervisado para la representación invariante de pretexto, que incluye la invariancia de rotación en el contexto de aumento de datos. Como resultado, fue posible lograr un alto rendimiento de clasificación en situaciones de datos limitados. Sin embargo, estos métodos propuestos anteriormente tienen una limitación porque no incorporan directamente la rotación y la invariancia de volteo en la arquitectura del modelo, lo que significa que la capacidad del modelo para reconocer estas invariancias no está específicamente integrada en su diseño. En cambio, estos métodos se basan en el aumento de datos y parámetros adicionales, que pueden ser ineficientes e insuficientes para abordar los problemas de eficiencia de la memoria. Esto ya se ha señalado para las CNN de variables rotacionales en el campo de la visión por computadora, como se analiza en "Trabajos relacionados".
En este artículo, proponemos un método novedoso para clasificar los patrones de defectos de las obleas que es invariable a la rotación y el volteo. Teniendo en cuenta las variaciones de orientación en los patrones de defectos de las obleas debido a los procesos y equipos de fabricación, lograr la invariancia de rotación y volteo se vuelve crucial para una clasificación precisa y sólida. Además, al incorporar estas invariancias en el método de clasificación, nuestro enfoque puede extraer de manera eficiente características relevantes de datos limitados, lo que ayuda a mitigar los problemas de escasez de datos. Para lograr la invariancia de rotación y volteo, utilizamos los rasgos equivariantes de las características de Radon, una característica hecha a mano que se usó anteriormente en el aprendizaje automático, dentro del marco de trabajo de CNN. Además, logramos la invariancia de cambio mediante el diseño de núcleos dentro de la red, lo que minimiza la dependencia del aumento de datos. Para validar nuestro modelo, realizamos análisis tanto cualitativos como cuantitativos. Para el análisis cualitativo, presentamos el método de propagación de relevancia por capas de múltiples ramas (LRP de múltiples ramas) para interpretar las decisiones del modelo, diseñado específicamente para modelos con estructuras de múltiples ramas como nuestro módulo kernel flip. Demostramos el impacto individual de la transformación del radón y el giro del núcleo a través de evaluaciones tanto cualitativas como cuantitativas mediante un estudio de ablación. También evaluamos el rendimiento de generalización invisible de nuestro modelo bajo la rotación y el conjunto de datos aumentados.
Las CNN poseen inherentemente una gran capacidad para aprender características invariantes de traducción a través de operaciones de agrupación y reparto de peso traslacional. Sin embargo, lograr otras formas de invariancia espacial, como la rotación y el volteo, sigue siendo una limitación del marco de la CNN. Se han realizado numerosos estudios para abordar estos desafíos mediante (1) el aumento de las características de una imagen de entrada con varias copias transformadas y (2) la codificación de la invariancia de transformación deseada para la CNN utilizando módulos de entrenamiento específicos dentro de la red.
El primero se puede dividir en aumento de datos de entrada y aumento de funciones mediante los filtros internos de la red. En muchos de los primeros estudios, los datos de entrada se aumentaron directamente para diversas aplicaciones. Laptev et al.14 propusieron una capa de agrupación invariable de transformación (agrupación TI) que toma características invariantes de transformación altamente activadas mediante agrupación máxima a la capa completamente conectada, extraída a través de una CNN de peso compartido para cada entrada basada en el conjunto de datos de entrenamiento aumentado rotacionalmente . Cheng et al.15 propusieron un método similar, la CNN de rotación invariable (RICNN), que entrena las CNN existentes mediante el aumento rotativo de las muestras de entrenamiento para la tarea de detección de objetos. Cheng et al.16 propusieron una CNN discriminatoria de pescador y invariante de rotación (RIFD-CNN), que también usa la estrategia de aumento de datos como RICNN pero agrega una capa discriminatoria de pescador. Sin embargo, aumentar directamente los datos de entrada tiene una limitación crítica que fundamentalmente requiere un mayor tamaño de memoria y capacidad de red para obtener una rotación más generalizable. Debido a esto, el aumento de funciones mediante filtros internos de la red ha recibido últimamente una atención considerable en una variedad de métodos. Dieleman et al.17 propusieron la estructura de múltiples ramas de una CNN para extraer diferentes puntos de vista para cada imagen aumentada. Luego, Dieleman18 amplió este concepto realizando varias operaciones sobre simetrías cíclicas. Cohen et al.19 propusieron una CNN de grupo equivalente basada en la teoría de grupos, utilizando un grupo de simetría y una operación de agrupación en el grupo. Marcos et al.20 sugirieron incorporar explícitamente el método de invariancia de rotación en el modelo asociando los pesos de grupos de filtros con varias copias rotadas del filtro canónico del grupo. Gao et al.21 propusieron un conjunto de métodos de rotación y volteo del núcleo para lograr la invariancia de rotación y volteo en una CNN. En resumen, el método de aumento de características sigue la estructura de muestreo de múltiples ramas para la variación de datos dentro de la red, y la principal limitación de esto es la relación de compensación entre la generalización de la variación de datos y el número de ramas.
El segundo trabajo es la utilización de ciertos módulos entrenables dentro de una CNN para codificar la invariancia de transformación requerida para la CNN. Worrall et al.22 propusieron redes armónicas que logran la invariancia de rotación al reemplazar los filtros CNN regulares con armónicos circulares, devolviendo así una respuesta y orientación máximas. Jaderberg et al.23 propusieron la red de transformador espacial (STN), que utiliza módulos de aprendizaje, lo que permite explícitamente la manipulación espacial de los datos de entrada para reducir las variaciones de pose en las capas posteriores dentro de la red. Esteves et al.24 sugirieron una red de transformadores polares (PTN), que es una versión extendida de STN que combina representaciones de coordenadas canónicas. Dai et al.25 propusieron una CNN deformable con convolución deformable y agrupación de RoI basada en la idea de aumentar las ubicaciones de muestreo espacial en los módulos. Estos trabajos tienen limitaciones en el sentido de que no solo requieren parámetros entrenables adicionales para módulos adicionales, sino que también requieren una estructura compleja para adaptarse a una CNN.
En este estudio, proponemos una rotación novedosa y un enfoque de CNN invariante para clasificar los patrones de defectos del mapa de obleas, teniendo en cuenta el desafío de la escasez de datos. Para lograr esto, sugerimos incorporar funciones artesanales en un marco de aprendizaje profundo. Específicamente, utilizamos la propiedad de rotación equivalente de la característica Radon, una característica artesanal comúnmente utilizada en el contexto de aprendizaje automático anterior para la tarea de clasificación de obleas, para obtener la invariancia de rotación en el marco CNN. Además, logramos la invariancia de cambio mediante la introducción de un módulo de cambio de kernel con solo una estructura de dos ramas, que aprende la variación de datos de las copias volteadas producidas por cada rama. Vale la pena señalar que nuestro método logra la invariancia de volteo en todas las direcciones asegurándola en combinación con la invariancia de rotación, utilizando la característica de rotación equivalente y ramas mínimas del núcleo volcado. Este enfoque permite representaciones más compactas y eficientes, lo que puede generar un mejor rendimiento y tiempos de entrenamiento reducidos en comparación con los métodos basados en el aumento de datos.
Para facilitar la comprensión del enunciado del problema, es esencial comprender primero los conceptos de equivarianza e invariancia. Dada una función de mapeo \(\Phi\), una entrada \(X\) de un conjunto de entradas {\({X}_{i}\)}, y un grupo \(G\), llamamos \( \Phi\) equivalente bajo \({T}_{1}\in G\) si la transformación de la entrada está relacionada con una transformación \({T}_{2}\in G\) de la salida, como indicado en la Ec. (1). Por el contrario, \(\Phi\) es invariante bajo \(T\) si es independiente de la relación de transformación en el dominio de salida, como se expresa en la ecuación. (2).
Para explicar claramente el mecanismo propuesto para obtener rotación e invariancia de cambio, formulamos el principio del enfoque propuesto que incluye la transformada de Radon, el cambio de núcleo y el módulo de red troncal CNN. Los datos de la imagen del patrón de defecto de la oblea y su conjunto de etiquetas existen como \(\left({X}_{i}, {y}_{i}\right)\), las transformaciones geométricas se indican como traducción: \({T} _{T}\) rotación: \({T}_{R}\) , flip: \({T}_{F}\), y cada grupo de cada transformación se denota como \({G}_{ T}, {G}_{R},\) y \({G}_{F}\). La función de regla de etiquetado \(({\Phi }_{label}\)) se da de acuerdo con la ecuación. (3) cuando \(T={T}_{R}\cdot {T}_{F}={T}_{F}{\cdot T}_{R}\) en \({G}_ {R}\cup {G}_{F}\), donde \({T}_{R}\cdot {T}_{F}\) representa la composición de funciones de \({T}_{R}\ ) y \({T}_{F}\), y nuestro objetivo es construir un modelo que se aproxime a esta función:
El modelo CNN (\({\Phi }_{CNN})\) que usamos para la inferencia de etiquetas tiene la capacidad inherente de aprender características invariantes de traducción, exhibiendo las siguientes características:
Sin embargo, el modelo CNN no es invariante en rotación:
Para proporcionar algo de contexto para la ecuación. (5), sea \({T}_{R}\cdot {X}_{i}\) la aplicación de la transformación de rotación \({T}_{R}\) a la entrada \({X }_{i}\). Con este entendimiento, ahora podemos explicar que nuestro modelo usa la función de mapeo de rotación equivalente Radon transform \(({\Phi }_{Radon})\) como un paso intermedio para abordar la falta de invariancia de rotación en el modelo CNN.
Como resultado, tenemos:
Para nuestro modelo propuesto, nuestro objetivo es lograr tanto la rotación como la invariancia de volteo. Para abordar la falta de invariancia de cambio, incorporamos el módulo kernel flip (KF) en la arquitectura CNN:
La simetría de volteo del mapa de obleas se conserva aquí al cambiar el eje de volteo por \(\uppi\)/2 para tener en cuenta el efecto de característica de Radon:
Al combinar las transformaciones de rotación y volteo, nuestro modelo puede dar cuenta inherentemente de todas las posibles orientaciones de volteo. De acuerdo con la teoría de grupos26, la unión de los grupos de rotación y volteo sigue siendo la misma independientemente de la orientación del eje de volteo:
Como resultado, nuestro modelo puede extraer de manera efectiva la invariancia de rotación y volteo, teniendo en cuenta todas las transformaciones de rotación y volteo posibles, mientras emplea la cantidad mínima de ramas de kernel volteadas. Nuestro método propuesto se describe en detalle en la siguiente sección.
El método de aprendizaje de representación invariante de rotación y volteo propuesto comprende dos módulos principales y una red troncal CNN, como se ilustra en la Fig. 1. Inicialmente, el módulo invariante de rotación de Radon transforma mapas de obleas en imágenes tomográficas, convirtiendo la rotación en traslación. Posteriormente, se obtiene un conjunto de características volteadas a través de dos ramas de operaciones de volteo del kernel. Al emplear la operación máxima en las funciones altamente activadas entre el par de conjuntos de funciones invertidas, la red troncal CNN, a menudo denominada traducción invariable debido a su capacidad de adquirir funciones invariantes de traducción, aprende una representación discriminatoria que captura la características de la etiqueta de la oblea a través de funciones equivalentes de rotación y equivalentes de volteo.
Resumen de nuestro método. Arriba: la arquitectura del modelo propuesto comprende una transformación de Radon y un módulo de cambio de núcleo para adquirir características equivalentes de rotación y cambio, seguido de un clasificador basado en CNN de columna vertebral invariante de traducción. Inferior: el método LRP de múltiples ramas para la estructura de múltiples ramas inducida por cambio de kernel, que se utiliza para interpretar las predicciones del modelo. Las imágenes del mapa de obleas y del mapa de calor se visualizaron utilizando Python 3.8.4 y el conjunto de datos de obleas WM-811K publicado, disponible en http://mirlab.org/dataSet/public/. Las transformadas de radón y de radón inversa se realizaron con la biblioteca de imágenes de scikit versión 0.20.0, mientras que el mapa de calor LRP se obtuvo utilizando nuestro método LRP de múltiples ramas propuesto.
Nuestro método propuesto adopta la función Radon como representación de entrada debido a su característica de rotación equivalente con respecto al mapa de obleas. La transformación de radón es un método para adquirir tomografía sinusoidal \({P}_{\theta }\left(r\right)\) mediante proyección de imagen para rotación \(\theta\). La transformada de Radon es una proyección hacia adelante para obtener tomografías \({P}_{\theta }\left(r\right)\). Cuando f(x,y) es una imagen original, la función de transformada de Radon se da como,
La proyección anterior convierte el impacto de rotación de la imagen original en una traslación de la función Radon. Al comparar las primeras filas de la Fig. 2a, b, podemos reconocer que la rotación del mapa de obleas original corresponde a la traslación de la función Radon. Como resultado, la transformada de Radon funciona como un puente equivalente a la rotación, lo que permite el uso de un modelo de red troncal CNN invariable en la traducción para obtener una representación invariable en la rotación. Además, al comparar las segundas filas de la Fig. 2a, b, podemos ver que el giro vertical en el mapa de obleas corresponde a un giro horizontal en la característica Radon. Esto implica que la equivalencia de volteo de la función Radon está inherentemente garantizada para ser la equivalencia de volteo para el mapa de obleas, considerando el cambio \(\uppi /2\) en el eje de volteo.
(a) Ilustración de ejemplos de rotación y volteo para los mapas de obleas de clase Edge-loc de WM-811k y (b) las transformadas de Radon correspondientes para cada mapa de obleas. Todas las imágenes de esta figura se visualizaron con Python 3.8.4. Las transformaciones de Radon se realizaron utilizando la biblioteca de imágenes scikit versión 0.20.0.
Los módulos de volteo de kernel tienen como objetivo aprender la equivalencia de volteo a través de copias volteadas generadas de características de entrada con múltiples versiones volteadas de kernels. Para nuestro método propuesto, usamos solo dos ramas de núcleos invertidos: el original y el invertido de un solo eje. Cuando la característica Radon procesada, después de pasar por varias capas, se ingresa en este módulo, los núcleos invertidos de peso compartido generan un conjunto de características invertidas sin aumentar la cantidad de parámetros entrenables, lo que garantiza la eficiencia del modelo. Al aprender esta variación de volteo en características basadas en Radon, nuestro modelo es capaz de adquirir propiedades equivalentes de volteo además de la equivarianza de rotación. Como consideración principal para nuestra estrecha estructura de sucursales, como se describe en "Trabajos relacionados", existe una compensación entre el rendimiento de generalización y el número de sucursales; por lo tanto, la única rama única adicional puede conducir a un rendimiento débil de flip-equivariant. Sin embargo, como se describe en "Formulación del problema", la obtención de la equivalencia de giro en una representación de rotación equivalente corresponde a todas las direcciones de la equivalencia de giro. Después de generar un conjunto de funciones invertidas, el módulo de salida máxima toma las funciones más activas elemento por elemento para pasar al módulo clasificador CNN mientras apunta a un flujo de memoria eficiente dentro de la red y el efecto de abandono. Finalmente, las características equivalentes de rotación y volteo obtenidas de los módulos Radon y kernel flip hacen posible aprender la invariancia de rotación y volteo con el clasificador CNN.
En este estudio, adoptamos el LRP para evaluar nuestro método de manera cualitativa, no solo para reconocer el efecto en la inferencia basada en la función Radon de acuerdo con la predicción original basada en el mapa de obleas, sino también para verificar que nuestro modelo propuesto funciona según lo previsto. . El LRP se utiliza principalmente para comprender la inferencia del modelo mediante un enfoque basado en la interpretabilidad de los modelos basados en el aprendizaje profundo. Basado en el método de descomposición profunda de Taylor descrito por la ecuación. (13), la puntuación de relevancia se puede obtener mediante la predicción de salida, donde a es un punto raíz de la serie de Taylor y \(\epsilon\) es un término sustituido por los términos polinómicos de orden superior de la serie de Taylor. Al repetir secuencialmente la propagación de relevancia a las capas anteriores, finalmente se pueden obtener las puntuaciones de relevancia de la capa de entrada.
Para aplicar esta técnica a nuestro modelo, hay una consideración estructural de que es difícil propagar la puntuación de relevancia tal cual porque nuestro modelo es un modelo de múltiples ramas. Hasta donde sabemos, el método LRP no se ha utilizado antes en una estructura complicada como una CNN de varias sucursales. En este documento, proponemos un método LRP novedoso para la estructura de múltiples ramas, como se muestra en la figura 1. Cuando la puntuación de relevancia llega a los módulos de cambio de núcleo, se generan dos puntuaciones de relevancia después de pasar cada núcleo. La propagación de la puntuación de relevancia separada proporciona múltiples puntuaciones de relevancia que no están relacionadas con los motivos de juicio del modelo en la capa de entrada. Para resolver este problema estructural, concatenamos ambas puntuaciones de relevancia y ambos núcleos por eje de canal. Luego, propagamos la relevancia a través de la característica de relevancia concatenada y el kernel para generar una puntuación de relevancia combinada.
En general, los patrones de mapas de obleas se clasifican en siete clases en función de su posición y forma de grupo, que tiene condiciones y efectos de proceso específicos27: centro, dona, ubicación en el borde, anillo, ubicación, rayado y aleatorio. Por ejemplo, el tipo central tiene el efecto de problemas en el área de plasma28 o la deposición de película delgada, y el tipo edge-loc tiene el mismo efecto que el calentamiento desigual durante el proceso de difusión. Por lo tanto, se ha considerado una tarea importante clasificarlos y determinar el estado del proceso para poder estimar la causa del deterioro del proceso. Las tareas existentes de clasificación de obleas basadas en el aprendizaje automático se han investigado principalmente en dos escenarios: datos fab individuales y datos abiertos27, cada uno con ventajas y desventajas. El uso de datos privados es ventajoso para optimizar el problema en cuestión, pero las generalizaciones metodológicas son difíciles. Sin embargo, los datos disponibles públicamente son más fáciles de comparar con otros métodos, lo que implica que se podría reclamar la generalización del método; por lo tanto, es preferible utilizarlo para la verificación.
Los datos de fábrica del mundo real WM-811K se han utilizado con frecuencia en tareas de clasificación de obleas a través de máquinas y aprendizaje profundo29. Para la representación de datos, cada mapa de obleas se forma como una imagen 2D de diferentes tamaños. Como se muestra en la Fig. 3, WM-811K contiene un total de nueve clases, incluidas las siete clases mencionadas y clases adicionales casi llenas y ninguna, con una cantidad total de 172,950. Entre ellos, hay 25.519 datos etiquetados, que es solo aproximadamente el 14,8% de los datos. Además, como se muestra en la Tabla 1, tiene una distribución de datos muy desequilibrada, es decir, la clase casi completa representa solo el 0,1%. El procesamiento de datos apropiado para la evaluación se aborda en "Configuración experimental".
Se utilizaron patrones de obleas de WM-811K para este estudio. Se excluyen los patrones casi completo y ninguno, como se describe en "Configuración experimental".
Para evaluar la efectividad de nuestro método propuesto, utilizamos las siete clases típicas de WM-811K como se indica en la Fig. 3, con distribuciones de datos equilibradas para cada clase. Las investigaciones anteriores sobre la clasificación de patrones de mapas de obleas utilizando WM-811K se pueden clasificar en dos categorías. El primer caso usa nueve clases, mientras que el segundo solo toma siete u ocho clases, dependiendo de si contiene clases nulas o casi completas. Mohamed et al.30 destacaron los efectos negativos del uso de la clase none, ya que puede afectar tanto al entrenamiento del modelo como al análisis del rendimiento por varias razones. Por lo tanto, seguimos el último enfoque tomando siete clases excluyendo las clases 'Casi llena' y 'Ninguna' para enfocarnos en abordar la escasez de datos, además del problema del desequilibrio de datos. Luego, submuestreamos conjuntos de datos de entrenamiento y prueba para las siete clases con un conjunto de datos pequeño que oscila entre 100 y 6400 con un tamaño de datos equilibrado para cada clase. Para preprocesar los datos, primero cambiamos el tamaño del mapa de obleas a (64, 64) y eliminamos el fondo del mapa de obleas, conservando solo los puntos defectuosos debido a los diferentes tamaños de mapas de obleas, lo que puede generar formas ligeramente diferentes en los lados después de cambiar el tamaño. afectando así negativamente el entrenamiento del modelo.
Para evaluar comparativamente el modelo propuesto mediante un estudio de ablación, establecimos cuatro modelos comparativos. El primero, un modelo de línea base, utilizó el mapa de oblea como entrada a la red de línea base, como se detalla en la Tabla 2. El segundo modelo, el modelo Radon, tomó la transformación de Radon antes de ingresar el mapa de oblea en la misma red de línea base. El tercer modelo, el modelo de cambio de kernel, tenía un módulo de cambio de kernel de dos ramificaciones dentro de la red de referencia y usaba el mapa de obleas como entrada. Por último, el modelo propuesto incorporó tanto la transformación Radon como el módulo kernel flip en el modelo de línea de base que también se detalla en la Tabla 2.
En los experimentos, la tasa de aprendizaje inicial se fijó en 0,0003 y se utilizó el optimizador de Adam para actualizar los pesos del modelo. El decaimiento de la tasa de aprendizaje se utilizó para cada época con una tasa de decaimiento de 0,99. Los pasos de entrenamiento se detuvieron temprano cuando la pérdida de validación no disminuyó durante 30 épocas para evitar el sobreajuste. La función de pérdida utilizada fue Cross Entropy Loss, la cual es adecuada para tareas de clasificación. Cada experimento se repitió 20 veces utilizando diferentes semillas aleatorias. Los resultados se informan como el promedio y la desviación estándar de todas las mediciones repetidas.
Para evaluar el rendimiento de nuestro método propuesto, realizamos análisis cuantitativos y cualitativos. En primer lugar, realizamos un análisis cualitativo utilizando el método LRP para verificar la idoneidad de nuestro método propuesto. Específicamente, examinamos visualmente los mapas de calor de LRP para analizar cómo el modelo se enfoca en diferentes partes del mapa de obleas para tomar decisiones. Además, verificamos el efecto de rotar y voltear el mapa de obleas original en la inferencia del modelo propuesto evaluando cómo estas transformaciones afectan la atención del modelo al mapa de obleas. A lo largo de estos experimentos, comparamos el rendimiento cualitativo de los métodos de referencia y propuestos. Como el mapa de calor de LRP para el método propuesto se basa en las características de Radon, la comparación directa con la línea de base fue difícil. Por lo tanto, aplicamos una transformada inversa de Radon a las puntuaciones de relevancia obtenidas de la inferencia basada en características de Radon, usando el teorema del segmento de proyección para verificar la consistencia entre el mapa de obleas original y la inferencia basada en características de Radon. Esto nos permitió comparar el método propuesto con la línea de base.
En segundo lugar, realizamos un análisis cuantitativo para evaluar el desempeño del modelo propuesto. Inicialmente, realizamos un estudio de ablación para verificar la validez del método propuesto mediante el análisis del efecto de cada módulo en el rendimiento general tanto de la clase completa como de las subclases. Además, evaluamos el impacto de la rotación y el giro en el rendimiento del modelo propuesto para cada clase utilizando la matriz de confusión. El grado de variación para la rotación y el volteo difiere según el patrón del mapa de oblea, con algunas clases que exhiben una variación insignificante mientras que otras muestran una amplia variación. Por ejemplo, las clases central y de dona contienen puntos uniformemente defectuosos en todas las direcciones, lo que da como resultado una variación insignificante para la rotación y el volteo, mientras que la clase scratch tiene una amplia variación para el volteo y la rotación, ya que existe en forma de línea curva o recta, independientemente de la dirección y la rotación. ubicación.
Por último, para validar el rendimiento de generalización de nuestro modelo, realizamos una comparación exhaustiva del rendimiento del modelo propuesto y modelos comparativos en el conjunto de prueba original y un conjunto de prueba aumentado no visto (fuera de distribución). Específicamente, evaluamos la capacidad de los modelos para generalizar distribuciones invisibles para transformaciones de rotación y volteo. Si bien el conjunto de prueba original puede considerarse invisible ya que no se usó en el entrenamiento, todavía estaba limitado a la distribución dentro del conjunto de datos original. Para evaluar la solidez del modelo propuesto a la generalización, generamos un conjunto de datos rotando y volteando directamente el conjunto de prueba para extenderlo más allá de la distribución del conjunto de datos original. El conjunto de prueba con rotación aumentada incluía conjuntos de prueba con rotación aumentada de 90°, 180° y 270°, mientras que el conjunto de prueba con rotación aumentada incluía conjuntos de prueba con rotación horizontal y vertical. Luego integramos los dos métodos de aumento para rotación y volteo. Es importante tener en cuenta que el conjunto de prueba aumentado no incluía el conjunto de prueba original. Esta comparación nos permitió confirmar la validez de la arquitectura del modelo propuesto y verificar su robustez ante situaciones no vistas.
Para comenzar, confirmamos cómo se toma la decisión del modelo para la clasificación de etiquetas con los mapas de calor LRP obtenidos. La Figura 4 compara el modelo de referencia para cada clase con la puntuación de relevancia del modelo propuesto. Al examinar la segunda columna, está claro que el modelo de referencia se ocupa principalmente del patrón visual representado en el mapa de obleas. Mientras tanto, debido a la dificultad de interpretar directamente la decisión del modelo de Radon, se comparó utilizando la relevancia transformada por transformada inversa de Radon, como se muestra en la quinta columna. Como resultado, se determinó que el modelo propuesto también corresponde al patrón de defectos en el mapa de obleas. Este es un hallazgo importante porque demuestra que la información de la forma contenida en el mapa de obleas se conserva incluso cuando el modelo se evalúa únicamente en función de la función de radón. Además, al comparar los resultados de la predicción, es evidente que el modelo propuesto se enfoca exclusivamente en la ubicación del defecto primario, lo que explica el mayor rendimiento de clasificación. En particular, los resultados muestran que para clases como C3 y C7, el modelo propuesto presta más atención a la ubicación de patrones claros en comparación con la línea de base. Esta observación es consistente con el hecho de que C3, C5 y C7 tienen una amplia gama de variaciones en las transformaciones de rotación y volteo, lo que dificulta que el modelo de referencia aprenda características discriminatorias de clase. Por el contrario, el modelo propuesto muestra un aprendizaje sólido con respecto a las transformaciones de rotación y volteo, lo que podría ser la razón detrás de la mejora del rendimiento observada. Este hallazgo proporciona evidencia de que el método propuesto es efectivo para aprender características más sólidas y discriminativas en presencia de diversas transformaciones de imágenes, lo que puede ser especialmente útil para escenarios desafiantes del mundo real.
Análisis de mapa de calor de relevancia por capas de la línea de base y los métodos propuestos para todas las clases, con modelos entrenados en un conjunto de trenes de muestras de tamaño 6400. Las columnas primera y tercera corresponden a la entrada para los modelos de referencia y propuestos, respectivamente. Las columnas segunda y cuarta representan los resultados de interpretación de LRP para las decisiones del modelo. La quinta columna muestra los resultados de la transformada inversa de radón de los resultados LRP del método propuesto, que se representan para que coincidan con la forma del mapa de obleas original. Todas las imágenes de esta figura se visualizaron con Python 3.8.4. Las transformadas de radón y de radón inversa se realizaron con la biblioteca de imágenes de scikit versión 0.20.0, mientras que el mapa de calor LRP se obtuvo utilizando nuestro método LRP de múltiples ramas propuesto.
La Figura 5 compara los puntajes de relevancia de los modelos de referencia y propuestos al rotar y voltear el conjunto de prueba mediante el método LRP de múltiples ramas. Las filas 1 a 4 del mapa de obleas y la función de radón muestran que la rotación del mapa de obleas actúa como una traslación de la función de radón, y las filas 5 a 8 demuestran que el giro vertical del mapa de obleas actúa como un giro horizontal de la función de radón. Con base en el mapa de calor LRP obtenido por el modelo propuesto, la región activada se traduce horizontalmente para el mapa de obleas rotado y de manera similar para el mapa de obleas volteado verticalmente. Además, al realizar una transformación Radon inversa en el mapa de calor del modelo propuesto, se confirmó que la puntuación de relevancia indica el patrón de defectos del mapa de obleas original. Como resultado, el método de volteo de kernel basado en la transformada de Radon del modelo propuesto contribuye significativamente a obtener la invariancia de rotación y volteo para la clasificación de patrones de obleas.
Análisis de mapa de calor de relevancia por capas de la línea de base y métodos propuestos para mapas de obleas de prueba girados o invertidos, con modelos entrenados en un conjunto de trenes de muestras de tamaño 6400. Las columnas primera y tercera corresponden a la entrada para los modelos de referencia y propuestos, respectivamente. Las columnas segunda y cuarta representan los resultados de interpretación de LRP para las decisiones del modelo. La quinta columna muestra los resultados de la transformada inversa de radón de los resultados LRP del método propuesto, que se representan para que coincidan con la forma del mapa de obleas original. Todas las imágenes de esta figura se visualizaron con Python 3.8.4. Las transformadas de radón y de radón inversa se realizaron con la biblioteca de imágenes de scikit versión 0.20.0, mientras que el mapa de calor LRP se obtuvo utilizando nuestro método LRP de múltiples ramas propuesto.
Otro punto notable es que siempre que el mapa de obleas original se gira y se voltea, la puntuación de relevancia del modelo de referencia presta atención a varias posiciones diferentes, pero el modelo propuesto se centra más en los puntos defectuosos del mapa de obleas original. Esto indica que el modelo propuesto tiene un rendimiento de clasificación de alta robustez para la rotación de la oblea de entrada y las variaciones de giro, que también es la razón por la que muestra un rendimiento de clasificación mejorado para los conjuntos de prueba originales y aumentados, como se explica más adelante en "Análisis cuantitativo".
La Figura 6a y la Tabla 3 presentan una comparación de la precisión de la clasificación de los modelos comparativos para varias configuraciones de conjuntos de trenes. Los modelos Radon y Kernel Flip, así como el modelo propuesto, exhiben una mayor precisión de clasificación que el modelo de referencia. En particular, el modelo de Radon funciona mejor que el modelo de giro del núcleo, lo que indica que los patrones del mapa de obleas exhiben más variación para la rotación que para el giro. De todos los métodos, el modelo propuesto logra el mayor rendimiento, lo que indica que la invariancia está asegurada tanto para la rotación como para el volteo.
(a) Comparación de la precisión de clasificación entre modelos comparativos para varios tamaños de conjuntos de trenes, (b) brecha de precisión para cada clase entre los métodos de referencia y propuestos, (c) matriz de confusión del modelo de referencia, y (d) matriz de confusión de la propuesta modelo para un juego de tren de tamaño 6400.
La Figura 6b–d presenta una comparación de los modelos de referencia y propuestos en términos de precisión de clase. La Figura 6b muestra la diferencia entre la precisión de clase, que es un elemento diagonal de la matriz de confusión (Fig. 6c, d). La Figura 6b indica que el modelo propuesto tiene una mayor precisión para todas las clases que el modelo de referencia. En particular, C3 (borde-loc), C5 (loc), C6 (aleatorio) y C7 (scratch) aumentan significativamente entre todas las clases. Esta tendencia se corresponde con el hecho de que esta clase tiene considerablemente más rotación y variación de volteo que las otras clases. Por lo tanto, se puede confirmar que la alta precisión del modelo propuesto se deriva de la invariancia de rotación y volteo.
La Tabla 4 compara la precisión de clasificación de los modelos comparativos para conjuntos de pruebas aumentados. En las filas 1 y 2, los modelos de volteo de núcleo y de línea de base se evalúan bajo el conjunto de prueba de volteo aumentado. En las filas 3 y 4, los modelos de referencia y Radon se evalúan con el conjunto de pruebas de rotación aumentada. En las filas 5 y 6, los modelos de línea de base y propuestos se evalúan bajo el conjunto de prueba de rotación y volteo aumentado. Para todos los casos, los modelos comparativos obtienen una mayor precisión que el modelo de referencia. Esto significa que el modelo propuesto y sus modelos de ablación funcionan como rotación o volteo invariante a la situación aumentada invisible para rotación o volteo.
La Figura 7 muestra la precisión de clasificación de los modelos comparativos para las situaciones aumentadas originales y no vistas en un conjunto de trenes de tamaño 6400. La Figura 7a muestra el resultado de la evaluación para el conjunto de prueba original y el conjunto de prueba de volteo aumentado de los modelos de volteo de referencia y kernel, Fig. La figura 7b muestra el resultado de la evaluación para el conjunto de pruebas de rotación aumentada de los modelos de base y de Radon, y la figura 7c muestra el resultado de la evaluación para el conjunto de pruebas de rotación y volteo aumentado de los modelos de línea de base y propuestos. Como se ilustra en la Fig. 7, los modelos Radon, Kernel Flip y propuesto logran una mayor precisión con respecto al modelo de referencia en cada conjunto de pruebas aumentado. Sin embargo, en los tres casos, las precisiones disminuyen ligeramente entre dos situaciones. Cabe señalar que la brecha de reducción entre los modelos de referencia es mayor que la de otros modelos comparativos. Esto puede interpretarse como que el modelo propuesto tiene una mayor resistencia a la degradación del rendimiento en el rendimiento de generalización en situaciones aumentadas no vistas.
Precisión de los modelos comparativos para los conjuntos de prueba originales y aumentados en un conjunto de trenes de tamaño 6400. (a) Comparación de los modelos de referencia y kernel flip en el conjunto de prueba aumentado girado, (b) comparación de los modelos de referencia y Radon en el conjunto de prueba aumentado girado, y (c) los modelos propuestos y de referencia comparados en un conjunto de pruebas aumentado rotado y volteado.
La Figura 8 compara los rendimientos de generalización para cada clase entre los modelos propuesto y de referencia en un conjunto de trenes de tamaño 6400. La Figura 8a muestra la diferencia en la precisión de clase de los modelos de referencia presentados en la Figura 8b (el conjunto de prueba original) y la Figura 8. 8c (el conjunto de prueba aumentado girado y volteado). La figura 8d muestra la diferencia en la diferencia de precisión de clase entre la figura 8e (el conjunto de prueba original) y la figura 8f (el conjunto de prueba aumentado rotado e invertido) para el modelo propuesto. La figura 8g muestra la diferencia entre la figura 8d y la figura 8a, lo que demuestra que el modelo propuesto tiene una mejor generalización que el modelo de referencia para cada clase. En la Fig. 8d, podemos ver que el modelo propuesto tiene una mayor resistencia a la degradación del rendimiento en términos de generalización para un conjunto de datos aumentado invisible para todas las clases, mientras que las clases C3 (edge-loc), C5 (loc) y C7 (rasguño) muestran un aumento significativo. Este extraordinario rendimiento de generalización para las clases sensibles a rotación y volteo demuestra que el modelo propuesto preserva efectivamente la invariancia de rotación y volteo. Además, esta tendencia está de acuerdo con los hallazgos del conjunto de prueba original discutido en "Comparación de rendimiento de clasificación".
(a) Brecha de precisión de clase entre el (b) conjunto de prueba original y (c) el conjunto de prueba aumentado rotado e invertido para el modelo de referencia en un conjunto de trenes de tamaño 6400. (d) Brecha de precisión de clase entre el (e) conjunto de prueba original y (f) conjunto de prueba aumentado rotado e invertido para el modelo propuesto en un conjunto de trenes de tamaño 6400. (g) Diferencia entre (d) y (a), que indica un mayor rendimiento de generalización por el modelo propuesto en comparación con el modelo de referencia para cada clase.
En este artículo, presentamos un método novedoso para lograr la rotación y la invariancia de volteo en la clasificación de patrones de defectos del mapa de obleas, utilizando una combinación de técnicas de volteo de kernel y transformada de Radon. La función Radon garantiza la invariancia de la rotación al transformar la rotación original del mapa de obleas en traducción, mientras que el enfoque de volteo del kernel brinda invariancia de volteo. Nuestro método propuesto emplea una estructura de red eficiente con un número mínimo de ramas de kernel invertidas mediante la combinación adecuada de estos dos módulos. Validamos nuestro modelo ampliamente utilizando el conjunto de datos WM-811K con evaluaciones tanto cualitativas como cuantitativas. La interpretabilidad de nuestro modelo propuesto se demuestra mediante la verificación de sus decisiones utilizando el método LRP de múltiples ramas recientemente sugerido. El modelo propuesto logra un alto rendimiento de detección, incluso en situaciones de datos limitados, al garantizar con éxito la invariancia de rotación y volteo. Además, evaluamos el rendimiento de generalización del método propuesto con respecto a las invariantes de rotación y volteo en datos fuera de distribución mediante el uso de conjuntos de pruebas aumentadas de rotación y volteo. Nuestro estudio proporciona un modelo eficiente de aprendizaje profundo de extremo a extremo que refleja adecuadamente las características del etiquetado de obleas y puede servir como referencia adecuada para el diagnóstico de obleas en el futuro.
Los conjuntos de datos generados y/o analizados durante el presente estudio están disponibles en el repositorio MIR Corpora (en línea: http://mirlab.org/dataSet/public/).
Tong, L.-I., Wang, C.-H. y Huang, C.-L. Supervisión de defectos en la fabricación de circuitos integrados mediante un gráfico de control/T/sup 2 de Hotelling. Trans. IEEE. Semisegundo. Fabricación 18, 140–147 (2005).
Artículo Google Académico
Kim, B., Jeong, Y.-S., Tong, SH, Chang, I.-K. y Jeong, M.-K. Prueba de aleatoriedad espacial reductora para detectar anomalías en obleas DRAM con múltiples mapas espaciales. Trans. IEEE. Semisegundo. Fabricación 29, 57–65 (2015).
Artículo Google Académico
Kameyama, K., Kosugi, Y., Okahashi, T. e Izumita, M. Clasificación automática de defectos en la inspección visual de semiconductores mediante redes neuronales. IECE Trans. información sist. 81, 1261-1271 (1998).
Google Académico
Yuan, T., Bae, SJ & Park, JI Reconocimiento de patrones de defectos espaciales bayesianos en la fabricación de semiconductores mediante agrupamiento de vectores de soporte. En t. j adv. Fabricación Tecnología 51, 671–683 (2010).
Artículo Google Académico
Wu, M.-J., Jang, J.-SR y Chen, J.-L. Reconocimiento de patrones de fallas en mapas de obleas y clasificación de similitud para conjuntos de datos a gran escala. Trans. IEEE. Semisegundo. Fabricación 28, 1–12 (2014).
Google Académico
Yu, J. & Lu, X. Detección y reconocimiento de defectos en mapas de obleas mediante análisis discriminante lineal local y no local conjunto. Trans. IEEE. Semisegundo. Fabricación 29, 33–43 (2015).
Artículo Google Académico
Saqlain, M., Jargalsaikhan, B. & Lee, JY Un clasificador de conjuntos de votación para la identificación de patrones de defectos en el mapa de obleas en la fabricación de semiconductores. Trans. IEEE. Semisegundo. Fabricación 32, 171–182 (2019).
Artículo Google Académico
Nakazawa, T. & Kulkarni, DV Clasificación de patrones de defectos del mapa de obleas y recuperación de imágenes utilizando una red neuronal convolucional. Trans. IEEE. Semisegundo. Fabricación 31, 309–314 (2018).
Artículo Google Académico
Devika, B. & George, N. Red neuronal convolucional para la detección de defectos en obleas de semiconductores. en 2019 10th International Conference on Computing, Communication and Networking Technologies (ICCCNT). 1–6 (IEEE, 2019).
Kyeong, K. & Kim, H. Clasificación de patrones de defectos de tipo mixto en mapas de contenedores de obleas utilizando redes neuronales convolucionales. Trans. IEEE. Semisegundo. Fabricación 31, 395–402 (2018).
Artículo Google Académico
Yu, N., Xu, Q. & Wang, H. Reconocimiento y análisis de patrones de defectos de obleas basados en redes neuronales convolucionales. Trans. IEEE. Semisegundo. Fabricación 32, 566–573 (2019).
Artículo Google Académico
Kang, S. Clasificación de patrón de mapa de obleas invariante de rotación con redes neuronales convolucionales. Acceso IEEE 8, 170650–170658 (2020).
Artículo Google Académico
Kahng, H. & Kim, SB Aprendizaje de representación autosupervisado para la clasificación de patrones de defectos del mapa de contenedores de obleas. Trans. IEEE. Semisegundo. Fabricación 34, 74–86 (2020).
Artículo Google Académico
Laptev, D., Savinov, N., Buhmann, JM y Pollefeys, M. Ti-pooling: agrupación invariable de transformación para el aprendizaje de funciones en redes neuronales convolucionales. en las Actas de la Conferencia IEEE sobre Visión por Computador y Reconocimiento de Patrones. 289–297.
Cheng, G., Zhou, P. & Han, J. Aprendizaje de redes neuronales convolucionales de rotación invariable para la detección de objetos en imágenes de teledetección óptica VHR. Trans. IEEE. Geosci. Remote Sens. 54, 7405–7415 (2016).
Artículo ANUNCIOS Google Académico
Cheng, G., Zhou, P. & Han, J. Rifd-cnn: redes neuronales convolucionales discriminativas de pescador y invariantes de rotación para la detección de objetos. en las Actas de la Conferencia IEEE sobre Visión por Computador y Reconocimiento de Patrones. 2884–2893.
Dieleman, S., Willett, KW y Dambre, J. Redes neuronales convolucionales invariantes de rotación para la predicción de la morfología de galaxias. Lun. No. R. Astron. Soc. 450, 1441-1459 (2015).
Artículo ANUNCIOS Google Académico
Dieleman, S., De Fauw, J y Kavukcuoglu, K. Explotación de la simetría cíclica en redes neuronales convolucionales. en Conferencia Internacional sobre Aprendizaje Automático. (PMLR, 2016).
Cohen, T. y Welling, M. Grupo de redes convolucionales equivariantes. en Conferencia Internacional sobre Aprendizaje Automático. (PMLR, 2016).
Marcos, D., Volpi, M. & Tuia, D. Aprendizaje de filtros convolucionales invariantes de rotación para la clasificación de texturas. en 2016 23ª Conferencia Internacional sobre Reconocimiento de Patrones (ICPR). 2012–2017 (IEEE, 2016).
Gao, H. & Ji, S. Redes neuronales convolucionales eficientes e invariantes para la predicción densa. en la Conferencia Internacional IEEE sobre Minería de Datos (ICDM) de 2017. 871–876 (IEEE, 2017).
Worrall, DE, Garbin, SJ, Turmukhambetov, D. & Brostow, GJ Redes armónicas: traducción profunda y equivalencia de rotación. en las Actas de la Conferencia IEEE sobre Visión por Computador y Reconocimiento de Patrones. 5028–5037.
Jaderberg, M., Simonyan, K. & Zisserman, A. Redes de transformadores espaciales. en Avances en Sistemas de Procesamiento de Información Neural. vol. 28 (Curran Associates, Inc., 2015).
Esteves, C., Allen-Blanchette, C., Zhou, X. y Daniilidis, K. Polar Transformer Networks. preimpresión de arXiv arXiv:1709.01889 (2017).
Dai, J. et al. Redes convolucionales deformables. en Actas de la Conferencia Internacional IEEE sobre Visión por Computador. 764–773.
Mimura, M. & Toda, H. Topología de los Grupos de Lie, I y II. vol. 91 (Sociedad Matemática Americana, 1991).
Maksim, K. et al. Clasificación de defectos de mapas de obleas basada en métodos de aprendizaje profundo con una pequeña cantidad de datos. en 2019 Conferencia Internacional de Ingeniería y Telecomunicaciones (EnT). 1–5 (IEEE, 2019).
Hansen, C. & Thyregod, P. Uso de mapas de obleas en la fabricación de circuitos integrados. Microelectrón. confiable 38, 1155–1164 (1998).
Artículo Google Académico
Wu, M.-J., Jang, J.-S. y Chen, J.-L. Reconocimiento de patrones de fallas en mapas de obleas y clasificación de similitud para conjuntos de datos a gran escala. Trans. IEEE. Semisegundo. Fabricación 28(1), 1–12 (2014).
Google Académico
Alawieh, MB, Boning, D. & Pan, DZ Clasificación de patrones de defectos de mapas de obleas mediante aprendizaje selectivo profundo. en 2020 57.a Conferencia de automatización de diseño (DAC) de ACM/IEEE. 1–6 (IEEE, 2020).
Descargar referencias
Esta investigación fue financiada en parte por la subvención de la Fundación Nacional de Investigación de Corea (NRF) financiada por el Ministerio de Ciencia y TIC del Gobierno de Corea (MSIT) (No. 2020R1A2C1009744), en parte por el Instituto de Cooperación Tecnológica Civil Militar financiado por el Administración del Programa de Adquisición de Defensa y Ministerio de Comercio, Industria y Energía del gobierno de Corea bajo la subvención No. 19-CM-GU-01, y en parte por el Instituto Coreano de Evaluación y Planificación de Tecnología Energética (KETEP) Subvención financiada por el Gobierno de Corea [ Ministerio de Comercio, Industria y Energía (MOTIE)] bajo la Subvención 20206610100290.
Departamento de Ingeniería Mecánica, Universidad de Ciencia y Tecnología de Pohang (POSTECH), Pohang, República de Corea
Iljoo Jeong, Soo Young Lee, Keonhyeok Park, Iljeok Kim, Hyunsuk Huh y Seungchul Lee
Escuela de Posgrado en Inteligencia Artificial, Universidad de Ciencia y Tecnología de Pohang (POSTECH), Pohang, República de Corea
Seung Chul Lee
Instituto de Investigación y Educación de Convergencia en Tecnología Avanzada, Universidad de Yonsei, 50 Yonsei-ro, Seúl, República de Corea
Seung Chul Lee
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
Metodología, Redacción-borrador original, Redacción-revisión y edición, IJ; Conceptualización, Análisis formal, SYL y KP; Curación de datos, Investigación, IK y HH; Supervisión, Financiación adquisición, SL
Correspondencia a Seungchul Lee.
Los autores declaran no tener conflictos de intereses.
Springer Nature se mantiene neutral con respecto a los reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.
Acceso abierto Este artículo tiene una licencia internacional Creative Commons Attribution 4.0, que permite el uso, el intercambio, la adaptación, la distribución y la reproducción en cualquier medio o formato, siempre que se otorgue el crédito correspondiente al autor o autores originales y a la fuente. proporcionar un enlace a la licencia Creative Commons e indicar si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la regulación legal o excede el uso permitido, deberá obtener el permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.
Reimpresiones y permisos
Jeong, I., Lee, SY, Park, K. et al. Clasificación del patrón de falla del mapa de obleas utilizando una red neuronal convolucional invariante de transformación geométrica. Informe científico 13, 8127 (2023). https://doi.org/10.1038/s41598-023-34147-2
Descargar cita
Recibido: 16 febrero 2023
Aceptado: 25 de abril de 2023
Publicado: 19 mayo 2023
DOI: https://doi.org/10.1038/s41598-023-34147-2
Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:
Lo sentimos, un enlace para compartir no está disponible actualmente para este artículo.
Proporcionado por la iniciativa de intercambio de contenido Springer Nature SharedIt
Al enviar un comentario, acepta cumplir con nuestros Términos y Pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.