¿Qué clasificador es eficiente al tratar con una consulta de prueba que no pertenece a una clase entrenada?

Puedes agregar una o más clases extra ‘Otro’ o ‘Basura’ y entrenar a tu (s) clasificador (es) para ellos también. Este es un enfoque común con NB. También maneja los desequilibrios de clase.

La respuesta depende tanto de sus datos como del clasificador, no hay una solución única para todos.

Además, si utiliza el enfoque de clasificadores One-Against-All, puede aplicar un umbral de predicción , por lo que si, por ejemplo, ninguna clase es más de un 72% probable, determina que la salida sea ‘Otra’. (Podrías estimar el valor de ese umbral en un conjunto de validación usando ejemplos no vistos, simplemente guardando algo de tu conjunto de entrenamiento original)

Otra cosa que debe tener en cuenta es el costo de error Tipo I vs Tipo II, o en su caso multiclase, la matriz de costos . Las sanciones individuales por identificar erróneamente un rostro humano como un gato o una pizza, o no identificar nada (clase “Otro”), podrían ser muy diferentes.

Esto tiene una solución bastante estándar, no es necesario recurrir a ningún método complicado. Entrene 5 clasificadores “One Vs All” en lugar de 1 “clasificador de 5 clases”.
Como en el tren 5 Ci’s: C1, C2, C3, C4, C5 donde Ci dice verdadero si el punto de datos pertenece a la clase I o falso si no lo hace. En este caso, los 5 darán Falso si su punto de datos no pertenece a ninguna de las clases.
One Vs All (OVA) es un enfoque muy común en la clasificación multiclase y la mayoría de los algoritmos (incluido Naive Bayes) se pueden usar fácilmente. Sin embargo, sugeriría que se aleje de Naive Bayes si prueba OVA. Esto es porque NB no funciona muy bien para clases desequilibradas en mi experiencia.

Le sugiero que busque algoritmos de aprendizaje no supervisados ​​en este escenario en lugar de los supervisados. En casi todos los algoritmos de aprendizaje supervisado usted predice la clase o la probabilidad (probabilidad) de la clase particular de posibilidad en base a los patrones observados para esa clase y otras clases.

Si bien el uso de un suavizado de Laplace puede darnos un resultado aproximado que sugiera que los nuevos datos de muestra no pertenecen a ninguna de las clases originales, nunca sabría cuáles son las nuevas clases si tiene muchos datos de prueba y varias clases que no se encontraron anteriormente.

Los métodos de aprendizaje no supervisados, como la máquina Boltzman restringida, el modelado de la mezcla gaussiana utilizando la maximización de la expectativa, la asignación de direccionamiento latente pueden abordar este escenario fácilmente y brindarle buenos resultados. Pero incluso para estos modelos, necesita al menos saber cuántas clases tiene en todos los datos.

Ninguna. Si entrenas un clasificador binario para cada clase usando uno contra todos. Entonces puede obtener menos probabilidades para todas las clases, de las cuales puede inferir lo que quiere.

More Interesting

¿Bajó UPSC su nivel en las preliminares 2016? Por primera vez en cinco años, se hicieron preguntas sobre mariposa, plátano, automóvil eléctrico, película, etc. ¿Significa esto una degradación en la norma?

¿Cuál es un método completo y correcto para estudiar para los siguientes exámenes: IBPS-PO, SBI-PO y RBI grado B para que uno los apruebe?

¿Cuáles son los beneficios de estudiar la clase 10 en el ICSE?

¿Cuál fue tu reacción después de ver tus marcas NEET?

Actualmente, estoy en la clase X preparándome para el IIT-JEE 2017. Estoy listo para sacrificar cualquier cosa para obtener un rango inferior al 50. ¿Qué es un consejo para mí?

¿Cómo manejaste los estudios universitarios y los exámenes con la preparación de civils? ¿Tomaste en serio los exámenes de la universidad y estudiaste para la ciudad durante ese período?

¿Qué tan difícil es la sección de aptitud cuantitativa en el examen UPSC?

¿Cuál es el punto de eliminar a UGC-NET y convertirse en un JRF cuando se va a terminar después de un máximo de 5 años? ¿Qué puede hacer una persona después de que termine su beca?

¿Puede una biotecnología btech ir por la ingeniería química?

¿Es la administración pública mejor que la profesión de un médico?

¿La junta de ISC aprueba a todos los estudiantes? ¿Cuáles son las marcas aprobatorias en cada materia en ISC?

¿Cuáles son algunos de los mejores entrenamientos para la preparación de JEE-IIT después del 12?

¿Es mejor convertirse en ADE / ADEN / ADME en Indian Railways rompiendo ESE o ingresando como SSE y luego aprobando el examen departamental?

Cómo borrar los exámenes UGC NET para el comercio

¿Es correcto pedirle a una persona química orgánica o inorgánica en su examen de ingreso de ingeniería si desea continuar con la programación y la robótica?