Hay diferentes bibliotecas de código abierto disponibles como stanford ner, GATE, lingpipe, nltk, etc. Pero para crear una mejor o una más adecuada para su dominio y sistema, es posible que prefiera crear la suya propia.
- Utilice alguna biblioteca de análisis de texto como nltk o stanford para analizar el texto.
- Usando esto, puede obtener POS (sustantivo, pronombre, adjetivo, adverbio, etc.). Ahora, según su necesidad y el nivel de su etiquetador NER, puede seleccionar el nombre, el nombre propio del resultado parce para su etiquetado NER
- Entrene su sistema con algún clasificador de aprendizaje automático para varias categorías, como Persona, organización, deportes, negocios, medicina para la que quiera etiquetar sus nombres
- Pruebe el resultado de su POS con este clasificador para ver a qué clase pertenece.
Ejemplo
s = “Spencer Gore es el primer campeón de Wimbledon en la historia”
resultado del analizador = [(‘Spencer’, ‘NN’), (‘Gore’, ‘NNP’), (‘is’, ‘VBZ’), (‘the’, ‘DT’), (‘first’, ‘ JJ ‘), (‘ Wimbledon ‘,’ NNP ‘), (‘ campeón ‘,’ NN ‘), (‘ in ‘,’ IN ‘), (‘ history ‘,’ NN ‘)]
- ¿Las PSU toman solo a través de GATE?
- ¿Qué debemos hacer por CA después del 12?
- Si SBI PO comienza a prepararse para un MBA, ¿su experiencia laboral se consideraría de prestigio en comparación con otros aspirantes?
- ¿Cómo puede uno prepararse para un M.Tech de IIIT-H / BITS Pillani?
- Cómo obtener un buen sonido en la aptitud cuantitativa
Puedes considerar NN, NNP a partir de este resultado.
Pruébelo con su clasificador a qué clase pertenece.
En un nivel superior, se enfrentará a un problema de desambiguación del sentido de las palabras, que puede resolverse posteriormente mediante el uso de técnicas de modelado de temas.
Enlaces útiles
- El grupo de Stanford NLP (Procesamiento de lenguaje natural)
- Página en stanford.edu