Dado que el campo del aprendizaje de máquinas en este momento es muy activo, sería bueno desarrollar aplicaciones que tengan algún tipo de componentes ML / NLP / CV. Algunos ejemplos de proyectos en los que puedo pensar son:
- Comprobador de oraciones . Dada una oración, queremos decir si la oración es correcta o no. Para esto, nos gustaría construir algo llamado modelo de lenguaje, que básicamente asigna una probabilidad a cada secuencia de tokens. El modelo debe asignar una alta probabilidad a las oraciones bien formadas y viceversa. El conjunto de datos para esto es abundante y en todo Internet (por ejemplo, artículos de Wikipedia, …). Podemos comenzar de manera simple dando primero solo una respuesta binaria (es decir, correcta / incorrecta). Entonces podemos hacer que la aplicación se vuelva más complicada. Por ejemplo, si creemos que la oración es realmente incorrecta, podemos sugerir una corrección (esta página tiene un enfoque interesante para esto).
- Herramienta de parafraseo . Muchos estudiantes son perezosos, especialmente cuando se trata de escribir ensayos. ¿Sería bueno si tuviéramos una herramienta de parafraseo que toma una oración que copiamos de alguna fuente y la transforma en una nueva oración con una estructura diferente pero que transmite el mismo significado? Hay un corpus parapharse de Microsoft. Si necesito construir una herramienta como esta, probablemente comenzaré por experimentar con seq2seq.
- Chatbot . Deberíamos comenzar desarrollando un chatbot para un dominio estrecho. Una búsqueda rápida en Google nos brinda muchos artículos interesantes sobre este tema (por ejemplo, consulte este repositorio de Github).
- Clasificador de hot dog o no hot dog. Si eres un fanático de la serie de TV de Silicon Valley, definitivamente trata de construir este tipo de clasificador. Mira este video. El chico en el video construyó un clasificador similar utilizando el servicio Google Cloud.