¿Qué debo hacer si solo tengo 4 meses para aprender ciencias de la información y aprendizaje automático?

Por lo tanto, debe aprender ciencia de datos / aprendizaje automático (DS) en 208 horas. Y por aprender queremos decir:

  • Dominar la estructura de las respuestas a todas las preguntas básicas de DS.
  • Ser capaz de ” hablar un buen juego “, es decir, ser capaz de formar oraciones de manera fluida compuestas del vocabulario estándar de DS
  • Minimice las “incógnitas desconocidas “, es decir, poder decir algo como “bueno, traté de obtener un ejemplo de memoria temporal jerárquica en mi computadora portátil, pero no pude compilar el C ++” en lugar de “HTM? ¿Estás hablando de HTML? ”

Asumiremos que ya sabe cómo ser un aprendiz continuo y hemos anotado la increíble persona que va a ser cuando aprenda estas cosas y la basura inútil que va a ser si no lo hace. Para ello vas a tener que:

  • Aprenda DS desde una perspectiva de ingeniería, alternando entre la teoría y la práctica
  • Escuche un montón de datos reales que los científicos hablan sobre muchos aspectos diferentes de DS durante muchas horas
  • Memorice las respuestas estándar a las preguntas estándar de DS

Bien, vamos a empezar con la teoría. Obtenga una copia de estos dos libros:

  • Amazon.com: Introducción al aprendizaje estadístico: con aplicaciones en R (Springer Texts in Statistics) (9781461471370): Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani: Libros
  • Amazon.com: Los Elementos del Aprendizaje Estadístico: Minería de Datos, Inferencia y Predicción, Segunda Edición (Serie de Springer en Estadísticas) (9780387848570): Trevor Hastie, Robert Tibshirani, Jerome Friedman: Libros

¡No te saltes los ejemplos de programación! Instale RStudio (para los ejemplos R) o, mejor, Anaconda (para los ejemplos R y python) y aprenda cómo usar los cuadernos Jupyter.

Luego, en la práctica de ser un Ingeniero de Aprendizaje Automático (ML). Obtenga una copia de este libro:

  • Aprendizaje automático con Scikit-Learn y TensorFlow: conceptos, herramientas y técnicas para construir sistemas inteligentes: Aurélien Géron: 9781491962299: Amazon.com: Libros

Descargue los cuadernos de notas de Jupyter asociados con este libro y lea cada capítulo (ageron / handson-ml) y juegue con ellos.

Además, revise los libros y haga tarjetas de memoria con los diversos conceptos, herramientas y técnicas que recoja a lo largo del camino. Chris Albon tiene un gran conjunto de hechos a mano:

También recomiendo tocarlos manualmente en SuperMemo (SuperMemo: aprende rápido y olvídate de olvidar) o Anki (Anki: tarjetas inteligentes y potentes) en tu teléfono inteligente. Estas aplicaciones explotan la curva de olvido y solo te presentarán las tarjetas que creen que aún no has memorizado. Por lo tanto, cada vez que tenga un “tiempo de observación” (como cuando está solo parado en una línea) pase por la fase de aprendizaje del curso que creó ese día.

Además, siempre que tenga “tiempo de escucha” (como cuando está solo conduciendo su automóvil), escuche estos podcasts:

  • No tan desviaciones estándar
  • Digresiones Lineales (Episodios)
  • Escéptico de datos
  • Podcast de Data Science at Home
  • O’Reilly Data Show Podcast ideas y recursos.
  • Parcialmente Derivado
  • Historias de datos
  • Máquinas que hablan (conversación humana sobre el aprendizaje automático)

Ambos, después de un tiempo, se desharán de sus “incógnitas desconocidas” y le facilitarán su capacidad para hablar sobre DS. (Chris Albon de Parcialmente Derivado tiene un buen podcast sobre cómo aprender DS aquí).

Puede hacerlo fácilmente en 208 horas si lo divide en un buen horario para usted. ¡Buena suerte!

Tanto marketing en todas las respuestas parece. ¡Gente divertida por todas partes!

No entiendo por qué las personas toman el aprendizaje como un sistema de curso fijo. ¿Hay alguna universidad / universidad en el mundo que te diga el último día que tu estudio y aprendizaje hayan terminado y que no tengas que aprender más en tu vida? NO. NUNCA.

El aprendizaje es un proceso continuo. No puedes terminar la ciencia de datos en 4 meses. Ni siquiera puedes terminar de aprender álgebra lineal o simplemente Python o máquina inclinada en 4 meses. Encuentro tales preguntas y expectativas tan graciosas, idiotas y repugnantes.

Pero ciertamente puedes mejorar. Mucho. Así que deja de trabajar en la búsqueda de quora y google y comienza a hacer las cosas necesarias. Comience con el curso de Andrew Ng en coursera. Únete a kaggle / driven data y comienza a hacer algo de competencia. Iniciar MOOCs en línea. Entrar en proyectos. Aprende a codificar mejor. Resuelve diferentes problemas. Trate de discernir las matemáticas más profundamente. Existen numerosos recursos nuevos en Internet, ya que todos quieren ser científicos de datos en estos días. Eso es algo horrible para mí sin embargo.

Si comienzas y te limitas a él, verás que estás mejorando día a día y descubrirás que la ciencia de datos es como un océano. Nunca puedes terminar de nadar. Pero, eso no significa que no debas probar el placer de sumergirte en él.

Simplemente hazlo.

Gracias.

Siga estos 6 PASOS FÁCILES para aprender los conceptos básicos del APRENDIZAJE EN MÁQUINA en 3 meses.

¡¡Buena suerte!!

El aprendizaje automático es un campo verdaderamente vasto y en rápido desarrollo. Será abrumador sólo para comenzar. Sin duda, ha estado saltando en el punto en el que necesita usar la máquina para averiguar cómo construir modelos. Piensa un poco en lo que debe hacer; sin embargo, cuando se filtra la web en busca de algoritmos concebibles, hay muy recientemente un número excesivo de alternativas.

Para aprender el aprendizaje automático, debes ser mejor que el promedio en matemáticas. Aquí están las matemáticas que debe aprender teniendo en cuenta el objetivo final para estar preparado.

  • Álgebra lineal-Álgebra lineal – MIT 18.06 Álgebra lineal por Gilbert Strang
  • Teoría de probabilidad-Probabilidad y estadística – MIT 6.041 Análisis probabilístico de sistemas y probabilidad aplicada por John Tsitsiklis
  • Cálculo
  • Cálculo multivariado
  • Teoría de grafos
  • Métodos de optimización
  • Cualquier lenguaje de programación que sea ampliamente utilizado para ML como python, MATLAB o C ++.

PD: recomendaría Python aquí como idioma y recomendaría los siguientes enlaces:

  • Aprendizaje automático con texto en scikit-learn (PyCon 2016)
  • Aprendizaje automático en Python con scikit-learn
  • Aprendizaje automático con Python

https://www.youtube.com/watch?v=… https://www.youtube.com/watch?v=…

Una vez cumplidos estos requisitos, por fin puede comenzar a considerar el Aprendizaje automático.

6 PASOS FÁCILES PARA UTILIZAR EL APRENDIZAJE EN MÁQUINA?

Este es el lugar donde comienza la diversión. Ahora, se espera que la fundación comience a echar un vistazo a algunos datos. Antes de comenzar, he enumerado 30 cosas que todos deberían saber en Aprendizaje automático . La mayoría de las empresas de aprendizaje automático tienen básicamente el mismo proceso de trabajo:

PASO 1.) Fabrique sus fundamentos de aprendizaje automático estudiando algunos materiales relacionados con el tema:

a.) Las conferencias de Aprendizaje automático de Andrew Ng son un gran comienzo :

b.) Escuela de verano de aprendizaje automático :

c.) Un enlace a la lista de reproducción completa está aquí (Colección de conferencias | Aprendizaje automático)

https://www.youtube.com/view_pla

d.) Certificado de aplicaciones y minería de datos de Stanford :

http://scpd.stanford.edu/public/…

e.) Introducción a la inteligencia artificial por el Prof. Deepak Khemani IIT Madras

http://nptel.ac.in/courses/10610

f.) ” La mejor introducción de aprendizaje automático que he visto hasta ahora”.

PASO 2.) Toma un curso en línea

Lo principal que aconsejo a alguien que necesita aprender aprendizaje automático es tomar el curso en línea de Andrew Ng.

Creo que el curso de Ng es especialmente puntual y excepcionalmente eficiente, por lo que es un conocido extraordinario para alguien que necesita ingresar a ML. Me sorprende cuando los individuos me revelan que el curso es “excesivamente fundamental” o “excesivamente superficial”.

Ante la posibilidad de que me revelen que solicito que aclaren el contraste entre Regresión logística y SVM de kernel lineal, PCA versus Factorización matricial, regularización o pendiente de gradiente. He hablado con los aspirantes que afirmaron años de encuentro de ML que no sabían la respuesta a estas preguntas. En su mayor parte están claramente aclarados en el curso de Ng.

Hay muchos otros cursos en línea que puede tomar después de este, pero ahora está en su mayor parte preparado para pasar a la siguiente etapa.

Vea mi publicación anterior Los 10 mejores videos, profesores y cursos sobre aprendizaje automático para principiantes y avanzados

PASO 3.) Algunas sugerencias de libros

Mi paso subsiguiente sugerido es obtener un libro decente de LD (mi resumen más abajo), leer las secciones principales de introducción, y después de que el rebote a cualquier parte incorpore un algoritmo, está interesado. Cuando hayas descubierto que algo, salta a él, observa cada uno de los puntos de interés y, en particular, implementalo. En el último paso del curso en línea, a partir de ahora, habría actualizado algunos algoritmos en Octave. Sea como sea, aquí estoy mirando la ejecución de un algoritmo sin ninguna preparación en un lenguaje de programación “real”. En cualquier caso, puede comenzar con uno simple, por ejemplo, Regresión logística regularizada por L2, o k-means, pero también debería esforzarse para actualizar todos los más interesantes, por ejemplo, SVM. Puede utilizar una implementación de referencia en una de las muchas bibliotecas existentes para asegurarse de que está obteniendo resultados equivalentes.

  • El razonamiento bayesiano de David Barber y el aprendizaje automático
  • Aprendizaje automático de Kevin Murphy: una perspectiva probabilística
  • Google dice que el aprendizaje automático es el futuro
  • Los elementos del aprendizaje estadístico de Hastie, Tibshirani y Friedman
  • Reconocimiento de patrones del obispo y aprendizaje automático
  • Andrew Ng OpenClassRoom Stanford
  • Aprendizaje de máquina de Mitchell

También hay numerosos libros geniales que se centran en un tema específico. Por ejemplo, Sutton and Re-Inforcement Learning es una obra de arte. Además, el libro Deep Learning (accesible en la web) prácticamente se está convirtiendo en un ejemplar antes de su distribución. Sea como sea, necesita un par de esos libros para reunir un grado de comprensión de gran alcance y equilibrado del campo.

Ver mi publicación anterior 10 libros electrónicos gratuitos que debes leer sobre los conceptos básicos del aprendizaje automático .

Asimismo, puede ir específicamente a un trabajo de investigación que presente un algoritmo o enfoque que le interese y se sumerja en él.

PASO 4.) La mayoría de los algoritmos esenciales

Se confía en usted para conocer las tuercas y los tornillos de un algoritmo esencial.

Ver mis algoritmos posteriores a 15 algoritmos que los ingenieros de aprendizaje deben conocer .

En cualquier caso, además de los algoritmos, también es fundamental saber cómo configurar sus datos (selección de características, transformación y compresión) y cómo evaluar sus modelos. Tal vez, como iniciador, podría ver nuestro Aprendizaje de máquina en el ejercicio de instrucción scikit-learn en SciPy 2016. Condensa una gran parte de los rudimentos al presentar la biblioteca de scikit-learn, que puede resultar útil para la ejecución y otros exámenes. :

PASO 5.) Juega con unos enormes conjuntos de datos que son accesibles de forma abierta.

Descubra un conjunto de datos que le parezca especialmente intrigante o sobre el que tenga hipótesis y verifique si tiene razón.

a.) Datos del gobierno de los EE. UU. http://www.data.gov/

b.) Contender en Kaggle o construir algo con uno de sus conjuntos de datos, es realmente divertido y genuino. https://www.kaggle.com/

Kaggle es una plataforma para el modelado predictivo y las competiciones de análisis en las que las empresas e investigadores publican sus datos, y los estadísticos y mineros de datos de todo el mundo compiten para producir los mejores modelos”. – Wiki

Kaggle lo expone a una amplia gama de problemas de Aprendizaje automático, las competiciones de Kaggle lo obligan a codificar y a codificar su solución de la manera más eficiente posible, haciendo concesiones entre el tiempo del programador, el tiempo de CPU, RAM, etc. Cada competencia tiene un Foro donde los competidores se ayudan entre sí para abordar el problema. Estarás compitiendo contra algunos de los mejores ingenieros del mundo. Finalmente, los reclutadores están recorriendo las tablas de Kaggle en busca de ingenieros talentosos. Podrías encontrar una nueva posición .

Debería comenzar su kaggle con Titanic porque, debido a que hay muchos scripts / problemas accesibles, tendrá la capacidad de construir diversos tipos de modelos que también le permitirán comprender algunos de los algoritmos de aprendizaje automático.

A continuación, puede ocuparse de un tema interesante. Reclutar en Facebook por qué, dado que dada la facilidad de la estructura de datos y la extravagancia del contenido , puede unirse a las tablas correctas y hacer un cálculo preciso en este caso.

Cuando haya terminado con estos dos, debería estar listo para abordar temas más interesantes de acuerdo con su interés.

He enumerado 40 proyectos divertidos de aprendizaje automático para principiantes en aprendizaje automático. Cuando termine, puede echar un vistazo a los 35 principales proyectos de aprendizaje automático en Github para obtener más inspiración.

Algunos sitios que pueden ayudarlo a resolver problemas : https: //stackoverflow.com , http : //www.gitxiv.com/ , http://www.arxiv-sanity.com/ , https://arxiv.org/

PASO 6.) Participa en un aprendizaje automático centrado en el producto o en un evento Attend ML.

El grupo que busca debe estar cargado de ingenieros a los que desea instruir y aprender. Esto te ayudará a convertirte en un buen ingeniero de aprendizaje automático. Del mismo modo, al separar un grupo de productos, rápidamente descubrirás cómo la ciencia y la hipótesis del aprendizaje automático varían de la capacitación. Específicamente, cómo la conducta del cliente le mostrará algo nuevo cada día.

Vaya a los eventos de aprendizaje automático en los que puede darse cuenta de lo que hace la gente en las charlas y participar con hackathons, ejercicios de instrucción y talleres como:

La conferencia de aprendizaje automático

Conferencia de estratos de O’Reilly

PyData

Conferencia de datos ricos de Crowdflower

PD: ¿Quiere saber en profundidad los últimos recursos de AI y ML en la web? DEBE ver esta página de índice aquí .

CONCLUSIÓN:

No dudes en fallar . La mayor parte de su oportunidad en el aprendizaje automático se dedicará a tratar de entender por qué un algoritmo no funcionó como esperaba o por qué recibí los errores que son comunes. La perseverancia es crítica.

Simplemente deja que todo salga. En el caso de que piense que la regresión logística puede funcionar … inténtelo con un pequeño conjunto de datos y perciba cómo lo hace. Estas actividades tempranas son una caja de arena para asimilar las técnicas al caer de plano, así que aproveche y pruebe todo lo que sea un buen augurio.

En ese punto … en caso de que sea rápido para llevar a casa el tocino aprendiendo a máquina, haga su propio sitio. Cree un sitio web que incluya cada una de las empresas a las que se haya dedicado. Muestra cómo los hiciste. Demostrar los productos finales. Hazlo hermoso. Tener imágenes decentes. Haz que el proceso sea capaz. Haga un artículo que otra persona pueda ganar y luego confíe en que una empresa puede ver todo el trabajo que realiza.

Para comenzar con el ML, debes entender que el ML no es algo que sea 100% preciso , la mayoría de los casos son solo una estimación decente y grandes cantidades de iteraciones. Así que pensar en un pensamiento único es difícil como regla , en vista del tiempo y los recursos que gastará en la preparación del modelo. Así que no intente dar sentido a las soluciones por sí mismo: busque documentos, proyectos, expertos que puedan ayudarlo. Cuanto más rápido obtengas experiencia, mejor. ¡¡Todo lo mejor!!

En mi vista:

  1. Pasar 2 semanas a partir de la comprensión de lo que es la ciencia de datos? ¿Qué tipo de problemas ha resuelto / puede resolver? ¿Cuáles son los diferentes dominios? ¿Qué tipo de soluciones han dado las personas en el pasado? Lea los estudios de casos de empresas. Sugiero Fractal como punto de partida.
  2. Desarrollar un interés en las matemáticas detrás de las cosas. Regresión, árboles, etc? ¿Qué está pasando en el fondo? ¿Hay una intuición detrás de por qué este método podría ser correcto?
  3. ¿Desarrollar interés en algo llamado como ingeniería de características? La mejor y más complicada parte de la ciencia de datos. Haciendo nuevas variables para el problema.
  4. Desarrollar el proceso de pensamiento estructurado para hacer cada tarea de minutos.
  5. Acepte el punto de que todo (con toda probabilidad) lo que está haciendo es beneficiar una métrica empresarial / responder preguntas importantes / resolver subconjunto de algún problema / proporcionar un hecho desconocido anterior / restaurar un hecho conocido
  6. Exponerse a las técnicas 3–4 y leer más sobre ellas. No 8–9 y lee menos sobre todas las técnicas.
  7. Piensa cada problema desde una nueva perspectiva. Comience con una pizarra limpia. No pienses como: hice esto la última vez, así que esta vez también funcionará.
  8. Por último, pero no menos importante: implemente al menos 2 proyectos en cualquier idioma de su elección.

Hola, entiendo su problema, le sugeriré que hay muchos cursos en línea y libros disponibles. Udacity, coursera, simplemente aprender ofrece curso en línea. También puedes aprender lo básico al explorar YouTube.

Por cierto , personalmente, no he aprendido tanto de los videos y tutoriales en línea como de los libros. Hasta este momento, mi pequeño estante de madera tiene suficientes libros para mantenerme ocupada este invierno.

Aquí hay una lista de libros y cursos en línea sobre aprendizaje automático / ciencia de datos en R y Python que he encontrado en el último año. Ya que la lectura es un buen hábito, con este post, quiero que te pase este hábito. Para cada libro, he escrito un resumen para ayudarte a juzgar su relevancia. ¡Feliz lectura!

18 libros nuevos para científicos de datos, aprendizaje automático, en R y Python Must Read!

Los mejores cursos de Data Science en Internet, clasificados según tus comentarios

Cómo obtener la mejor educación de aprendizaje profundo de forma gratuita

Ahmed Akram Realmente te aconsejo que comiences con este curso Aprendizaje de máquina | Coursera, comience con eso, que cuando sienta que domina el ML, comience a buscar el proyecto de ML en Your Home for Data Science.

(fuente de la imagen Data Science Society en Berkeley)

Para la ciencia de datos comienza con:

  • Introducción a la ciencia de datos | Lynda.com (pagado)
  • Ciencia de datos | Udacity (pago + certificación)
  • Ciencia de datos | Coursera Johns Hopkins University (Cursos excelentes / pago + certificación)

No olvides el poder de los libros :-).

Espero que ayude 🙂

Recomendaría seguir dos libros y el curso de Andrew Ng en Coursera.

  1. Una introducción al aprendizaje estadístico: Introducción al aprendizaje estadístico
  2. Aprendizaje automático con Scikit-Learn y TensorFlow: Aprendizaje automático con Scikit-Learn y TensorFlow: Conceptos, herramientas y técnicas para construir sistemas inteligentes: Auréle Géron: 9781491962299: Amazon.com: Libros

Buena suerte.

Este sitio web contiene enlaces al Libro de texto completo, Videos de instructores del curso en línea que enseñaron en Stanford en 2015 y diapositivas para la “Introducción al aprendizaje estadístico. [1]” Este es el libro de texto mencionado anteriormente en una respuesta. Los autores publican una copia en PDF gratis en línea, así que no la compre en Amazon a menos que prefiera una copia impresa.

Tomé un curso en UT Austin que se basaba en este libro y al mismo tiempo era accesible y riguroso. Una buena nota es que su popularidad ha justificado muchas discusiones del texto en línea para una lectura adicional. También me pareció muy útil usar R Markdown para cada capítulo a medida que pasaba por los laboratorios y los conjuntos de problemas.

Notas al pie

[1] Introducción al aprendizaje estadístico.

Hay un sitio web realmente genial para enseñar el aprendizaje automático al lego:

Dominio del aprendizaje automático

Comprar su paquete de libros electrónicos. Es $ 99, pero vale la pena. Te ayudará a dominar el aprendizaje automático en 6 meses. Por supuesto que está solicitando durante 4 meses, pero aún así, debe obtener una cantidad significativa de estudios realizados.

La única advertencia es que enseña más desde una perspectiva práctica más que teórica. Aún así, debe tener suficiente conocimiento para hacer ingeniería de datos que luego puede ampliar su conocimiento con el estudio de los libros de texto de Springer sobre conocimiento teórico.

Contratar a un ingeniero de aprendizaje automático.

En 4 meses podrás rascar la superficie, pero nunca lo respaldarás a través de una entrevista real.

Aprende Python y aprende a disputar datos.

Aquí hay un curso gratuito para comenzar con Python y las principales librerías ML.

Las 5 mejores bibliotecas de aprendizaje automático en Python – Udemy

4 meses 12h / w para un principio es un buen momento.

Si desea obtener información sobre ML o Big Data, puede hacer un curso en línea de Coursera, la Universidad de Big Data, etc., etc.

Si desea usarlo en algunos proyectos, ahorre tiempo y use una herramienta como BigML o Weka.

En el primer video, Machine Leraning se explica con palabras claras y sencillas, después de esto, repase esta serie informativa de preguntas sobre el video de Machine Learning …

¿Qué es Python Machine Learning y cómo aprenderlo?

Prueba 1

Prueba 2

Prueba 3

Cuestionario 4

Prueba 5

En primer lugar, debe unirse a los cursos en línea de Udemy: aprenda cualquier cosa, siga su programa y siga el curso ‘Machine Learning AZ: Hands on Python and R en Data Science’ (puede obtenerlo por $ 10 dólares si busca en Google los cupones de udemy, así que no lo haga) No lo compre por $ 200). Ahora, en los primeros uno o dos meses, complete este curso, estoy seguro de que aprenderá mucho de él, luego en el tercer mes lea, lea y lea más PDFs y libros sobre todos los temas enseñados y, por último, en el cuarto mes. practicar con una gran cantidad de datos / proyectos disponibles en línea.

Hay una serie de cursos disponibles en la web. Pero uno tiene que elegir sabiamente para prepararse inteligentemente para ingresar a la industria. La mayoría de los cursos disponibles en el mercado ofrecen un plan de estudios fijo para todos ya un precio muy alto. de ir a este tipo de cursos sería mejor si se prepara con un mentor que posea un conocimiento completo del mundo práctico y que pueda guiarlo de acuerdo con su experiencia y sus objetivos profesionales. Si está interesado en el programa de tutoría, puede enviarme un mensaje de texto al 8976670072

En lo que respecta a impresionar a un empleador, estas Heurísticas Programables podrían ayudar (cite a Nathan Coppedge, filósofo, de otro modo gratuito): Heurísticas Programables de Nathan Coppedge en el Blog Oficial de Nathan Coppedge

El aprendizaje automático con el que no puedo ayudar, excepto que debería ser mucho más simple generar resultados inteligentes, guías, declaraciones, etc. mediante el uso de tales heurísticas o, más probablemente, de los sistemas detrás de ellos.

Sé muy poco sobre robótica.

Creo que un buen lugar para comenzar es el curso Stanford Machine Learning de Andrew Ng en coursera:

Aprendizaje Automático | Coursera

Sus explicaciones tenían mucho sentido para mí, que no sabía nada sobre el aprendizaje automático. Con 12 horas a la semana, probablemente puedas terminar el curso en aproximadamente 2 semanas. Eso te deja mucho tiempo para mirar todas las cosas que sugieren las otras respuestas.

¡Buena suerte!

Echa un vistazo a Cómo iniciar AI / ML / DL desde cero. ¡¡Buena suerte!!