Soy un analista autodidacta que ha trabajado en varios roles analíticos, y actualmente estoy en un rol en Zynga en el que el análisis de datos es una parte crítica de mi toma de decisiones diaria.
Hace dos años, escribí un artículo sobre cómo alguien debería enseñarse habilidades de inteligencia empresarial. Es anticuado, de opinión, (y largo), pero las secciones de Excel y SQL siguen siendo relevantes hoy:
http://john.marsland.org/blog/bu…
- Como estudiar un tema completo en 2 horas.
- ¿Cuál es la mejor manera de estudiar para los exámenes?
- ¿Qué tan difícil es estudiar el fuego y la ingeniería de seguridad?
- ¿Debo ir a la preparación de UPSC si soy débil en mis estudios?
- Cómo evitar perderse en mi propia intensidad al estudiar.
Si desea aprender cómo ser un analista de datos, siga los siguientes pasos
1. Master Microsoft Excel
2. Aprende SQL básico
3. Aprender desarrollo web básico
4. Sumérgete en una concentración.
Así es como debes empezar:
1. Master Microsoft Excel
En primer lugar, dominar Microsoft Excel. Excel es la herramienta de negocios más versátil y común para el análisis de datos. Si bien muchos analistas de datos pasan a otras herramientas y rutas específicas funcionales (extracción de datos, visualización, aplicaciones estadísticas, etc.), casi todas las rutas comienzan y probablemente todavía usan Excel.
- Comience por aprender los componentes y conceptos básicos de navegación (libros de trabajo, hojas de trabajo, barra de fórmulas, cinta). Aprenda un par de fórmulas básicas (if, vlookup, text, date) y luego pase a las fórmulas más poderosas (sumproduct, getpivotdata, match / index).
- Cuando comience a sentirse más cómodo, comience a dominar los atajos de teclado. Comience por aprender a navegar dentro de un libro de trabajo / entre libros de trabajo. Luego aprenda los métodos abreviados para formatear, insertar cuadros / tablas, ocultar / mostrar / agrupar columnas / filas. Nota sesgada: si es posible, debe aprender Excel utilizando un sistema operativo Windows. La versión de Mac OS está limitada por el diseño y no te permite aprender los atajos tradicionales, lo que te ralentizará considerablemente. Sabe que ha aprendido suficientes métodos abreviados cuando puede realizar el 80% de las tareas que necesita utilizando solo el teclado en lugar del mouse.
- Conozca el método Data-> Pivot-> Presentation para diseñar plantillas escalables de Excel. Este artículo tiene una buena introducción:
http://www.databison.com/index.p… - Aprenda cómo construir diferentes modelos / presentaciones para diferentes aplicaciones de análisis. Construye un modelo para tu equipo de Fantasty Sports. Descargue un estado financiero e intente predecir los ingresos del próximo trimestre. Descargue datos del Censo de EE. UU. (Http://www.census.gov/main/www/a…) y obtenga más información sobre el perfil demográfico de EE. UU.
- Excel es bueno en la mayoría de las tareas analíticas como una herramienta generalista, pero no es excelente en ninguna tarea. Sin embargo, concentrarse en Excel lo expondrá a varios conceptos analíticos que luego podrá dominar en otras aplicaciones.
- Si tiene preguntas, mire los videos o publíquelos en los foros de MrExcel. Es el Quora / Stackexchange para Excel
2. Aprende SQL básico
Excel le permite dividir y dividir datos, pero se supone que tiene los datos disponibles. A medida que se convierte en un analista más experimentado, encontrará que la mejor manera de obtener datos es extraerlos directamente de la fuente, y eso a menudo requiere obtener datos de una Base de datos relacional que probablemente admita alguna deriva de SQL.
Debes dominar el SQL siguiente. Aquí hay una guía general.
- Compre un libro, encuentre un buen tutorial web (Pruebe W3Schools por un tutorial ligero http://www.w3schools.com/sql/sql… o Big Data University por uno más complejo: http://bigdatauniversity.com), o Pídale a un amigo analista que le muestre lo básico durante una hora. Mostré a un amigo la semana pasada, lo recogerás rápidamente.
- Omita todo lo relacionado con las tablas y vaya directamente a aprender cómo extraer datos. Aprende las 6 palabras clave reservadas más grandes:
SELECCIONAR
DESDE
DÓNDE
AGRUPAR POR
TENIENDO
ORDEN POR - A continuación, aprenda cómo unirse a otras tablas. Conoce la diferencia entre una unión interna y una externa.
- Luego haga una inmersión profunda y aprenda los conceptos detrás de las bases de datos relacionales. Debe saber por qué las bases de datos tienen identificaciones / claves, la diferencia entre un hecho y una dimensión, por qué los índices son útiles y, al menos, recordó haber leído sobre las formas normales 1ª / 2ª / 3ª
- Si le gusta el diseño, obtenga una copia del kit de herramientas de almacén de datos de Kimball http://www.amazon.com/The-Data-W…. Gran descripción general del modelado dimensional con énfasis en diferentes verticales. Luego brisa a través de Kimball el kit de herramientas ETL después.
- Graduarse para aprender a crear tablas e índices temporales. Luego, cree una vista y continúe para descubrir cómo crear, insertar y actualizar tablas.
- Si realmente tiene hambre, descargue una copia de MySQL Community Server, configure un servidor de base de datos para usted mismo y comience.
3. Aprender desarrollo web básico
Esto puede parecer una bola extraña para el # 3, pero es el siguiente paso natural y una ventaja (o requisito) adicional, especialmente si desea trabajar en compañías de Internet para consumidores. Saber leer, o al menos familiarizarse vagamente con tecnologías / lenguajes / conceptos web comunes, como HTML y Javascript, le permitirá convertirse en un mejor analista en un mundo que cada vez está más basado en la web. Consigue un blog de wordpress, y ensucia un poco con él. Agregue un poco de seguimiento de Google Analytics a él. Obtenga información sobre el seguimiento de píxeles, etiquetas del lado del servidor y obtenga v post.
4. Sumérgete en una concentración.
Si usted clava el # 1 y el # 2 y se expone al # 3, habrá aprendido los fundamentos de un analista de datos básicos.
Hay un montón de caminos para elegir una vez que haya clavado los conceptos básicos. Cada uno de estos tiene su propio conjunto de tecnologías, herramientas y carreras. Algunos resaltados a continuación
– Colección + Almacenamiento . El enfoque está en los métodos óptimos para recopilar, almacenar y hacer que los datos sean accesibles para varias aplicaciones. Podría significar aprender unix, servidores web y expresiones regulares para los archivos de registro de minería. Podría significar aprender a diseñar un esquema en estrella, crear una base de datos NoSQL, así como determinar la solución óptima para insertar, actualizar, eliminar y extraer datos.
– Analítica . Enfoque aquí es aprender cómo cortar mejor los datos de los dados. Podría significar aprender Excel VBA para la automatización. Podría significar elegir una herramienta para una mejor visualización (Tableua) de datos o análisis estadístico (R, SPSS, SAS).
– Presentación. El foco está en la presentación de datos. Cuadros de mandos, informes, alertas, tablas de datos: lo que sea. Puede aprender a usar herramientas creadas para el análisis visual (como Tableua), concentrarse en desarrollar infografías pegadizas, usar una herramienta SaaS existente para la distribución de imágenes, o sumergirse en la programación y crear su propio conjunto de imágenes usando jquery / google charts api Como escribió Anon User, los libros de Edward Tufte son una manera fantástica de exponerse ligeramente a esta concentración.
– Programación. SQL es un lenguaje declarativo: usted le dice al motor de consultas lo que quiere y el motor se da cuenta del resto. La mayoría de los otros lenguajes de programación son lenguajes de procedimiento, usted les dice cómo obtener lo que quiere. Esto último es mucho más difícil de aprender, pero en algún momento, es posible que desee hacer algo más que simplemente escribir código SQL para influir en sus análisis, ya sea para aplicaciones de análisis de back-end o front-end. Si no tienes experiencia en programación formal, toma una clase. Si conoces algunos conceptos básicos o simplemente puedes hacer un friki con lo mejor de ellos, prueba tu suerte en uno de los lenguajes de programación más comúnmente disponibles. Aquí hay algunos a considerar
– Excel VBA. Viejo, pero si solo quiere automatizar las hojas de cálculo, no hay una manera de comenzar de menor fricción.
– PHP. Muerto simple. Toneladas de ejemplos. Utilizado en toda la web.
– Python. En segundo lugar a PHP. Hermoso. Cada vez es más común para las secuencias de comandos, aunque los marcos web son menos comunes que PHP
– Javascript. Un montón de ejemplos, y genial si quieres hacer visualizaciones front-end.
Matemáticas / Estadística. Encontrar patrones en los datos se basa al menos en una comprensión rudimentaria de las estadísticas. Convertirse en un experto en datos, desarrollar sofisticadas heurísticas de previsión / negociación de acciones / ofertas requerirá mucho más. Si está interesado en este componente, intente con R (o SAS / SPSS) para comenzar.
– Empresa. Hay muchas compañías que han ganado los mejores dólares vendiendo soluciones de informes empresariales de pleno derecho. Cognos, Business Objects, Microstrategy e Hyperion son algunos. Puede tener una carrera bien pagada que domine estas herramientas y la consultoría para las empresas que las necesitan. Estas herramientas cubren todas las partes del espectro de analistas de datos, pero cada vez son menos comunes en el análisis de datos de Internet de los consumidores porque son gastos y requieren equipos para mantenerlas.
Por último, a medida que se convierte en un analista más experimentado, no ignore el componente “negocio”. La inteligencia de negocios no es un problema técnico. Es un problema de socialización de datos. ¿Cómo se obtiene la información correcta para los tomadores de decisiones (humanos o máquinas) correctos en el momento adecuado para afectar el resultado deseado? Los piratas informáticos agregan valor a un negocio al dar a conocer información que se convierte en resultados comerciales, y cuanto mejor esté expuesto a un negocio en particular, más poder tendrá para afectar el producto final.