Se inicia un nuevo curso en programación R para ciencia de datos.
Visión general :
Este curso hace que los participantes entiendan la programación R y cómo usar la programación R en el problema diario de la ciencia de datos. Comenzamos nuestro viaje con la comprensión de la perspectiva del programador de la programación en R y luego pasamos a usarlo para resolver problemas de ciencia de datos. Este curso tiene el mismo enfoque en la teoría y el laboratorio. Al final del curso, tendrá una comprensión adecuada y experiencia de trabajo de los siguientes temas en detalle.
- ¿Qué es un buen libro para aprender economía básica?
- ¿Qué libros son los mejores para la clase 12?
- ¿Cuáles son los mejores libros sobre cómo aprender a estudiar en un bar?
- ¿Cuál es el mejor libro de referencia para la clase de ciencias sociales 9?
- ¿Cuáles son algunos buenos libros sobre el aprendizaje?
DESCRIPCIÓN DEL CURSO :
Este curso iniciará su viaje hacia el mundo hermoso, emocionante, artístico, lógico y gratificante de la ciencia de datos. Para explorar la ciencia de datos, vamos a utilizar el lenguaje de programación R R es un software de código abierto para modelos matemáticos y estadísticos. El aprendizaje R y el modelado estadístico, por un lado, mejorarán la habilidad de resolución de problemas de la ciencia de datos, por otro lado, aumentarán la empleabilidad. Este es un curso muy bueno para pasar de principiante a medio.
Introducción básica a R
- Introducción a R
- Inconveniente de usar R
Obteniendo ayuda
- ayuda()
- Lista de correo
- R página web
- ? Operador
- ?? Operador
- Manos en el ejercicio
Estructura del programa en R
- Usando la consola r
- Scripting en R
Paquetes:
- Tipo de paquetes
- Introducción a los paquetes base R
- Introducción Paquete creado por el usuario
- Breve introducción a algunos paquetes creados por el usuario.
- Instalación del paquete
- Manos en el ejercicio
Tipo de datos basico
- Entero
- Numérico
- Personaje
- Lógico
- Complejo
- Tipo de datos especial
Tipo de datos por adelantado
- Vector
- Lista
- Matrices
- Formación
- Mesa
- Marco de datos
- Nombrar fila y columna de marco de datos y matriz
- Mano en el ejercicio
Bucles y condicionales.
- Uso de bucle y condicionales.
- Estructura de los condicionales.
- si declaración
- if, else declaración
- if, else if, else sentencia
- mientras bucle
- en bucle
- Repetir
- Mano en el ejercicio
Bucle avanzado
- aplicar()
- solicitud ()
- laaply ()
- tapply ()
- por()
- paquetes plyr
- funciones xxply
- Manos en ejercicio
Manipulación de texto en R
- Básico de cuerda
- Expresión regular en R
- sub()
- gsub ()
- grep ()
- substr ()
- strsplit ()
- regexpr ()
- gregexpr ()
3. Manos en el ejercicio
Funcion en r
- Introducción a la función en R
- Estructura de funcion
- Devolviendo un valor desde una función
- Devolviendo tipos de datos complejos desde una función
- Recursion
- Manos en ejercicio
Algunas funciones matematicas
- Encontrando el maximo maximo
- Funcion trigonometrica
- Funcion exponencial
- Cálculo logaritmo
- Encontrar valor absoluto
- Funcion factorial
- Funciones matemáticas acumulativas
- Conjuntos de Operación
- pmin ()
- pmax ()
- redondo()
- piso()
- techo ()
- sqrt ()
Resolución de tareas
Agregación de datos y unión en R:
- Introducción a la agregación de datos.
- Introducción a la unión de datos.
- Funciones de agregación.
- Funciones de unión de datos en R
Gráficos en R:
- Uso de gráficos y tablas.
- Elementos básicos del gráfico.
- Gráficos en paquete base R
- par()
- trama()
4. Elementos básicos de la generación de gráficos.
5. paquete ggplot2
6. Gramática de los gráficos.
7. Estructura en capas de ggplot2
8. Elementos básicos de ggplot2
- qplot ()
- ggplot ()
9. Algunos gráficos de uso y creación con el paquete Base R y ggplot2
- Gráfico de barras
- Gráfico de barras apiladas
- Histograma
- Gráfico de dispersión
- gráfico de burbujas
- Gráfico circular
- gráfico cuantil cuantil
- Diagrama de caja
- Area Plot
- Parcelas multiples
- Gráfico de líneas (serie de tiempo)
10. Escribiendo la trama a los archivos
11. Manos en el ejercicio
Conexión R con la base de datos
- Introducción a RDBMS
- Introducción a MySql
- R paquetes para conectarse a la base de datos
- Análisis de datos de datos de la base de datos.
- Manos en el ejercicio
Depuración en R
- Introducción a la depuración
- Algunas funciones útiles para depurar
- navegador()
- depurar()
- undebug ()
- depuración ()
- rastro()
- untrace ()
- setBreakPoint ()
- Manos en el ejercicio
Un proyecto simple sobre la base de la unión de datos, gráficos y agregación.
Preprocesamiento de datos en R
- Autenticidad de los datos.
- Filtrado de datos.
- Falta la imputación de datos.
- Fusión de datos
- Agregación de datos.
- Transformación de datos.
Características de los problemas estadísticos:
- Importancia de la media.
- Población y muestra.
- Hipótesis y casos de uso.
Introducción a la probabilidad:
- Introducción a la probabilidad clásica.
- Regla de la probabilidad clásica.
- Distribuciones de probabilidad
- Distribuciones de probabilidad discretas y continuas.
- Generación de números aleatorios.
- Fundamental de Población y muestras.
- Características de las muestras.
Intervalo de confianza :
- Introducción al intervalo de confianza.
- Introducción al nivel de significación.
- Cálculo del intervalo de confianza para la media.
- Cálculo del intervalo de confianza para la varianza.
Prueba de hipótesis :
- Introducción a la prueba de hipótesis e intervalo de confianza.
- Introducción a la hipótesis nula y alternativa.
- Hipótesis unilateral y bilateral.
- Introducción a la región crítica.
- Introducción al nivel de significación.
- Introducción a los valores de p.
- Pasos en la prueba de hipótesis.
- Prueba de hipótesis de una media de la muestra: prueba z-testt
- Prueba de hipótesis para la media de dos muestras: prueba-z prueba-t test-t pareada
- Prueba de hipótesis de una varianza muestral:
- Prueba de hipótesis de varianza de dos muestras.
- Prueba de Chi-squre para: Independence.Good of fit.
Un proyecto simple en la prueba de hipótesis.
Este curso será un requisito previo para muchos cursos futuros como SparkR, Aprendizaje automático con R, Análisis de la red Bayesiana en R, Aprendizaje profundo con R y muchos más …
¿Por qué aprender R?
La ciencia de los datos ha emergido para gobernar el mundo durante muchos años. La ciencia de datos de velocidad se está filtrando a los diferentes segmentos de negocios, académicos y de investigación, tengo en cuenta que, en algún momento u otro, todos estarán involucrados en la ejecución de algún tipo de análisis de datos utilizando alguna herramienta.
Para realizar cualquier tipo de análisis, R es una muy buena herramienta. Tiene más de 8000 paquetes para realizar diferentes tipos de análisis. Todos los marcos principales de Big Data tienen una interfaz con R, como Hadoop tiene R Hadoop y Apache Spark está incorporado con Rspark.
La mejor parte de R es una plataforma de código abierto. Solo descárguelo, instálelo, por supuesto, es muy fácil de instalar y comenzar a aprender. Muy pronto podría ser contratado por alguna compañía de análisis de datos o podría estar persiguiendo su educación de alto nivel en algún lugar, o al menos está utilizando los datos de su organización y tiene muchas ideas para sorprender a todos. Entonces, ¿por qué llegar tarde?
Proyectos:
Habrá tres proyectos, que se moverán de extremo a extremo.
Proyecto 1: Dados los datos de ventas, los participantes deben implementar el algoritmo del día a día de la ciencia de datos, como el filtrado, la agregación, la manipulación de fecha y hora y la aplicación de gráficos para comprender los patrones en las ventas de diferentes tiendas.
Proyecto 2: Dados los datos de la lente de la película, el participante debe implementar algoritmos de agrupación, agregación y creación de gráficos de datos para encontrar patrones e información significativos.
Proyecto 3: Dados los datos titánicos de Kaggle, los participantes deben implementar algoritmos de preprocesamiento y limpieza de datos. Después de eso, los participantes deben realizar pruebas de hipótesis en los datos para validar su hipótesis.
Las personas interesadas pueden unirse en:
Programación R