Ir al contenido principal

Entradas

¿Qué es y cómo se ocupa git?

1. ¿Qué son los sistemas de control de versiones? Los sistemas de control de versiones, son sistemas que va a guardando todos los cambios de un archivo o un conjunto de archivos a través del tiempo, así puedes leer tu código de versiones anteriores en versiones futuras del desarrollo, solemos usarlo con filas de codigo fuente de programas, pero en realidad esto se puede hacer con cualquier tipo de archivo. Si tu eres escritor tambien deberias usar git, sobre todo si usas lenguajes como LaTex, de esa forma llevas una especie de agenda que recuerda todos los cambios que has hecho durante la escritura de tus documentos. Igualmente si eres un diseñador gráfico, puedes llevar un control de versiones de tus bosquejos que has hecho por si se corrompe un archivo tener el respaldo de tus antiguas versiones y poder recuperarlas, yo por ejemplo, llevo controladas todas las versiones de mis post en un repositorio git. Implementar sistemas de control de versiones (VCS) e...
Entradas recientes

Machine Learning Parte 3: Pandas (1/3) Nivel Básico

Photo by Stephen Dawson on  Unsplash 0. Capítulos Datasets usados Iris dataset 1. Introducción En el mundo del Machine learning y Data Science, siempre estamos trabajando con datos, a veces no tienen en formato que queremos, otras veces están muy bien. Con numpy podemos trabajar con ellos, pero no podemos analizar apropiadamente nuestros datos, funciona mejor con números, pero siempre estamos necesitando usar datos mixolidios, es decir datos que contienen cadenas, números, fechas. Y numpy no nos ayuda con eso, hace el trabajo más difícil, necesitamos algo mas poderoso, y preparado para trabajar con cualquier tipo de dato, y estructurarlos de la manera en que queremos y abrir múltiples formatos de archivos de datos estructurados. Aquí entra Pandas, Pandas es el mejor amigo de científico de datos, ya que nos ayuda a manipular datos estructurados de manera facil y rapida, aqui no cubriré la totalidad de las funciones totales que es capaz de realizar Pandas, pero e...

Machine Learning Parte 2: Numpy

0. Capítulos anteriores 1. Introducción Numpy es actualmente la mejor manera de trabajar con Arrays, Vectores y Matrices, en Python. Es una de las librerías más eficientes en CPU para hacer operaciones con matrices y convertir Python en algo más parecido a Matlab y acelerar Python al máximo. Tiene un montón de funciones que me encantaría cubrir su totalidad, pero lamentablemente no me daría el tiempo a seguir la serie. Y es una opción fundamental para el Data Science en Python. Pero, ¿Por qué numpy es tan rápido y eficiente?, lo que pasa es que numpy usa un proceso que se llama “vectorización” en donde toma la lógica de tu código y la pre compila a C detrás de los telones. Eso nos otorga el poder de C pero en Python. Para instalar Numpy, abre una terminal en cualquier parte de tu sistema, y si tienes Python instalado escribe “ pip install numpy ” y con esto estarás listo para usar Numpy y aprovechar todo el poder que nos ofrece. Ahora lo siguiente que haremos es cre...