Almacenamiento

Hoy vamos a tener un podcast un poco especial ya que vamos a tener un monográfico de almacenamiento ya sea por bloques, por objetos o por ficheros.

Además de tener una cabina y de pensar qué tecnología vamos a utilizar podemos también pensar en si realmente es lo que necesitáis, en el capítulo de hoy nos vamos a cuestionar todas estas cosas.

[showhide type=»transcripcion» more_text=»Ver transcripción(%s más palabras)» less_text=»Esconder transcripción (%s menos palabras)»]

Transcripción

Hola a todos, yo soy Eduardo, hoy es 1 de Enero de 2017, es el capítulo número 6 del podcast y como ya dijimos que este año íbamos a hablar más de CPD, infraestructura y cloud ¿qué mejor forma de empezar el año que desde el propio CPD?

Así que aquí tenéis de fondo los servidores bufando y vamos a ir empezando.

—MUSICA—

¿Qué tal las uvas?, feliz año a todo el Mundo. Para este año que hoy empieza espero que todos os hayáis puesto metas para el próximo año distribuidas en micrometas para poder ir cumpliendo los objetivos de una forma más fácil, recordad que siempre es más fácil tareas pequeñas que las tareas grandes y si una tarea grande es divisible en tareas pequeñas mejor. Si queréis migrar vuestra infraestructura al cloud no penséis en migrar todo sino en migrar pequeñas porciones y al final tendréis todo migrado.

Hoy vamos a tener un podcast un poco especial ya que vamos a tener un monográfico de almacenamiento, una de las porciones de nuestra plataforma. Vamos a hablar de almaenamiento ya sea por bloques, por objetos o por ficheros.  Vamos a ver cómo planificar todo esto y cuando usar un tipo de almacenamiento u otro.

Si os interesa este tema ya sabéis, durante los próximos 30 minutos los podéis pasar conmigo y hablaremos sobre todo esto, así que si más dilación vamos a ir empezando el capítulo de hoy.

—MUSICA—

Si de una cosa podemos estar de acuerdo antes de nada es que la cantidad de datos almacenados se ha disparado en los últimos años y que nuestras necesidades de almacenamiento cada día son mayores, el crecimiento ha sido enorme, casi exponencial.

Por otro lado y por suerte el coste del almacenamiento ha bajado, aunque no tanto como la capacidad de generar información por parte de las empresas, pero ahora el giga tiene un coste menor que al de hace 3 ó 4 años desde luego.

Esto al final significa que el coste del almacenamiento en si para las empresas ha subido, pero no sólo el coste entendido como dinero sino la complejidad, a más datos más complejidad de gestión, y el almacenamiento para las empresas puede convertirse en un problema, claro que sí, y muchas empresas optan por externalizar esta parte de su infraestructura, porque no es sólo el coste de los discos duros, es el coste de las cabinas, de la gestión, del mantenimiento, etc…

Sólo tenemos que pensar en los usuarios finales, los propios usuarios finales utilizan cada día más almacenamiento y utilizan desde servicios como Dropbox o Google Drive, pero una empresa no puede permitirse sacar los datos fuera de España ni puede permitirse tener toda su información de forma descontrolada por ahí en sitios a los que se accede desde Internet, sin ningún tipo de seguridad, es de locos realmente hacer eso con los datos de una empresa.

Una empresa a diferencia de un usuario final no puede tener sus datos desperdigados por ahí y necesita una solución un poco más controlada o segura. Una solución para una empresa puede ser o bien un almacenamiento en su propias instalaciones, es decir, una cabina local, pero esto tiene el problema de la gestión de la cabina, otra opción sería levantar una línea dedicada o una conexión mpls o vpls contra un CPD donde se encuentren sus servicios gestionados por personal experto en ello, y una tercera opción para aquellas empresas donde la primera opcíón se vaya de precio que podría ser acceder a un almacenamiento en remoto vía vpn, esta última solución es muy interesante para empresas pequeñas y se podría conectar utilizando un pequeño router que hiciera la conexión.

—MUSICA—

Cómo se monta una cabina de almacenamiento local no tiene tampoco demasiado misterio si sabéis configurarla, el misterio está casi más en lo que no es la cabina, en la red. He visto muchas empresas con una red que bueno, la verdad es que da asquito verla, con muchísima pérdida de paquetes, segmentos duplicados, etc..

La red LAN de una empresa es algo que hay que cuidar muchísimo, sea una empresa grande o pequeña, las grandes normalmente disponen de mejor equipamiento y mejor cableado, pero hay muchas empresas pequeñas que todavía utilizan cable categoría 3, por favor, si sois de los que vivís así aún tirad el cable, ese cable no vale, hay que cambiarlo, es una inversión sí, pero el desgaste de la productividad y de vuestros empleados es muchísimo más caro que cambiar el cableado. Luego esos switches que hay por ahí, no se como definirlos, yo os recomendaría si necesitáis switches de 24 ó 48 bocas que pongáis unos Cisco 2960, no hace falta que sean nuevos, podéis comprarlos reacondicionados, pero son muy buenos equipos y van a durar muchísimos años sin problemas.

Si necesitáis equipos más grandes entiendo que ya tendréis a alguien que os lleve la red y si no llamadme.

En cuanto a una cabina local es importante que sepáis qué tipo de configuración queréis, si es fiberchannel la cosa se complicará si no necesitáis una super cabina, en fin es un tema complicado.

—MUSICA—

Si queréis externalizar o sacar fuera de la oficina la cabina y sois una empresa con una cierta envergadura podéis solicitar una linea mpls y conectar la cabina en un CPD externo a vuestra empresa, de forma que podáis incluir de forma lógica la cabina en vuestra red. O incluso os puede interesar no sacar el almacenamiento de vuestra oficina pero sí redundarlo fuera.

Otra solución, también muy interesante consiste en contratar un almacenamiento, un servicio, es decir, cierta cantidad de Gigas de almacenamiento y no una cabina en si y hacer la misma operación, es decir conectar vía mpls, esta es la solución más extendida y lo más común, porque podéis utilizar una cabina de gama alta sin tener que comprarla y hacer el desembolso necesario. Esto es posible porque en la misma cabina se definen varios puntos de montaje, uno por cliente, totalmente separados, ya os digo, esto es lo normal y es la única solución disponible en los sitios más conocidos y que debido a su tamaño enorme no ofrecen servicios personalizados a empresas pequeñas, como pequeñas me refiero a todas aquellas que vayan a facturar menos de 20 ó 30.000 euros al mes por el almacenamiento, es decir, el 99% de las empresas.

Y la última solución, para empresas más pequeñas consiste en tener una VPN a través de un router de no demasiado coste y que a grandes rasgos va a permitir lo mismo, pero con un rendimiento más bajo aunque suficiente para muchas empresas.

Bueno, ahora  vamos a pasar a hablar de los distintos tipos de almacenamiento que existen para que podáis evaluar el que más os interese.

—MUSICA—

Vamos a empezar por el almacenamiento por bloques, este es el almacenamiento por defecto en un disco duro en el que tenemos la información dividida por bloques y para recuperar un fichero al final tenemos que recuperar un conjunto de bloques.

El servicio que se consigue con un almacenamiento por bloques es un disco duro virtual en el que podemos almacenar nuestra información. Este es el tipo de almacenamiento más común que existe pues es el más sencillo de entender, no por ser el más fácil sino el que estamos más acostumbrados.

El almacenamiento por bloques nos permite pensar en el almacenamiento como en discos duros ya que el funcionamiento es básicamente ese, entonces si asignamos un almacenamiento por bloques a un servidor como unidad de disco el servidor es quien va a gestionarlo, puede formatearlo con el formato que desee, etc… para el usuario o el cliente final no es algo más complicado que un disco duro, ni más ni menos.

Ese almacenamiento puede estar en la misma red o en un CPD externo o en el cloud claro.

Así que como podéis ver este tipo de almacenamiento es sumamente fácil de explicar aun cliente pues es un disco duro, tal cual.

—MUSICA—

Ahora vamos a pasta a almacenamiento por ficheros, hablaríamos de NFS, de un almacenamiento jerárquico y mucho más fácil de gestionar para el cliente pues lo úncio que tiene que hacer es conectarse a la unidad y ya está.

Tipos de sistemas de ficheros pueden ser NFS (Network File System) o SMB (Server Message Block), para Unix y para Windows respectivamente.

La jerarquía por directorios de este tipo de almacenamiento nos permite hacer la típica comparación de carpetas directamente desde el almacenamiento, sin mediar servidor alguno como en el caso de almacenamiento por bloques.

Para el usuario la diferencia entre el almacenamiento por bloques y por ficheros es que el por bloques necesita para compartir un servidor y en el almacenamiento por ficheros no es necesario y sería como funciona Google Drive o Dropbox por sólo citar un par de los más conocidos. Ojo, que tenemos que estar conectados a esa red, no es un dropbox entendido como abro el móvil en cualquier sitio y entro, para eso tendríamos que montar otro tipo de soluciones, eso sólo sirve para compartir en la red, como el compartir en Windows de toda la vida.

Esto a nuestros clientes se les ofrece como carpetas compartidas directamente, ya no es un disco duro como antes sino que el nivel de abstracción sube un poco.

Muchos ahora estaréis pensando que qué tontería la diferencia, pero vosotros pensar que vamos a actualizar un fichero actualizado si actualizamos por ficheros vamos a copiar el fichero entero de nuevo, si lo hacemos por bloques sólo actualizaremos los bloques que hayan cambiado, y para un fichero de 2 Gigas no es moco de pavo esto.

—MUSICA—

Y ahora vamos a pasar al almacenamiento por objetos que es un tipo de almacenamiento que crea objetos y sus respectivos metadatos y lo que se gestiona son esos objetos.

Vamos a verlo con un ejemplo que será mucho más fácil. Vamos a imaginar que somos un periódico y tenemos muchísimas fotos almacenadas, pero claro, fotos almacenadas a lo bruto no nos valen para nada, entonces optamos por un almacenamiento por objetos en el que tenemos objetos, cada objeto es una foto y tenemos unos metadatos donde está el nombre de la foto, quien sale dentro, donde ha sido tomada, la fecha de la foto, quien ha hecho la foto, si tenemos derechos para esa foto, etc.. eso es un almacenamiento por objetos, creo que así con el ejemplo ha quedado muchísimo más claro.

—MUSICA—

La verdad es que sólo me queda un punto donde me gustaría incidir, y es que es posible que esto del almacenamiento no nos interese y ahora estemos utilizando un almacenamiento externo que haga que nuestro servicio funcione más lento y necesitemos un almacenamiento local.

No todo el Mundo necesita un almacenamiento que pueda crecer prácticamente hasta el infinito, o hasta que el número de bandejas que permita la cabina se acabe, también puede ser que necesitemos redundancia de nuestros datos o también puede ser que necesitemos reducir costes, pero no espacio.

O puede ser que alguien necesite tanta velocidad de escritura que un almacenamiento remoto no pueda dárselo, en ese caso necesitaremos discos locales.

Ahora ha salido un método de grabación de eventos deportivos donde se graba todo con unas 50 cámaras a la vez, perdonad, pero no me quedé con el dato exacto, el tema es que toda esa información se graba y en el caso que sea necesario repetir una jugada en 3D es necesario tratar todos esos ficheros de vídeo, en ese caso la cantidad de información es tan alta que una cabina no nos valdría y tenemos que hacerlo mediante discos de estado sólido locales.

Ya os he dicho antes, no hay solución perfecta para todos, en unos casos una cabina es algo perfecto, en otro caso la cabina no nos sirve, dependiendo el caso y de cada entorno, hay muchas soluciones y no dejéis que os vendan lo que no necesitáis.

—MUSICA—

[/showhide]