Amazon S3 y el almacenamiento en la nube de Amazon
Amazon S3, nombre que proviene de Amazon Simple Storage Service, destaca entre todas las opciones de almacenamiento en la nube de Amazon Web Services, también conocida como AWS, es un conjunto de herramientas y servicios de cloud computing de Amazon. Este servicio se lanzó oficialmente en 2006 y para junio de 2007 AWS ya contaba con una base de usuarios de aproximadamente 180 mil personas. Desde almacenamiento a la gestión de instancias, imágenes virtuales, desarrollo de aplicaciones móviles, etc., la nube de Amazon ha ido consolidándose a lo largo de los años como una de las más grandes del mercado. Sin embargo, otros mercados emergentes en estas plataformas han conseguido convertirse en dignos rivales, como Microsoft y su Azure.Amazon Web Services (AWS). Tal es su popularidad que en 2013 Amazon comunicó que este servicio había llegado a los dos billones de objetos almacenados. Pero, ¿por qué es tan popular? ¿Es un servicio de almacenamiento seguro? ¿Qué otros tipos de almacenamiento se ofrecen en AWS?
Amazon S3 es un servicio de almacenamiento en la nube basado en arquitectura de objetos. Estos objetos pueden ser distintos tipos de archivos de los que normalmente se encuentran en cualquier ordenador: documentos, archivos comprimidos zip o rar, archivos multimedia, etc. Todo esto se logra mediante un proceso de almacenamiento en buckets, o “cubos” en español, en los que cada usuario puede ir colocando los distintos datos y objetos que desee almacenar. Estos cubos se reparten por la estructura de centros de datos de Amazon de forma que cada usuario sólo puede acceder a sus cubos personales.
El acceso de la gestión del almacenamiento en Amazon S3 se realiza mediante servicios de interfaz web que presentan la información almacenada en los cubos. No obstante, esta interfaz no contiene funciones de orden o búsqueda dentro de los propios cubos. Esto puede causar problemas a la hora de localizar un archivo dentro cubos con un gran número de documentos. Además, el nombre de los cubos es global, por lo que al utilizar nombres simples como “abc”, “almacenamiento”, o “documentos”, lo más probable es que ya hayan sido usados y se tengan que realizar combinaciones particulares de caracteres.
Estos no son los mayores inconvenientes para los usuarios de Amazon S3, pero pueden resultar engorrosos para quienes se estén planteando comenzar a utilizarlo. Si quiere conocer un análisis detallado de las ventajas e inconvenientes de Amazon S3, consulte la Guía de Cloud Computing.
¿Qué posibilidades ofrece Amazon S3?
Aparte del servicio de almacenamiento básico para todo tipo de archivos, Amazon S3 ofrece estas opciones:
Alojamiento de sitios web.
En su significado original, el almacén de datos significa puramente el almacenaje de la información. No obstante, la descripción original de Bill Inmon, el padre del almacén de datos, dice lo siguiente: “el almacén de datos consiste en la recopilación de datos orientados, integrados, dependientes del tiempo, que suponen la base de las decisiones de gestión» (Inmon, 1992 – traducción propia).Almacenamiento de datos de aplicaciones y programas.
Integración con Una máquina virtual (VM, por el inglés Virtual Machine) o como hipervisor. Una VM es un programa de software que permite usar un sistema operativo diferente y realiza tareas tales como ejecutar aplicaciones y programas como si fuera otro ordenador. Es decir, es como si fuera un ordenador dentro de un ordenador. La máquina virtual está aislada del resto del sistema, lo que quiere decir que el software que contiene no puede escapar de ahí ni afectar al resto del ordenador.máquinas virtuales de Amazon EC2.
Redes de distribución de contenidos.
Una copia de seguridad (backup) es un duplicado de los datos que se hace para poder recuperarlos ante cualquier pérdida o incidente. Por lo tanto, las copias de seguridad forman una parte muy importante de la seguridad TIC de la empresa, ya que sin ellas una empresa podría quedarse sin sus datos. Por ello, en la norma ISO 27001, de seguridad informática y de información, exige que se hagan backups regularmente, que se comprueben que sean correctas y restaurables.Copias de seguridad y recuperación de desastres.
Análisis y almacenamiento de Big Data es el término utilizado para definir el cúmulo masivo de información cuyo tamaño va más allá de la capacidad de captura, almacenado, gestión y análisis de las herramientas utilizadas anteriormente. La gestión y análisis de enormes volúmenes de datos no pueden ser tratados de manera convencional. Las herramientas habituales no son capaces de realizar este propósito de forma satisfactoria por lo que los fabricantes de software sienten la necesidad de desarrollar nuevas herramientas capaces de soportar la información generada.Big Data.
Acceso de aplicaciones de terceros mediante Una interfaz de programación de aplicaciones (Application Programming Interface, API) hace posible que haya una interfaz entre sistemas. Se encarga de que las peticiones de una aplicación se comuniquen eficientemente a la otra. La aplicación solicitante consigue acceso a la información o funcionalidad de la otra.API.
La seguridad de los datos en Amazon S3 puede integrarse con algunas de las opciones de La gestión de identidad y acceso se conoce también por sus siglas en inglés, IAM (Identity and Access Management). IAM se encarga de la administración de usuarios y sus derechos de acceso dentro de la red (comercial). Con esta gestión, la empresa mantiene el control sobre qué usuarios inician sesión y realizan ediciones en los sistemas, aplicaciones, bases de datos, etc. Los usuarios pueden variar desde empleados a clientes o proveedores.gestión de identidad y acceso de AWS. El propio sistema también incluye un método de réplica, con los que los datos de cada cubo se copian en distintas localizaciones dentro de la red de centros de datos de Amazon. De esta forma cualquier fallo que produzca pérdida de información podrá ser subsanado con el acceso a las réplicas.
Otro aspecto de seguridad reside en la capacidad de Amazon S3 de guardar versiones anteriores de los documentos. De esta manera, se podrán recuperar los archivos almacenados en caso de borrado accidental o de fallo en el sistema. Además, Amazon S3 ofrece encriptación a través de protocolo HTTPS mediante La capa de conexión segura, o Secure Sockets Layer (SSL) en inglés, es un protocolo de seguridad tecnológica. El SSL se encarga de establecer un vínculo encriptado asegurando que todos los datos que se transmiten entre un servidor web y un navegador se mantienen íntegros y privados. Esto puede resultar muy útil en casos como, por ejemplo, de e-commerce en los que los clientes van a introducir sus datos sensibles como números de tarjetas bancarias, de identificación (pasaporte o dni), dirección, etc.SSL para evitar accesos no autorizados a la información.
Existen métodos para proteger la información y datos de la La nube (o cloud, en inglés) hace referencia a una nueva forma de implementación y de uso de software en las empresas, con el propósito de que todos los datos y aplicaciones se conviertan poco a poco en servicios online. Este modelo ha creado el concepto de movilidad total, otorgando al usuario la posibilidad de acceder a su información desde cualquier parte del mundo, con la única limitación de disponer de un dispositivo con acceso a internet.nube que pueden utilizarse en equipos locales, pero dependen del nivel de conocimiento de los usuarios. En la Guía de Cloud Computing puede encontrar una serie de recomendaciones de seguridad para evitar el acceso no autorizado a sus datos.
Otros tipos de almacenamiento de Amazon Web Services
Amazon S3 no es el único servicio de almacenamiento de archivos que ofrece AWS, ya que además incluye:
Amazon EBS: permite crear volúmenes de almacenamiento para realizar acciones en los mismos como ejecutar una Una base de datos es una herramienta que recopila datos, los organiza y los relaciona para que se pueda hacer una rápida búsqueda y recuperar con ayuda de un ordenador. Hoy en día, las bases de datos también sirven para desarrollar análisis. Las bases de datos más modernas tienen motores específicos para sacar informes de datos complejos.base de datos o crear un sistema de archivos. Este sistema puede integrarse con Amazon EC2 y está disponible en tres tipos de volúmenes: disco magnético, uso general mediante SSD e IOPS aprovisionadas mediante SSD.
Amazon Elastic File System: dedicado principalmente a ser utilizado por Amazon EC2 como repositorio de contenido o entornos de desarrollo de aplicaciones mediante Una máquina virtual (VM, por el inglés Virtual Machine) o como hipervisor. Una VM es un programa de software que permite usar un sistema operativo diferente y realiza tareas tales como ejecutar aplicaciones y programas como si fuera otro ordenador. Es decir, es como si fuera un ordenador dentro de un ordenador. La máquina virtual está aislada del resto del sistema, lo que quiere decir que el software que contiene no puede escapar de ahí ni afectar al resto del ordenador.máquinas virtuales.
Amazon Glacier: almacenamiento de bajo coste usado para archivar datos con poca frecuencia de acceso y para almacenar copias de seguridad. Suele tener un tiempo de recuperación de documentos alto ya que precisamente su objetivo no es acceder a los archivos almacenados continuamente.
AWS Storage Gateway: Servicio para la conexión de software instalado de forma local en una ubicación y cualquier tipo de almacenamiento de documentos en la nube de AWS.
En el siguiente vídeo (1:00:12 min, en inglés) se puede encontrar una explicación detallada de cada una de las opciones de almacenamiento de AWS, dirigida a profesionales de TIC, además de casos de éxito de empresas que trabajan ya con AWS:
No hay que olvidar que Amazon no es el único proveedor de servicios de almacenamiento en la nube para entornos empresariales, ya que empresas como Microsoft, Google, IBM o Dropbox también ofrecen sistemas de almacenamiento especializados. La Guía de Cloud Computing incluye una comparativa de estos sistemas y las diferentes opciones de almacenamiento para empresas.