AWS S3 : tout savoir sur le stockage Cloud de Amazon Web Services

Bastien L. 17 juillet 2023 7 minutes de lecture Sécurité

AWS S3 ou Amazon Simple Storage Service est le service de stockage Cloud de Amazon Web Services (AWS). Découvrez tout ce que vous devez savoir.

Avec sa plateforme AWS, Amazon est parvenu à s’imposer en leader mondial du Cloud. Ce vaste écosystème regroupe de nombreux services Cloud différents pour différents cas d’usage : stockage de données, analyse Big Data, intelligence artificielle, développement de logiciels… parmi ces nombreux services, AWS S3 compte parmi les plus importants et massivement utilisés.

AWS S3 : qu’est-ce que c’est ?

AWS S3 est un service Cloud de stockage d’objets. Accessible par le biais d’une interface web, ce service permet de stocker, de protéger et de restaurer des données et des fichiers à partir de » Buckets » (sceaux).

Il suffit de créer un Bucket pour y stocker des fichiers au format objet. Grâce au Cloud, il est possible d’accéder aux données stockées dans les Buckets depuis n’importe quel appareil connecté à internet, à tout moment.

De nombreuses entreprises de toutes les industries utilisent AWS S3. Le service est notamment exploité pour l’hébergement de sites web, d’applications mobiles, pour l’archivage, pour les backups et la restauration de données, pour les applications d’entreprise et pour les appareils IoT.

Comment fonctionne AWS S3 ?

Le fonctionnement de S3 repose sur deux composants principaux : les Buckets et les objets. Ces deux éléments fonctionnent conjointement pour former le système de stockage.

Les objets AWS S3

Sur Amazon S3, un objet est un fichier de données ou une » entité fondamentale » selon AWS. Il peut s’agir de n’importe quel type de fichier : document, photo, vidéo…

Chaque objet est associé à une clé unique. Ces clés permettent d’identifier les objets et de les différentier au sein de l’environnement S3. La taille maximale d’un objet est de 160 GB en uploading, mais il existe divers outils AWS permettant de surmonter cette limite.

Les Buckets

Au sein d’un environnement S3, un objet est stocké dans un » Bucket « . Il s’agit d’un conteneur de stockage fondamental pour les objets. Il est possible de télécharger de multiples objets vers un Bucket en utilisant l’API Amazon S3.

Au total, il est possible de créer jusqu’à 100 Buckets par compte AWS. En demandant une augmentation de la limite, un utilisateur peut utiliser un maximum de 1000 Buckets. Toutefois, le nombre d’objets pouvant être stockés dans un Bucket n’est pas limité.

Lors de la création d’un Bucket, l’utilisateur choisit la région AWS où il sera stocké. Il est préférable de choisir la région la plus proche géographiquement, pour réduire la latence et les coûts au minimum.

La console AWS S3

Grâce à la Console AWS S3, il est très facile de gérer des objets et des buckets à partir de la Console de Gestion AWS. Cette interface est intuitive et graphique, et permet d’interagir aisément avec les services.

À partir de cette console, il est possible de créer, de configurer et de gérer un Bucket. De même, on peut télécharger, uploader et gérer des objets à stocker.

Cette console permet aussi d’organiser le stockage en utilisant une hiérarchie logique basée sur des préfixes et des délimiteurs de mots clés. Ainsi, les données sont organisées de manière structurée et il est plus simple de localiser des fichiers. Des permissions d’accès peuvent aussi être attribuées.

Quels sont les avantages de AWS S3 ?

Amazon S3 présente de nombreux avantages, ce qui explique sa popularité. Il s’agit d’une solution de stockage à la fois simple et solide.

Élasticité

L’un de ses points forts est son élasticité. Il n’y a pas de limite fixe en termes de capacité de stockage et de transfert de données. Les utilisateurs payent uniquement pour les ressources dont ils se servent, sans frais cachés. Il est donc très facile d’étendre ou de réduire les ressources de stockage en fonction des fluctuations de besoins.

Disponibilité

Autre avantage : la disponibilité du service. Selon Amazon, S3 est conçu pour une offrir » une disponibilité de 99.999999999% « . Les objets S3 sont automatiquement dupliqués sur de multiples serveurs, ce qui réduit le risque de panne au maximum.

Il s’agit par ailleurs d’une solution de stockage économique. Les données peuvent être organisées dans différentes classes de stockage, en fonction de la fréquence à laquelle l’utilisateur a besoin d’y accéder.

La classe de stockage la plus chère est réservée aux données nécessitant un accès fréquent et immédiat. Au contraire, le niveau le moins onéreux est dédié aux données auxquelles il n’y a quasiment jamais besoin d’accéder. À tout moment, il est possible de déplacer les fichiers dans une classe moins chère si elles perdent en importance.

Versioning et Sécurité

La fonctionnalité de » versioning « est également très pratique, puisqu’elle permet de stocker plusieurs versions d’un même objet dans un même Bucket. Ceci permet de restaurer un fichier en cas de suppression accidentelle, ou de récupérer une version antérieure.

Enfin, la sécurité est au rendez-vous. De nombreuses fonctionnalités de chiffrement des données et de gestion permettent d’empêcher toute intrusion dans l’environnement S3.

Par défaut, les employés d’une entreprise n’ont accès qu’aux Buckets et objets qu’ils créent. Les permissions peuvent ensuite être customisées. En outre, l’authentification multi-facteur permet de sécuriser l’accès encore davantage.

Quels sont les inconvénients de AWS S3 ?

Avant de choisir d’utiliser Amazon S3 en production, il faut tenir compte de ces inconvénients.

Coûts élevés à l’échelle en cas de mauvaise gestion

Le modèle de tarification de S3 repose sur le paiement à l’utilisation. Cela fonctionne pour de petites quantités de dossiers, mais le coût augmente à mesure que le S3 sert à la production et que les dossiers s’accumulent dans les différents compartiments. Au fil du temps, le coût du stockage et du transfert réseau hors de S3 vers les utilisateurs finaux peut monter en flèche.

Pour contourner ce problème, il faut envisager de mettre en place des règles de cycle de vie pour les buckets. De cette façon, vous ne stockez que les données qui vous intéressent, et tout le reste est automatiquement supprimé.

Un modèle de classe de stockage compliqué

S3 offre un certain nombre de classes de stockage parmi lesquelles vous pouvez choisir. Bien qu’il soit utile d’avoir plusieurs options pour différents cas d’utilisation, il peut être difficile de comprendre quelle classe de stockage convient le mieux à chaque tâche.

Certaines classes de stockage incluent également une durée de stockage minimale. Cela signifie qu’il faut payer plus cher pour supprimer ou déplacer des fichiers avant une certaine durée minimale. Cela crée des complications tant au niveau de la facturation que de la logique lors de la création de systèmes sans serveur.

Un bucket AWS S3 mal réglé dévoile les données des fumeurs de cannabis

Une étourderie liée à la consommation de stupéfiants ? Les chercheurs de vpnMentor ont découvert un bucket AWS S3 mal sécurisé, exposant les données de dizaines de milliers de clients de dispensaires de cannabis américains. Une fuite de données dramatique qui pourrait mener au licenciement de certaines victimes…

Alors qu’ils menaient un projet de cartographie du web, les chercheurs Noam Rotem et Ran Locar de vpnMentor ont fait une étrange découverte. Celle d’un bucket de stockage Amazon Web Services S3 mal sécurisé, contenant les données collectées par un système de point de vente utilisé par de nombreux dispensaires de cannabis américains.

En menant l’enquête, les chercheurs ont déterminé que cette base de données appartient à THSuite : une entreprise basée à Seattle qui fournit son logiciel à toute l’industrie américaine du cannabis. Parmi les différents dispensaires affectés par cette fuite, vpnMentor cite spécifiquement Amedicanna Dispensary dans le Maryland, Bloom Medicinals dans l’Ohio et Colorado Grow Company dans le Colorado.

Découvert le jour de Noël, ce bucket S3 contenait plus de 85 000 fichiers liés aux transactions réalisées par les dispensaires. Parmi les informations exposées, on compte notamment les données de commandes et d’inventaires.

Le plus inquiétant est que la database comprenait aussi les noms, numéros de téléphones, adresses email, date de naissance, adresses postales, numéros de passeports, et même les photos d’identité et signatures de plus de 30 000 clients et visiteurs de dispensaires. Dans certains cas, la date des achats, la quantité et même les variétés de cannabis achetées par le client ont été révélées.

Après avoir été averti par vpnMentor, THSuite a fermé sécurisé le bucket AWS S3 le 14 janvier 2020. De leur côté, les dispensaires s’activent à identifier tous les patients affectés par cette fuite de données afin de les notifier individuellement.

Comme l’explique vpnMentor, cette fuite de données est particulièrement dramatique en termes de confidentialité. Même si la loi américaine autorise l’usage médical ou récréatif du cannabis décrit ici, cette divulgation risque d’avoir des conséquences négatives sur le plan personnel et professionnel des victimes.

Rappelons en effet que de nombreuses entreprises américaines interdisent à leurs employés l’usage de cannabis. Certains clients de dispensaires pourraient donc perdre leur travail à cause de ce Data Leak, notamment s’ils travaillent pour une agence fédérale.

En outre, comme dans la plupart des cas de fuite de données, les cybercriminels pourraient utiliser les nombreuses informations exposées à des fins d’hameçonnage. Pour l’instant, on ignore si des acteurs malveillants ont eu accès à ce seau avant qu’il ne soit sécurisé.

La mauvaise configuration des buckets AWS S3 est un phénomène de plus en plus courant, à mesure que les entreprises se tournent vers le Cloud. Cette semaine, Microsoft a également admis avoir mal sécurisé une base de données Cloud laissant plus de 250 millions d’enregistrements exposés. Il est essentiel que les entreprises comprennent les risques liés à l’utilisation du Cloud, et apprennent à mieux gérer leurs buckets S3 et autres bases de données sur le nuage…

Les catégories de stockage Amazon S3

Amazon S3 se décline en sept classes de stockage :

Standard est adapté aux données fréquemment consultées qui doivent être livrées avec une faible latence et un débit élevé. S3 Standard cible les applications, les sites web dynamiques, la distribution de contenu et les charges de travail big data.
Intelligent-Tiering convient mieux aux données dont les besoins d’accès sont changeants ou inconnus. S3 Intelligent-Tiering comporte quatre niveaux d’accès différents : Accès fréquent, Accès peu fréquent (IA), Archive et Archive profonde.
Standard-IA offre un prix de stockage plus bas pour les données qui sont moins souvent nécessaires, mais qui doivent être rapidement accessibles. Ce niveau peut être utilisé pour les sauvegardes, la DR et le stockage de données à long terme.
One Zone-IA a été conçu pour les données qui ne sont pas utilisées fréquemment, mais qui doivent être accessibles rapidement lorsqu’elles sont nécessaires. L’utilisation de S3 One Zone-IA permet d’accéder à des données rarement utilisées sans avoir besoin d’une résilience.
Glacier est l’option de stockage la moins chère de S3. Cependant, cette solution a été spécialement conçue pour le stockage d’archives, car l’accès aux données est plus long. Glacier offre des taux de récupération variables, allant de quelques minutes à quelques heures.
Glacier Deep Archive est l’option de stockage la moins chère de S3. Il permet de conserver des données auxquelles on ne doit accéder qu’une ou deux fois par an.
Outposts ajoute les fonctionnalités de stockage d’objets et les API de S3 à un environnement AWS Outposts sur site.