Vérifier l’usage des galeries d’images de Zeste de Savoir

Pour s’assurer qu’elles ne servent pas à n’importe quoi

a marqué ce sujet comme résolu.

Salut tout le monde, enfin surtout l’équipe technique de ZdS pour ce sujet.

Je me posais tout à coup la question : Zeste de Savoir permet d’héberger des images arbitraires avec assez peu de limitations. Mais est-ce qu’on a un mécanisme qui permet de vérifier ce qui est fait avec cet hébergement ? En particulier qu’il ne sert pas à héberger des images illégales (ce qui pourrait valoir de sérieux ennuis à l’association et à son président).

Je vois plusieurs niveaux de vérification possible :

  1. Vérifier que chaque image hébergée (physiquement présente sur le disque) est bien disponible dans une galerie. C’est normalement le cas, sauf bug.
  2. Extraire la liste de toutes les images hébergées, et vérifier leur utilisation :
    • Dans les forums : c’est sans doute le plus simple, parce qu’on devrait pouvoir extraire l’information de présence facilement (elle est en base) et que ces forums sont publics (ou au moins accessible au staff, qui ferait cette vérification) ; on peut partir du principe qu’une image dans un forum est légitime, parce que sinon on s’en serait rendu compte.
    • Dans les MP : c’est techniquement aussi simple que les forums, mais comment vérifier qu’une image partagée en MP est légitime sans rompre la confidentialité des MP ?
    • Dans les contenus : c’est plus compliqué de récupérer l’information de présence, parce qu’éparpillée dans les dépôts Git ou les fichiers HTML des contenus. Mais là encore, une fois qu’on a l’information, on peut partir du principe qu’une image référencée dans un contenu publié est légitime. Pour celle des contenus non publiés, c’est plus délicat, mais à priori ça semble possible d’aller vérifier les images des contenus pas encore publiés.
  3. Une fois qu’on a récupéré toutes les références de ces images, on peut faire la différence avec les images réellement présentes en galerie et trouver toutes celles qui traînent sur les serveurs sans être utilisées nulle part sur Zeste de Savoir. Ici, on peut la jouer prudente et les vérifier, ou être brutal et tout supprimer (avec peut-être un délais de prévenance ?) en considérant que Zeste de Savoir n’a pas à servir d’hébergeur d’images externes1.

C’est clairement pas un sujet simple, ni d’un point de vue technique ni d’un point de vue fonctionnel, mais je pense que la question méritait d’être posée.


  1. Je dis ça sachant que j’ai dû me servir de ce cas d’utilisation plusieurs fois, mais je ne serais pas choqué de voir ces images là supprimées.

Je n’ai pas les accès techniques pour faire cela (bien que j’aurais les compétences), mais je plussoie l’initiative. En fait — pour des raisons qui peuvent se comprendre — je m’étais déjà fait la réflexion et c’était dans mes intentions que de lancer ce sujet. Merci de l’avoir fait ^^

En étant un peu malins, ça peut peut-être se faire techniquement avec une commande qui vérifie les fichiers et leur usage sur le site. Au delà d’une nécessaire réflexion à l’optimisation d’une telle opération, ça pourrait être relativement simple à faire pour une bonne partie du travail, à savoir les deux premiers points (vérifier que les fichiers existent et qu’ils sont utilisés quelque part sur ZdS ; puis fournir la liste des fichiers hébergés non-utilisés).

+2 -0

Vérifier que chaque image hébergée (physiquement présente sur le disque) est bien disponible dans une galerie. C’est normalement le cas, sauf bug.

Alors, ce n’est pas le cas et ce n’est pas un bug. On garde les images sur le disque lorsque qu’une image de galerie est mise à jour. Une des raisons est que tu peux avoir une version en ligne avec une image qui a été remplacée par une autre image dans la version brouillon. Il faut donc garder les deux et actuellement, on garde en vérité tout.

Je suis assez d’accord sur tout le reste cependant. Je n’ai aucun souci pour restreindre l’usage des images à des usages internes au site et éviter d’héberger des choses indues. La méthode générale donnée me semble bonne.

Pour information, la question avait déjà été discutée il y a peut-être un an par l’équipe de dév, et le consensus qui en était ressorti était que ce n’était pas techniquement un problème à l’heure actuelle : on a assez de place sur le disque et c’est pas gênant que ça grandisse lentement comme ça le fait actuellement.

+0 -0

Alors, ce n’est pas le cas et ce n’est pas un bug. On garde les images sur le disque lorsque qu’une image de galerie est mise à jour. Un des raisons est que tu peux avoir une version en ligne avec une image qui a été remplacée par une autre image dans la version brouillon. Il faut donc garder les deux et actuellement, on garde en vérité tout.

Aabu

OK, j’ai pensé à tester la suppression mais pas la mise à jour.

Du coup j’ai trouvé ce qui ressemble à un bug d’ici : si tu mets à jour une image dans la galerie puis que tu la supprimes, la dernière version est bien supprimée des médias (les URLs renvoient des 404) mais pas les versions « historiques ». Idéalement, une image mise à jour devrait permettre de voir toutes les versions dans l’interface et toutes les versions seraient supprimées si on la supprime (avec possibilité de supprimer seulement certaines versions) – je n’ai aucune idée de l’impact de ce genre de propositions, surtout pour une fonctionnalité qui doit être assez peu utilisée.

La question de la taille est intéressante : ça n’était pas tellement un point que je soulevais, mais si on a aucune croissance anormale (en nombre d’images ou en taille de stockage), c’est déjà un bon indicateur qu’on a pas d’abus massif à gérer.

Pour information, la question avait déjà été discutée il y a peut-être un an par l’équipe de dév, et le consensus qui en était ressorti était que ce n’était pas techniquement un problème à l’heure actuelle : on a assez de place sur le disque et c’est pas gênant que ça grandisse lentement comme ça le fait actuellement.

Attention que le souci principal relevé est moins celui d’espace disque que d’abus pour des contenus illégaux. Même si, ayant le statut d’hébergeur pour ces images, supprimer sur requête légale suffit à ne pas être inquiétés, on pourrait avoir envie de s’assurer qu’on ne diffuse pas ce genre de choses à notre insu (bien que vu le volume, ça semble non-trivial à la main).

+1 -0

@Amaury, oui, j’ai bien compris le souci, d’où le reste de mon message et le fait que le paragraphe que tu cites aborde explicitement l’aspect technique.

Du coup j’ai trouvé ce qui ressemble à un bug d’ici : si tu mets à jour une image dans la galerie puis que tu la supprimes, la dernière version est bien supprimée des médias (les URLs renvoient des 404) mais pas les versions « historiques ». Idéalement, une image mise à jour devrait permettre de voir toutes les versions dans l’interface et toutes les versions seraient supprimées si on la supprime (avec possibilité de supprimer seulement certaines versions) – je n’ai aucune idée de l’impact de ce genre de propositions, surtout pour une fonctionnalité qui doit être assez peu utilisée.

C’est une bonne idée. Actuellement, je ne crois pas que les galeries soit historicisées. On ne peut donc pas savoir facilement quelles sont les versions précédentes, et les supprimer. Si on historicisait, ça permettrait de faire beaucoup plus de choses.

+2 -0
Connectez-vous pour pouvoir poster un message.
Connexion

Pas encore membre ?

Créez un compte en une minute pour profiter pleinement de toutes les fonctionnalités de Zeste de Savoir. Ici, tout est gratuit et sans publicité.
Créer un compte