Archive des contenus du SDZ

Il y a des trous surprenants.

a marqué ce sujet comme résolu.

Salut,

En voulant accéder au contenu d’une news que j’ai rédigée il y a longtemps sur le Site du Zéro, je me suis rendu compte que ce n’est plus possible. L’URL, http://www.siteduzero.com/news-62-36225-deces-de-robin-milner.html, pointe maintenant vers une page vide, et à cause du fichier robots.txt mis depuis (j’imagine à la transition vers OpenClassRooms pour éviter de "diluer" le traffic ?) qui empêche l’archivage, ni Google ni Archive.org ne proposent d’accéder à la page gardée en cache.

Je trouve ça assez gênant : c’est tout un pan de travail que j’ai fourni à cette époque qui semble maintenant inaccessible (j’ai conservé certains brouillons de contenus sur mes machines, mais dans certains cas je ne me souviens même plus si ça correspond à des contenus qui ont été finalement publiés). Je pense que ça concerne d’autres membres de ZDS, et que coordonner quelque chose pourrait être possible, d’où ce topic.

Une autre raison pour laquelle ça concerne le ZDS c’est que ce site, par son choix d’être libre et construit sur la base la plus ouverte possible, est aussi un lieu idéal pour stocker des contenus que l’on veut garder ouverts sur le long terme. Ça interroge donc aussi sur le système d’archivage de ZDS et la question de savoir si les procédures sont en place, aujourd’hui, pour garantir la pérennité de ses contenus – et pas juste que les administrateurs peuvent reconstituer leur base SQL, s’ils en ont envie, en cas de problème technique.

Revenons au SDZ pour l’instant. Pour les tutoriels, il existe une archive de tutoriels, http://sdz.tdct.org/, qui a été mise à jour en juin 2013 et contient 774 tutoriels – dont tous les miens, en particulier. C’est super, et je me demande s’il serait possible de faire une ou des copies de cette page et les garder en ligne.

Mais qu’en est-il des autres contenus du SDZ, en particulier les news ? (Ceux qui ont vécu le site se souviendront que les news pouvaient aussi être des pavés au contenu travaillé). Et les topics de forum, ils sont gardés quelque part ?

Je me demande s’il ne serait pas utile de contacter OpenClassRooms pour leur demander un dump de ces contenus, et ensuite essayer de faire un peu de travail d’archivage. Est-ce qu’il y a d’autres gens qui sont concernés et intéressés ?

+8 -0

Mais qu’en est-il des autres contenus du SDZ, en particulier les news ? (Ceux qui ont vécu le site se souviendront que les news pouvaient aussi être des pavés au contenu travaillés). Et les topics de forum, ils sont gardés quelque part ?

Pour les news, nope. Pas d’archive connue de mémoire.

+1 -0

Chaque contenu publié sur zestedesavoir.com (contenus, donc pas commentaires, topics ou posts) est en réalité un repo Git sur nos serveurs. La possibilité technique d’y ajouter un remote et d’en pusher (au minimum) les commits ayant effectivement été publiés est aisée.

Les implications de faire ceci, en termes de droits d’auteur, de référencement, de volonté des auteurs et de l’association, faudra en discuter. Juste mes 2 centimes.

+0 -0

Chaque contenu publié sur zestedesavoir.com (contenus, donc pas commentaires, topics ou posts) est en réalité un repo Git sur nos serveurs. La possibilité technique d’y ajouter un remote et d’en pusher (au minimum) les commits ayant effectivement été publiés est aisée.

victor

Par contre si mes souvenirs sont bons les illustrations elles ne sont pas dans le gît, seul le contenu textuelle y est.

+0 -0

J’ai envoyé l’email ci-dessous à hello@openclassrooms – seule adresse de contact que j’ai pu trouver sur le site. Si quelqu’un connaît une meilleure adresse de contact (ou a une idée de comment relayer la question plus directement), je suis preneur.

Salut,

J’ai été très actif sur siteduzero.com il y a longtemps et je me rends compte maintenant que certains des contenus créés sur ce site sont perdus aujourd’hui, à cause du contenu actuel du fichier robots.txt de openclassrooms.com, https://openclassrooms.com/robots.txt , qui interdit la collecte des "news" de l’ancien site en particulier:

Disallow: /news-

Par exemple la news suivante semble inaccessible:

http://www.siteduzero.com/news-62-34313-p1-les-tutoriels-officiels-du-site-du-zero-sous-licence-creative-commons.html

Je suis moi-même l’auteur de news sur le SDZ et j’aimerais pouvoir retrouver les contenus que j’ai rédigés. Je pensais à l’époque que ce qui est sur internet serait toujours retrouvable dans le futur, et je n’ai pas fait de copie personnelle. Je pense par ailleurs qu’une archive publique de ces contenus pourrait intéresser de nombreuses autres personnes – il y a des liens qui pointent vers ces news dans tout le reste du web.

Serait-il possible d’obtenir une copie de sauvegarde de cette partie du site, ou alors de retirer cette mention de robots.txt pour pouvoir avoir accès au cache Google, pour pouvoir faire ce travail d’archivage ?

Je me doute bien que hello@openclassrooms.com n’est pas forcément le bon interlocuteur pour poser la question, mais je n’ai pas trouvé d’autre adresse email de contact sur le site. Pourriez-vous me rediriger vers la bonne personne ?

Merci par avance

+1 -0

À titre personnel :

  • pour le contenu de zds je ne sais pas ce qui est prévu, c’est à l’équipe technique de gerer mais c’est vrai qu’il faudrait bien y penser. Il me semble qu’il y a des dumps auto régulier.
  • pour le contenu du SDA, j’en envie de dire que c’est à la communauté de voir. De ce qu’a donné les imports initiales il semble que beaucoup de contenu si ils ne sont pas mit à jour perdent beaucoup d’intérêt. Cependant je ne vois pas d’objection, si la communauté est pour, que l’on fournisse une aide technique et matériel pour conserver et mettre à disposition des archives de sites et de contenu perdu (si la licence le permet, en prévenant en amont que c’est la pour archive).

Bref, pourquoi pas, moi je vois pas de problèmes avec ça si certains le veulent

Chaque contenu publié sur zestedesavoir.com (contenus, donc pas commentaires, topics ou posts) est en réalité un repo Git sur nos serveurs. La possibilité technique d’y ajouter un remote et d’en pusher (au minimum) les commits ayant effectivement été publiés est aisée.

victor

Par contre si mes souvenirs sont bons les illustrations elles ne sont pas dans le gît, seul le contenu textuelle y est.

Eskimon

Bien vu. Mais à nouveau, c’est techniquement aisé à balancer où que ce soit avec le repo. J’y passe volontiers un samedi et je sais que ce sera suffisant.

Mon intervention était principalement pour souligner que le caractère technique de la demande d’archivage (copie) externe des contenus actuels de zds est négligeable et n’est pas sujette à débat. ;)

+1 -0

Une autre raison pour laquelle ça concerne le ZDS c’est que ce site, par son choix d’être libre et construit sur la base la plus ouverte possible, est aussi un lieu idéal pour stocker des contenus que l’on veut garder ouverts sur le long terme.

Modulo la survie du site !

Sinon je comprends pas trop. Pourquoi est-qu’il y a un intérêt si grand pour héberger de vieux contenus plus maintenus à jour ? Est-ce que c’est juste de la nostalgie ?

Je crois que gasche parlait de news. Donc par définition du concept d’articles de news, des mises à jour n’ont pas lieu d’être.

Pour moi, rendre à nouveau accessibles des news qui ont disparu du Web a vraiment beaucoup d’intérêt.

+2 -0

Voici 4 news publiées sur ZdS :

D’après toi, après combien de mois ou années faut-il que ces contenus deviennent définitivement inaccessibles ? (C’est à dire on les supprime, et on fait en sorte qu’archive.org n’en propose pas de version archivée, etc.)

Si tu penses au contraire qu’ils doivent rester en ligne est-ce simplement par nostalgie, ou est-ce que tu penses qu’ils gardent un intérêt pour ZdS, pour leurs auteurs, pour des lecteurs potentiels ?

Les news de feu SdZ c’est pareil. Pour reprendre l’exemple de gasche, je sais que gasche a une expertise certaine dans certains domaines et je sais qu’il écrit des trucs de qualité. Je n’ai pas souvenir de sa news à propos du décès de Robin Milner, mais je trouve très dommage que plus personne au monde ne puisse tomber dessus, la lire, y apprendre des trucs. Et je pense que l’héberger sur ZdS serait une bonne chose si on réussissait à remettre la main dessus.

+4 -0

Je ne dis pas que ça a aucun intérêt, mais je suis étonné à quel point vous en portez.

Ces contenus ont été écrits pour ZdS, il me semble donc assez évident que ZdS les conserve. En revanche les contenus de SdZ n’ont a priori pas de raison évidente d’exister ici. C’est pour ça que je demande un exemple, afin de voir ce qui vous motive autant.

Je ne dis pas que ça a aucun intérêt, mais je suis étonné à quel point vous en portez.

Ces contenus ont été écrits pour ZdS, il me semble donc assez évident que ZdS les conserve. En revanche les contenus de SdZ n’ont a priori pas de raison évidente d’exister ici. C’est pour ça que je demande un exemple, afin de voir ce qui vous motive autant.

Holosmos

En fait, il y a deux choses dans la demande de Gasche. D’une part, il constate le soucis que certains contenus ne soient plus accéssibles (l’exemple donné étant OC), et d’autre part, si on récupère ces contenus, il faudrait un endroit pour assurer la pérennité de ces contenus (il propose zds).

Je trouve que que se poser la question de pourquoi sauvegarder ces contenus n’est pas vraiment intéressante. Aujourd’hui, on numérise énormement de chose dans ce soucis de sauvegarde, notamment des thèses que personne ne lira. Mais on le fait quand même, car peut-être un jour quelqu’un voudra la lire. Je pense que c’est un peu la même idée ici.

Ensuite je suis d’accord avec gasche pour dire que zds, de par sa politique sur les contenus est un bon endroit pour le faire. Mais cela rajoute une mission à zds qui n’était pas prévue au départ. Je pense donc que la décision finale devrait être donnée par la CA après consultation de la communauté et du staff technique.

Pour le SdZ, si des contenus de bonnes qualités sont proposés ici, il n’y a aucune raison de les refuser. Aujourd’hui encore, des tutos du SdZ sont proposés à la validation. Ils sont traités comme tous les autres contenus (donc nouvelle validation, et modifications éventuelles).

Après, nous ne sommes pas le service après-vente du SdZ, et si un contenu n’est plus d’actualité, je ne suis personnellement pas favorable à ce qu’il soit publié ici.

Pour les news du SdZ, j’imagine qu’une partie non-négligeable des news scientifiques sont encore valables. Les news informatiques étaient de mémoire plus souvent des choses du genre « version X.Y de untel logiciel », ce qui pour moi à peu d’intérêt à être publié ici (sauf exception ; j’ai en mémoire une news sur OCaml X.Y qui parlait très longuement des GADT, et rien que pour ça on ne peut pas l’exclure sans avoir le contenu sous les yeux).

Je dirai donc que c’est comme pour les tutos qui ont été importés à l’origine : au cas par cas. Par contre, un site mémoriel comme sdz.tdct pour les news me parait intéressant, mais pas forcement sur ZdS (un dépôt git public peut tout à fait faire l’affaire).

Pour le forum SdZ, je crois bien que tout est encore accessible, et j’ai facilement trouvé des messages de 2005 par un moteur de recherche.

Pour les archives des contenus ZdS, si c’est facile techniquement, ça me semble être une excellente idée. ;) J’ai conservé à titre personnel toutes les archives markdown + image des contenus de Mewtow, mais je les avais récupérées une par une, à la main.

N’oublions pas au passage la question des licences.


Bref, s’ils t’envoient un dump, je veux bien aider à faire le tri, j’ai du temps en ce moment. :)

+1 -0

Je trouve que que se poser la question de pourquoi sauvegarder ces contenus n’est pas vraiment intéressante. Aujourd’hui, on numérise énormement de chose dans ce soucis de sauvegarde, notamment des thèses que personne ne lira. Mais on le fait quand même, car peut-être un jour quelqu’un voudra la lire. Je pense que c’est un peu la même idée ici.

Ici personne n’héberge sa thèse, enfin pas à ma connaissance. ZdS n’a pas a priori pour vocation d’héberger des archives. Après j’ai rien contre dans l’absolu, mais vous pouvez pas contester que c’est un peu étonnant.

Ces contenus ont été écrits pour ZdS, il me semble donc assez évident que ZdS les conserve.

Je tentais de l’exprimer subtilement dans mon dernier message : ce n’est pas parce qu’ils ont été écrits pour ZdS ou publiés pour la première fois sur ZdS ou par nostalgie qu’on conserve les "vieilles" news. On les conserve parce qu’elles ont un intérêt bien au delà des 2 semaines qui suivent leur publication.

Les bibliothèques archivent les quotidiens d’actualité. C’est du savoir, de la connaissance, et le but de ZdS est de partager ceci, d’accueillir des contenus qui vont dans cette direction. Il ne fait aucun doute que certaines des news du SdZ n’ont pas d’intérêt pour le public de ZdS, par exemple au pif la news qui annonçait en 2004 que le SdZ fermait son serveur Natural Selection. Il ne fait aucun doute non plus que certaines des news du SdZ présentent beaucoup d’intérêt pour nos lecteurs. Il y a là-dedans du contenu francophone de qualité traitant de sujets bienvenus sur ZdS, et il est dommage que ce contenu ait disparu du web. Et s’il faut lui trouver une place sur le web, ZdS me semble un bon choix.

En revanche les contenus de SdZ n’ont a priori pas de raison évidente d’exister ici. C’est pour ça que je demande un exemple, afin de voir ce qui vous motive autant.

Ils ont une raison évidente d’exister ici : ils contribueraient à la mission de ZdS (les statuts disent a pour but de promouvoir le partage de connaissances). J’aimerais bien te donner un exemple, mais tu comprends certainement que c’est littéralement impossible.

+3 -0

(Note: quand j’ai décidé de créer le topic, la question pour moi n’était pas forcément de demander à ZDS d’héberger les contenus anciens du SDZ, mais plutôt de trouver des gens concernés aussi et de discuter de récupération et hébergement ensemble. Après si les gens qui font tourner le ZDS sont prêts à rendre cette archive disponible en ligne, comme des pages séparées du site ou intégrées, ça me paraît une excellente idée.)

Perso je pense que c’est totalement du ressort de la communauté.

Je vois plusieurs axes :

  • proposer une archive de tous nos contenus (ou peut être seulement ceux avec une licence cc) pour faciliter l’archivage par qui veut.
  • proposer un espace pour héberger/archiver du contenu externe (car on parle du sdz mais on pourrait parler de pdp ou n’importe quel blog). Contrairement à archive.org on pourrait le faire sur suggestions des membres.

Dans tous les cas je pense que ça rentre dans les statuts de l’association donc c’est à la communauté de décider. Évidemment le CA aura le dernier mot mais il n’y a pas de raison de le saisir sans que la communauté ai exprimé son avis. Donc perso je serai pour que tout le monde donne son avis sur ces deux points ou si des propositions liés. En fonction de ce qu’il en ressort on verra si il y a à faire exprimer le CA qui traditionnellement n’est la que pour trancher lorsqu’il n’y a pas de concencus

Je suis plutôt favorable à cette idée. Ça rentre de façon évidente dans les statuts de l’asso, et surtout ce serait une activité de l’asso/communauté qui nous dissocierait encore un petit peu plus d’un "banal" clone du SdZ.

J’aime l’idée de pouvoir me promener à travers les diverses périodes de la vie de la petite sphère autodidacte francophone.

+1 -0

Je pense qu’ils ont bel et bien une copie des dépêches de SdZ. Peu après la démission collective du staff d’OpenClassrooms, j’avais demandé à Marie à l’époque un dump des news que j’avais écrit. Elle m’a fourni cela, dans un fichier Word probablement fait main. Je doute que depuis ils aient décidé de tout mettre à la poubelle (cela ne doit pas être dur à stocker).

+0 -0
Connectez-vous pour pouvoir poster un message.
Connexion

Pas encore membre ?

Créez un compte en une minute pour profiter pleinement de toutes les fonctionnalités de Zeste de Savoir. Ici, tout est gratuit et sans publicité.
Créer un compte