Bénéficiant de la 2012 Numéro NAR serveur Web & une tasse de café

Dans la chasse quelque chose à option pour la pointe de cette semaine, J'ai remarqué que Nucleic Acids Research avaient sorti leur 2012 Serveur émission Web Retour en Juillet. Comme beaucoup d'entre vous sont peut-être au courant, la revue Nucleic Acids Research est un forum où les développeurs peuvent présenter des papiers biologie computationnelle qui décrivent le développement d'algorithmes biologiquement pertinentes, utilisation nouvelle des algorithmes existants, ou ce rapport, le développement de bases de données biologiques & leur utilisation. Le problème de serveur web est un numéro spécial annuel axé spécifiquement sur les ressources de logiciels basés sur le Web pour l'analyse et la visualisation des données de biologie moléculaire.

Cette année marque la 10e édition serveur web & J'ai décidé de le vérifier. Afin de consacrer toute son attention à la question, J'ai commencé par me verser une tasse de café dans l'un de mes préférés tasses, ce qui en fait en quelque sorte le goûter mieux. Puis je me mets à apprécier la question – Chaque année, je commence toujours par la lecture l'éditorial d'ouverture & puis l'article sur le répertoire bioinformatique liens. L'éditorial explique habituellement une attention particulière à la question (cette année, c'est l'analyse des données de séquençage de prochaine génération), et est écrit par le rédacteur en chef de l'émission, Gary Benson. Pour moi, l'éditorial donne le ton de la question, pour ainsi dire.

Ensuite, je consomme de l'article répertoire, avec quelques gorgées de mon java. Ce qui m'intéresse dans l'article est multiple. Le premier est la discussion des tendances qu'ils voient dans le développement d'outils et de ressources, ce qui est important pour nous ici à OpenHelix. Figure 6 offre un regard intéressant sur les catégories et les chefs de ressources de chaque émission annuelle – Je suis curieux de savoir pourquoi tous sauf un déclin catégorie 2008. Tableau 1 fournit également des données intéressantes sur les tendances d'outils.

Je suis également intéressé par le contenu de la liste se – c'est une grande liste en cours d'élaboration par les gens que nous avons beaucoup de respect pour. J'ai été particulièrement intéressé par cette phrase de leur article:

“L'annuaire Bioinformatique Liens a également lancé curation active de son contenu, en supprimant le contenu morts et corriger les erreurs de contenu, ce qui a entraîné plus précis, bien que de temps en temps les petits comptes pour 2012.”

C'est moi qui souligne dans la citation ci-dessus. À mon avis, c'est un aspect très important de toute la liste. Si vous vous souvenez, Mary affiché sur l'idée de “Avis de décès pour les outils de la bioinformatique.” et a lancé un Biostar poste de recueillir cette information. Le poste BioStar généré commentaire significative & dirait qu'il a peut-être contribué à inspirer l'équipe Bioinformatique Liens Annuaire, d'après les commentaires. Mais il est logique que vous avez besoin non seulement de recueillir des informations, mais de continuer à maintenir et à filtrer ces données de sorte qu'il demeure pertinent – Je veux dire si la forêt est encombré de bois mort, l'utilité “arbres vivants” (ok, les ressources) sont obscurcies par les utilisateurs, droit?

Le problème est que le maintien de toute la liste (ou de la documentation ou des tutoriels, etc) up-to-date est un dur, l'activité de main-d'œuvre. Ici, à OpenHelix nous gardons aussi une liste de biologie ressources importantes qui peuvent être recherchées à travers gratuitement, sans vous inscrire, de notre Page d'accueil. Nous avons actuellement un stage d'été l'abattage à travers une liste de plus de 5,000 ressources et des outils que nous connaissons. Elle est d'éliminer les doublons dans notre base de données en trouvant et en recueillant des URL de remplacement – il est étonnant de voir combien de ressources ont entrées multiples, chacun avec leur propre URL. Mais différentes portes ne font pas une ressource différente ou d'utilité si nous éliminons les former notre liste. Puis nous aborderons les ressources morts, les annonces qui vient de passer à un petit outil interne à une ressource principale, ou à la recherche pré-formaté pour quelque chose PubMed.

Créer et maintenir une liste de haute qualité n'est pas un effort insignifiant. Dans leur document de l'équipe Bioinformatique Annuaire Liens décrit comme un courant restant “défi pour l'avenir” et dit:

“Bien que nécessaire pour rester à jour et de faire progresser l'utilité du Répertoire de Bioinformatique Liens, ces améliorations ne se révéler utile s'il est piloté par la communauté. En tant que référentiel axé sur la collectivité, tout le monde dans le milieu de la recherche ou de la bio-informatique a la possibilité de contribuer à faire de la collecte meilleure et plus significative. “

Je souhaite vraiment leur meilleure chance à “curation communauté” que beaucoup de ressources ont eu dans le passé, & Espérons qu'ils réussiront. Dans notre expérience, il fonctionne mieux avec stable, un financement suffisant, car comme on dit: “vous obtenez ce que vous payez”.

OK, prochain post sera consacré aux ressources réelles dans le numéro de serveur Web, Je vous promets! :)

Liens rapides:

2012 Numéro NAR serveur Web: http://nar.oxfordjournals.org/content/40/W1.toc

Bioinformatique Liens Annuaire: http://bioinformatics.ca/links_directory/

Page d'accueil OpenHelix & Portail de recherche: http://www.openhelix.com

Références:
Gary Benson (2012). Éditorial: Nucleic Acids Research NUMÉRO ANNUEL AU SERVEUR WEB 2012 Nucleic Acids Research, 40 (W1) DOI: 10.1093/nar/gks607

Michelle D. Fathoms, David Yim, Winston Yeung, & B. F. Francis Ouellette (2012). Une décennie de mises à jour du serveur web dans le répertoire bioinformatique liens: 2003-2012 Nucleic Acids Research, 40 (W1) DOI: 10.1093/nar/gks632