Sage conseil bioinformatique, Mais…

L'analyse bioinformatique est une technique puissante applicable à une grande variété de domaines, et l'objet de plus d'un billet de blog ici à OpenHelix. J'ai eu deux articles bioinformatique notamment sur mon bureau pour un couple de mois maintenant, d'attente pour moi d'être en mesure d'exprimer mes pensées sur les. Ils offrent de l'information à la fois long sur leur domaine d'intérêt particulier – prévoir soit impacts SNV ou des identités protéines – bioinformatique et de la sauge des conseils.

Le premier article “Utilisation de bio-informatique pour prédire l'impact fonctionnel de SNVs” est une grande revue des techniques de bio-informatique pour la cueillette des fonctionnellement importantes variantes seul nucléotide (SNVs, aussi parfois diversement dénommés SNP ou petits, Simple ou des polymorphismes de nucléotides simples) des millions de variantes candidat en cours d'identification de tous les jours. Dans l'introduction, les auteurs font un excellent travail d'expliquer les nombreuses façons dont SNVs peut avoir un impact, ainsi que la façon dont ces philosophies de base de l'impact peut être utilisée pour des analyses bio-informatique. Le document poursuit en décrivant les techniques classiques et bio-informatique pour prévoir l'impact de ces variations. C'est une lecture phénoménal pour la liste des ressources à elles seules, avec de nombreux algorithmes et des ressources précieuses et importantes cités. Nous avons tutoriels (ENCODE, OMIM, UCSC Genome Browser l', UniProtKB, Blosum et PAM, HGMD, JASPAR, Analyse en composantes principales, entropie relative, Profil d'EIPD, TRANSFAC, ) et billets de blogs (l' Catalogue des études publiées association pangénomique) décrivant plusieurs des mêmes ressources. En fait, cet article a inspiré au moins un de nos hebdomadaires conseils postés (Astuce de la semaine: SKIPPY w prédire variantes / épissage affecte). Le document passe ensuite à un “Buyer Beware” section qui offre des conseils judicieux – connaître les faiblesses, hypothèses, et des ressources que vous utilisez pour vos prédictions.

Le deuxième article est un article en accès ouvert de BioTechniques droit “quiproquos en protéomique“. Il offre un parcourt l'histoire de la spectrométrie de masse (MS) technologie et les normes techniques pour documenter la hausse utilisé pour l'identification des protéines dans des revues. L'article conclut également à la sauge des conseils bioinformatique, y compris cette citation:

chercheurs en protéomique devrait être en mesure de répondre aux questions clés, selon Giddings. "Que faites-vous fait sortir d'un moteur de recherche?»Dit-elle. "Quand peut-on y croire? Quand avez-vous besoin pour valider?"

Les deux articles donnent à penser que les chercheurs qui souhaitent utiliser les ressources de la bio-informatique dans leur recherche devrait étudier les fondements théoriques et les hypothèses de chaque outil avant de décider sur un outil à utiliser, Elle devrait ensuite aller à toutes les analyses avec un niveau d'incrédulité dans les résultats de l'outil. Cela sonne comme du bon sens, et fait de bons conseils théoriques.

TOUTEFOIS, le niveau de l'enquête qui est nécessaire pour vraiment connaître chaque outil et l'algorithme est beaucoup trop grand. Quant à moi, mon “pratiques” suggestion pour les chercheurs est un peu “filtrage contextuel”. Avant de plonger dans toutes les publications sur tous les outils possibles, simplement passer quelques minutes avec de la documentation – de la ressource FAQ, ou d'un intro tutoriel – nous avons un peu nous pouvons vous offrir :) – pour avoir une idée de ce que l'outil est d'environ & ce que vous pourriez être en mesure d'obtenir d'elle. Une fois que vous avez une idée générale de la façon d'aborder la ressource commence “claquement” à ce sujet à la légère. Un coup franc initiale de la tester les pneus d'un algorithme, base de données, ou une autre ressource peut être aussi facile que garder un “ensemble de test” sur la main en tout temps & il traverse tout nouvel outil que vous souhaitez utiliser. Assurez-vous que l'ensemble comprend une liste partielle de certaines protéines très connu / voies / SNP / etc. (tout ce que vous travailler sur & seront intéressés par l'analyse) et qu'il a quelques-uns des «douves» vos champs. Pensez à ce que vous vous attendez à retrouver à partir de votre jeu. Puis lancez votre testeur jeu grâce à tout nouvel outil vous envisagez d'utiliser dans votre recherche, et regardez vos résultats – sont-ils ce que vous savez qu'ils devraient être? Peuvent-ils gérer les douves, ou sont-ils briser? Comme un exemple, quand je m'approche d'une ressource nouvelle protéine d'interaction, Je vais utiliser une liste partielle des pièces pour certains aspects du cycle cellulaire de la levure, et inclure un ou deux des noms de gènes trait d'union. Si l'outil est bon, Je obtenir une liste complétée sans s'enlise sur la “bizarre” noms. Si elle tourbières, Je sais que la ressource ne peut pas être 100% élaboré pour la levure & peuvent avoir des problèmes avec d'autres espèces aussi bien. Si la liste complète des interacteurs revient avec un tas d'espace-poubelle protéines je commence enquêter sur quelles données sont inclus dans la ressource et si les paramètres peut être modifié pour obtenir de meilleures réponses. Puis, si les choses semblent toujours prometteurs avec l'outil, Je suis susceptible de creuser profondément dans la littérature, etc. pour l'outil – juste pour être sûr – parce que les auteurs de ces articles sont absolument raison, chassant de fausses pistes est cher, frustrant & beaucoup de temps. Il est étonnant de voir combien les citrons & tacots vous pouvez les mauvaises herbes avec un 5 minute bioinformatique pneus coup! :)

Je ne pense pas non exclusivement la responsabilité devrait être sur le dos de chaque utilisateur final – le développeur de ressources ne ont une certaine responsabilité pour rendre leur outil rigoureux et pour représenter avec exactitude ses capacités dans les publications et la documentation. Appels à code source ouvert peut aider à améliorer certains outils bioinformatiques, de sorte que l'éducation peut & sensibilisation – mais que la discussion devra attendre un autre jour…

Références: