Tag Archives: galaxie

SNPpets_2

SNPpets vendredi

Les SNPpets de cette semaine offrent à la fois la science et l'humour. Je pense que les gens deviennent un peu punchy autour des vacances / fin du semestre. Il ya des logiciels pour l'assemblage, un réseau de bio-informatique pour les thèmes africains, bioéthique de l'édition de gène, le cancer et la médecine personnalisée, Dilbert commentaires sur les grandes données et la santé, des outils intéressants pour les espaces ouverts- et de la médecine fondée sur les preuves, concepts sur le microbiome et un voyage métagénomique. La plupart chose curieuse cette semaine: le poème de la souris construits entièrement à partir des titres de papier.


SNPpets_2Bienvenue à notre collection vendredi lien fonction: SNPpets. Au cours de la semaine, nous avons rencontré beaucoup de liens et de lectures qui nous paraissent intéressants, mais ne pas se rendre à un billet de blog. Ici, ils sont pour votre plaisir…


SNPpets_2

SNPpets vendredi

This week’s SNPpets include a dinoflagellate genome; artificial base pairs in use; the relative joy of entrepreneurship graphed; cachés Galaxy caractéristiques; free image resources from NIH; new and updated tools for various purposes–comme toujours; a trait-matching challenge; and veterans who continue to do service by offering their DNA to researchers. Oddest thing: an ear built with van Gogh’s DNA. Et plus….


SNPpets_2Bienvenue à notre collection vendredi lien fonction: SNPpets. Au cours de la semaine, nous avons rencontré beaucoup de liens et de lectures qui nous paraissent intéressants, mais ne pas se rendre à un billet de blog. Ici, ils sont pour votre plaisir…


SNPpets_2

SNPpets vendredi

This week’s SNPpets include a FlyBook from FlyBase; deep thoughts on the cloud; “Sequence to Medical Phenotypes” logiciel; DNA.land relaunching; reference genomes info; updated feature in ExAC; legal looking at “secret DNA computer source code” and secret DNA to thwart art theives; Rabbit Turds at Galaxy (vraiment); bad documentation behavior. Also good communication behavior for genetic counselors. Et plus….


SNPpets_2Bienvenue à notre collection vendredi lien fonction: SNPpets. Au cours de la semaine, nous avons rencontré beaucoup de liens et de lectures qui nous paraissent intéressants, mais ne pas se rendre à un billet de blog. Ici, ils sont pour votre plaisir…


dna_cutting_with_scissors_hr-150x150

SNPpets vendredi

Everybody was full of vim and vigor this week, and a lot of great things were going around. Oddest thing was “fitbit cages for laboratory mice”. But I can see the value. Most heated post will probably be “Myths of Bioinformatics Software.” Other things included recommended data repositories from @PLOS journals, sequencing kids’ génomes, non-coding variants affecting drug activity, a new LD tool, DNA contamination issues, cancer data challenge, microbial databases (y compris les IMG that we love), Galaxy entretiens, et plus.


Bienvenue à notre collection vendredi lien fonction: SNPpets. Au cours de la semaine, nous avons rencontré beaucoup de liens et de lectures qui nous paraissent intéressants, mais ne pas se rendre à un billet de blog. Ici, ils sont pour votre plaisir…


 

SNPpets vendredi

This week’s SNPpets include mining disease genes with PPI and co-regulation networks, DNA and the law, great posts on germline genetic engineering moratorium discussions, a bioinformatics “middle class”, new human genome assembly models, et plus….


Bienvenue à notre collection vendredi lien fonction: SNPpets. Au cours de la semaine, nous avons rencontré beaucoup de liens et de lectures qui nous paraissent intéressants, mais ne pas se rendre à un billet de blog. Ici, ils sont pour votre plaisir…

Astuce Vidéo de la semaine: monteurs de génomique et #Docker

L'automne dernier, il y avait un conseil que je ai fait sur Docker, qui a été de commencer à ramasser beaucoup de bavardages autour de la genoscenti. Il commençait à ressembler à une bonne solution pour certains des problèmes de reproductibilité et de la réutilisation des logiciels en génomique–conteneuriser il. Encadré it up, remettre au large. Il ya certainement beaucoup d'intérêt et de recours dans la communauté, mais il ya encore quelques problèmes à résoudre avec le déploiement de Docker partout. Cependant, mon impression est que l'équipe Docker et la communauté semble intéressé et actif dans l'évolution des outils pour être plus largement utile que possible.

Alors, quand ce tweet a roulé à travers la #bioinformatique colonne twitter sur mon Tweetdeck, Je étais heureux de voir cette causerie par Michael Barton (qui a poignée de twitter le meilleur dans le domaine: @ Bioinformatique). Ce est un excellent exemple de la façon dont Docker peut viser à certains des problèmes dans l'espace de l'outil bioinformatique. Ce ne est pas la seule option, ou le cours. Certaines ressources de workflow comme Galaxy peut couvrir d'autres caractéristiques de chercheurs en génomique’ besoins. Mais comme une solution générale aux problèmes de logiciel sont comparés et la distribution des récipients de travail complètes, Docker semble se développer en une stratégie très utile.

Voici la vidéo:

Bien que ce soit plus long que notre typique “Conseils”, Je vous recommande de tailler un certain temps pour voir si vous êtes nouveau à l'idée de Docker. Au cas où vous ne avez pas le temps en ce moment pour l'entretien, voici un résumé. Pour la première 10 minutes, il ya une introduction en douceur pour les nerds non-génomique de ce séquençage est comme en ce moment. Puis Michael décrit le fonctionnement de la littérature de l'assembleur–avec environ revendications qui terminent le “meilleure” assembleur que chaque nouveau document arrive. Cela inclut un échantillon des types de problèmes qui assembleurs essaient de se attaquer à des stratégies différentes.

Autour de 14min, nous commençons à regarder ce que ce est que d'être le chercheur qui a besoin d'accéder à un logiciel assembleur. Puis il décrit comment les différents groupes de laboratoire–comme des îles éloignées–peut instantanément envoyer leurs données de séquence autour d'aujourd'hui. Mais que les biologistes sont comme “débardeurs pour les données”: ils ont pour décharger, déballer, installer, essayer d'obtenir tous les bons morceaux ensemble pour le faire fonctionner dans un nouveau laboratoire. Nous faisons “rupture de charge” la science en ce moment. Ce était une évaluation vraiment fantastique de l'état d'avancement, Je pensais que.

Si vous êtes ok avec les autres pièces, vous pouvez passer à environ 16min, où nous arrivons à savoir sur un exemple précis des avantages de Docker pour ce type de recherche. Michael continue à décrire comment Docker l'a aidé à construire un système au catalogue et évaluer différents monteurs. Il a développé le projet appelé nucleotid.es (prononcé comme “nucléotides”), qu'il continue à décrire. Il offre des détails sur différents monteurs, qui ont été mis dans des conteneurs qui sont faciles d'accès et à utiliser pour comparer les différents logiciels. Il ya des exemples de repères, mais vous pouvez également utiliser ces conteneurs pour vos propres fins d'assemblage. Vous pouvez explorer le site pour plus de détails et un grand nombre de données sur les comparaisons assembleur qu'ils ont déjà. Un bon aperçu des raisons de le faire peut également être trouvé dans le blog là-bas: Pourquoi conteneurs d'utilisation des logiciels scientifiques?

À environ 25min, certaines des contraintes et problèmes auxquels ils sont notés. Montage Docker dans l'infrastructure existante, Inciter et aux développeurs de créer des conteneurs Docker, peut être questions. Mais les résultats–ayant une meilleure stratégie que la publication traditionnelle pour la reproductibilité, ayant un accès continu au logiciel, et le “déduplication d'agonie” semble être intéressant à étudier, à coup sûr. deduplication_of_agony Puis Barton décrit ce que le gazoduc pourrait ressembler pour un chercheur avec une nouvelle séquence–vous pouvez utiliser les données à partir d'une variété de monteurs de prendre des décisions sur la façon de procéder, plutôt que de passer au crible les documents ou tout simplement en utilisant ce que le laboratoire a fait à côté. Et si vous avez un nouveau assembleur, vous pouvez utiliser cette configuration pour référence aussi bien.

Donc, si vous avez entendu parler Docker, et ont été préoccupés par l'accès et de reproductibilité questions autour de données et logiciels génomique, jeter un oeil à cette vidéo. Il présente bien les problèmes auxquels nous sommes confrontés, et une solution possible, avec un exemple concret. Il peut y avoir d'autres méthodes utiles ainsi–comme offrant un portail central pour les utilisations d'accéder à plusieurs outils, comme AutoAsssemblyD a décrit–mais ce est vraiment pour un sous-ensemble d'utilisateurs différent. Mais pour le problème plus général de comparaisons de logiciels, analyse comparative, et l'accès aux outils bioinformatiques, Docker semble offrir une stratégie utile. Et je ne ai un rapide PubMed vérifier pour voir si Docker est percolation à travers le système de publication traditionnelle encore, et a constaté que ce est. Je ai trouvé que ballaxy (“une Galaxy-boîte à outils de workflow basé pour la bioinformatique structurale”) est offert comme une image Docker, ce qui signifie que d'avoir une bonne compréhension de Docker aller de l'avant peut vraiment être utile pour les utilisateurs de logiciels assez rapidement….

Liens rapides:

nucleotid.es: http://nucleotid.es

Docker: http://www.docker.com

Références (et dans ce cas le jeu de diapositives):



Et d'autres objets utiles et connexes de ce post:

Automatisation du processus de sélection d'un génome Assembleur, JGI Science Highlights. Octobre 17, 2014. http://jgi.doe.gov/automating-selection-process-genome-assembler/

Veras A., Pablo de Sá, Vasco Azevedo, Artur Silva, Rommel Ramos, Institut des sciences biologiques, Université Fédérale du Pará, Bethlehem, Para & Brésil (2013). AutoAssemblyD: un système d'interface graphique utilisateur pour plusieurs assembleurs du génome, Bioinformation, 9 (16) 840-841. DOI: http://dx.doi.org/10.6026/97320630009840

Hildebrandt A. K., D. Stockel, N. M. Pêcheur, L. de la Garza, J. Kruger, S. Nickels, M. Röttig, C. Net, M. Schumann, P. Thiel & H.-P. Lenhof & (2014). ballaxy: services Web pour la bioinformatique structurale, Bio-informatique, 31 (1) 121-122. DOI: http://dx.doi.org/10.1093/bioinformatics/btu574

Quelle est la réponse? (F1 de Biostars X version Galaxy!)

Offspring of original Biostars site, Galaxy Biostars replaces their support mailing list.

Descendants de place Biostars originale, Galaxy Biostars remplace leur soutien liste de diffusion.

En général, chaque semaine, nous mettons un poste de la site principal Biostars, qui répond à une certaine question ou offre discussion d'outils bio-informatiques ou des analyses dans de nombreux domaines. Mais cette semaine, je tiens à vous donner un look à la progéniture de Biostar–Biostar Galaxy!

J'appelle cela la F1 de Biostars x Galaxy, plutôt que la sexuée “fils de Galaxy”. Il ya un poste sur le site de support Galaxy Biostar qui décrit une transition loin de leur mailing-list soutien traditionnel à base de ce nouveau format. Je vais lier partie de cela ici, mais c'est long si vous devriez aller lire le tout là-bas.

Forum: Bienvenue sur Galaxy Biostar

Chère communauté Galaxy,
Galaxy a fait équipe avec Biostar pour créer un forum de support utilisateur Galaxy à https://biostar.usegalaxy.org!

Nous voulons créer un espace où les chercheurs utilisant Galaxy peuvent se réunir et de partager à la fois des conseils scientifique et pratique de l'aide de l'outil. Que ce soit sur usegalaxy.org, une Cloudman exemple, ou toute autre galaxie (public ou local), si vous avez quelque chose à dire au sujet de Utilisation de la galaxie, c'est l'endroit pour le faire!

[has a lot more detail–go read the whole thing over there]

Jennifer Hillman Jackson

Comme je l'ai signalé plus, Je me sers de listes de diffusion heureusement pour longtemps parce que c'est ce que nous avions. Mais je pense que c'est une excellente façon de passer à soutenir maintenant au lieu de listes de courriel. Allez le vérifier!

 

Astuce Vidéo de la semaine: liste des gènes associés à une maladie

Je suis actuellement à Puerto Varas, Chili lors d'un atelier sur la génomique de l'EMBO. L'atelier s'adresse principalement aux étudiants des cycles supérieurs et les instructeurs sont, pour la plupart, anciens du groupe Bork. J'ai donné un tutoriel sur les bases de données de la génomique.

De toute façon, les deux derniers jours de l'atelier est un défi, dans les équipes de 3-4 conseillé par un instructeur, les étudiants sont de développer une liste de gènes associés à l'épilepsie. Évidemment, ce pourrait être une tâche triviale, Il suffit d'aller à OMIM ou GeneCards et de saisir une liste. Mais ce défi leur demande d'aller derrière cela et utiliser les données disponibles et faire des prédictions. Mon équipe a tenté, sur ma suggestion, certaines techniques de remue-méninges pour assurer une solution plus créative que ce qu'ils pouvaient trouver individuellement ou tout simplement sauter dans la dynamique de groupe normales. Cela a semblé fonctionner, leur solution était très créative et nous savoir aujourd'hui comment cela a fonctionné.

C'était ma façon de dire à long, dans le processus que nous avons rencontré de nombreuses bases de données gène-maladie. ci-dessus, vous trouverez une vidéo d'associations de maladies gène de rat de RGD, souvent utilisé bien sûr pour étudier les associations de la maladie génétique humaines.

Ci-dessous vous trouverez une liste de quelques excellentes bases de données et de ressources pour trouver des listes similaires:

Base de données Association gène http://geneticassociationdb.nih.gov/

G2D http://g2d2.ogic.ca

OMIM http://www.omim.org

Maladies http://diseases.jensenlab.org /

GeneCards http://genecards.org

DisGeNET http://ibi.imim.es/web/DisGeNET/

Plusieurs ressources NCBI http://www.ncbi.nlm.nih.gov/guide/howto/find-gen-phen/

Les titres de navigateur UCSC Genome pour maladie et phénotype http://genome.ucsc.edu

Il existe plusieurs autres, je suis sûr, si vous avez un favori pas sur cette liste, s'il vous plaît commentaire.

Référence pour RGD:
Laulederkind S.J.F., Hayman G.T., Wang S.J., Smith J. R., Lowry T.F., Nigam R., Petri V., de Pons J., Dwinell M.R. & Shimoyama M. & (2013). La base de données Rat Genome 2013–des données, des outils et des utilisateurs, Briefings in Bioinformatics, 14 (4) 520-526. DOI:

Astuce Vidéo de la semaine: MetaPhlAn et Galaxy

CPB Utilisation Galaxy 2 à partir de Galaxy projet sur Vimeo.

pour le chargement et l'utilisation de types de données et la OpenHelix Galaxy tutoriel pour se familiariser avec l'interface de la galaxie et de l'utilisation.

analyse métagénomique peut être un peu intimidant parfois, mais il ya un bon nombre d'outils là-bas pour aider un chercheur en analyse. Génomes microbiens intégré à l'Institut Jane Goodall a quelques excellents outils tels que IMG/M et IMG HMP M. (OpenHelix tutoriel) Il ya d'autres excellents outils que je vous suggère de vérifier. QIIME est un excellent outil aussi.

Mais ce qui précède n'est pas en soi un tutoriel métagénomique, plutôt que c'est une courte screencast de la façon d'utiliser l'interface Galaxy pour le chargement de données et types de données. Pourquoi? Parce que un autre excellent ensemble d'outils à utiliser pour l'analyse métagénomique est MetaPhlAn du laboratoire Huttenhower à Harvard.

Les outils MetaPhlan peuvent être téléchargés et utilisés «hors ligne», mais ils ont aussi une excellente interface Galaxy aux outils. Si vous vous promenez à travers la Tutoriels MetaPhlAn sur leur site, y compris leur galaxie un module, Après vous être familiarisé avec Galaxy ci-dessus, qui devrait vous aider à démarrer sur un excellent analyse métagénomique.

Pour avoir une idée de ceux-ci et d'autres outils et workflows, vous pouvez naviguer à travers cet excellent jeu de diapositives de Surya Saha, associé de recherche à l'Université de Cornell, à partir de l'année dernière.

Liens rapides:

Galaxy

Nicola Segata, Levi Waldron, Annalisa Ballarini, Vagheesh NARASIMHAS, Olivier Jousson & Curtis Huttenhower (2012). Métagénomique profilage de la communauté microbienne en utilisant des gènes marqueurs spécifiques clade uniques Nature Methods (9), 811-814 : doi:10.1038/nmeth.2066

Astuce Vidéo de la semaine: Triovis pour les ensembles de données sur le génome de la famille

Je suis toujours intéressé par de nouvelles stratégies pour visualiser des données. Alors quand j'ai vu discussion au sujet d'un outil pour aider à analyser les données génomiques de la famille, Je suis allé jeter un oeil. Triovis est un nouvel outil logiciel qui offre beau visualisation et stratégies de filtrage pour explorer parent et des ensembles de données trio d'enfants. Ces ensembles de données deviennent de plus en plus commun que les familles cherchent des informations pour des situations médicales non caractérisées qui peuvent avoir une incidence sur leurs enfants. Mais ils sont largement utilisés déjà dans de nombreuses situations de recherche.

Triovis repose sur la commune VCF ou Variant Appel Format les fichiers qui sont générés à partir de données de séquençage. Vous pouvez avoir un regard sur les types d'informations qu'ils portent à l' 1000 projet Génomes site. Ces fichiers sont créés pour chaque parent et l'enfant dans une situation de trio, et puis ils sont visualisés avec Triovis de cette manière:

L'interface utilisateur se compose de cinq sections: le tableau principal (Figue. 1Une), les graphiques à barres de comptage des variantes mondiales (Figue. 1B), les curseurs de fréquence de variants (Figue. 1C), les curseurs de couverture (Figue. 1D) et la vue histogramme (Figue. 1E). Chaque section se concentre sur un aspect spécifique de données en trio et offre des fonctionnalités interactives spécifiques pour calibrer les seuils. Père, mère et l'enfant sont codés par couleur en vert, orange et bleu, respectivement.

Vous pouvez lire le journal pour plus de détails sur leurs objectifs et stratégies. Ils soulignent également certains 1000 Génomes des données de l'échantillon de projets que vous pouvez utiliser pour exécuter leur outil.

Mais je tiens aussi à féliciter les gens Triovis pour mettre un screencast de leur droit d'outil dans leur résumé. Ainsi, leur vidéo est ce que je voudrais que vous considérez comme le Conseil de la semaine cette semaine:

Triovis à partir de Ryo Sakai sur Vimeo.

En ce moment il n'y a pas une interface Web pour utiliser, mais j'ai remarqué dans leur article qu'ils ont l'intention de les intégrer dans Galaxy. Je pense que c'est une autre bonne idée de leur part.

Donc, si vous vous trouvez à explorer les ensembles de données de trio de la famille, envisager un oeil à Triovis.

Pointe du chapeau à Justin Johnson d'avoir attiré mon attention sur ce document et les ressources.

Liens rapides:

Logiciel Triovis: https://bitbucket.org/biovizleuven/triovis/wiki/Home

Triovis vidéo: http://vimeo.com/user6757771/triovis

Référence:

Résine, R., Sifrim, A., Vande Moere, A., & Aerts, J. (2013). Triovis: une approche de visualisation pour le filtrage des variantes génomiques des trios parents-enfants Bio-informatique DOI: 10.1093/bioinformatics/btt267