Tag Archives: NCBI


Astuce Vidéo de la semaine: ProSplign in NCBI’s Genome Workbench


There are many tools at NCBI, with a huge range of functions. Littérature, données de séquence, les variations, la structure des protéines, chemicals and bioassays, et plus. It’s hard to keep track of what’s available. Their video tutorials are helping me to be aware of new tools, and new features within existing tools. Pour le Conseil de la semaine cette semaine, we’ll look at their recent video for ProSplign. It’s a tool that will help you align protein information to genomic sequences.

Bien que le Génome Workbench itself has been around for a while (we featured it as a tip it first in 2013), it is constantly underdevelopment, and new features are available regularly. And although this tip focuses on how to use the ProSplign piece, if you haven’t used it much it will help you to understand how a number of tools within the Workbench can be accessed. You can also see that Splign is available in the tool list–which is another NCBI tool for a similar type of process, but with mRNA sequences as the focus.

If you want to have a text-based type of walk-through instead, there is a page that will take you through the features (see the quick links below). And there are other videos that will help you to explore the Genome Workbench features as well–there’s a handy special playlist of just those vidéos. Subscribe to their YouTube channel for notices of their new items.

Quick link:

NCBI Génome Workbench: http://www.ncbi.nlm.nih.gov/tools/gbench/

Text-based tutorial page: https://www.ncbi.nlm.nih.gov/tools/gbench/tutorial13/


Kapustin, Y., Souvorov, A., Tatusova, T., & Lipman, D. (2008). Splign: algorithms for computing spliced alignments with identification of paralogs Biology Direct, 3 (1) DOI: 10.1186/1745-6150-3-20

NCBI staff (2016). Base de données des ressources du Centre national d'information sur la biotechnologie Nucleic Acids Research, 44 (D1) DOI: 10.1093/nar/gkv1290

Viral Genomes at NCBI

Astuce Vidéo de la semaine: Viral Resources at NCBI (including new #ZikaResearch module)

Viral Genomes at NCBIIt would be hard to escape hearing and reading about the recent drama about the Zika virus. But in terms of viral genomics, that only serves to highlight how important it is to deliver quality sequence information for researchers. So in a timely coincidence, a recent lecture for the CDC on the Viral Resources at NCBI was just made available.

The lecture by Rodney Brister provides an overview of the features of the site and explores ways to access the data with some tools they’ve had in place for a long time. He shows ways to quickly get to family members. Then he described a newer direction that they are taking that includes a separate feature accessed from the same homepage called the Virus Variation Resource (starts ~11min). If you click through you’ll see that there are modules for various viruses–et une Zika module just became available last week. So you can find sequences collected there, and also links to related health resources like the WHO and CDC relevant pages. (That’s not shown in the webinar, which was recorded in December 2015). He shows a dengue example that’s got some additional features too.

Il ya aussi une Retrovirus Resource disponibles (~25min in), which offers “specialized tools for the analysis of retroviral proteins and genomes”. And that’s the place to go if you want the HIV-1 specific module, it’s not with the others that I mentioned before.

It’s longer than our typical tips–but it’s worth exploring if you want to refine your skills at quickly getting to virus data and tools. Just a quick word about a question they had towards the end–about bacteriophage resources. There’s a resource I particularly like for phages, où vous pouvez trouver ici: http://www.phisite.org .

Note spéciale: if you intend to use the AmazonAWS services for any viral genome analysis, you should be aware of this.

Liens rapides:

Viral Resources at NCBI: http://www.ncbi.nlm.nih.gov/genome/viruses/

Virus Variation Resource: http://www.ncbi.nlm.nih.gov/genome/viruses/variation/

Zika module: http://www.ncbi.nlm.nih.gov/genome/viruses/variation/Zika/


Les lacunes, J., Ako-adjei, D., Comment, Y., & Blinkova, L'. (2014). NCBI Viral Genomes Resource Nucleic Acids Research, 43 (D1) DOI: 10.1093/nar/gku1207


SNPpets vendredi

This week’s SNPpets include a range of things, from Pardis Sabeti’s recovery from a serious accident to tardigrade genome drama. There are new databases and tools such as the GMO sequence tracker in the EU, to new uses of tools such as Docker, à explorer. Reports of a serious BLAST bug. A look at common spreadsheet formatting mistakes and some solutions. It’s not a gene-editing moratorium. Et plus.

SNPpets_2Bienvenue à notre collection vendredi lien fonction: SNPpets. Au cours de la semaine, nous avons rencontré beaucoup de liens et de lectures qui nous paraissent intéressants, mais ne pas se rendre à un billet de blog. Ici, ils sont pour votre plaisir…


Astuce Vidéo de la semaine: Explore Gene Pages at NCBI with Variation and Expression Information

NCBI has produced some of the most in-depth and reliable bioinformatic tools, in large part because they’ve been building them since the earliest days of the genomics era. ncbi_logo_black I once noted that I remember the oldest web interface, because it was one of the first places that I went for computational tools back in the day. Check out my post here with some of their older interfaces. I remember all of them.

But they don’t rest on their laurels. NCBI teams are always adding new tools, new features, and new data. Parfois, si, I think that people take them for granted. Or they only keep re-visiting things they know. So recently they asked me to do a walk-through video about how I use the tools, so that I can show people ways they can go further than they might realize. This week’s Video Tip of the Week shows how I can add and explore a lot of data on a Gene page, to examine additional features: variations and expression data, right in the sequence viewer. A lot of people may not even be aware these tracks exist.

This video provides a walk-through of how to explore variation data and expression data from Gene pages, using the sequence viewer that’s embedded right on the page. Enhance your understanding of your genes of interest quickly using these additional track options.

I hope this demonstrates how you can add more information to your genes of interest from gene pages, which you might already use. But now you can use them better. You can take advantage of the great depth at NCBI, while staying up-to-date on the tools.

Speaking of staying up-to-date, which is a big need in this field: you should definitely keep an eye out for new features from NCBI. My favorite way is the liste de diffusion annonce, because it has details of new stuff, nos prochains webinaires, publication de données, etc. But you can also watch their blog and twitter for new information all the time. They’ve been doing a lot of outreach–webinaires, quick videos, et plus. You should sign up to be notified, so you can stay current with the best data and tools. Vérifiez their learning/webinars pages to see what I mean.

We are planning another video, and we’d love any feedback you have on this one.

Liens rapides:

NCBI Gene (subject of the video): https://www.ncbi.nlm.nih.gov/gene/

NCBI-announce mailing list: http://www.ncbi.nlm.nih.gov/mailman/listinfo/ncbi-announce

NCBI Insights blog: http://ncbiinsights.ncbi.nlm.nih.gov

NCBI twitter: @ NCBI

Learn (see webinars link): https://www.ncbi.nlm.nih.gov/home/learn.shtml

NCBI YouTube channel: https://www.youtube.com/channel/UCvJHVo5xGSKejBbBj0A5AyQ


NCBI Resource Coordinators (2014). Base de données des ressources du Centre national d'information sur la biotechnologie Nucleic Acids Research, 43 (D1) DOI: 10.1093/nar/gku1130

Divulgation: This video was sponsored and completed under contract to NCBI.

SNPpets vendredi

This week’s SNPpets include The Economist and C&EN cover gene editing in different but useful ways, new software for metagenomics, stranded RNA-Seq, the new CDC Public Health Genomics Knowledge Base, IGB le papier, Docker getting attention in biology, FDA precision medicine workshops, a nice popular press version of the ExAc (Exome Aggregate Consortium) histoire, and the heresy of Keith Robison who doesn’t hate Excel enough.

Bienvenue à notre collection vendredi lien fonction: SNPpets. Au cours de la semaine, nous avons rencontré beaucoup de liens et de lectures qui nous paraissent intéressants, mais ne pas se rendre à un billet de blog. Ici, ils sont pour votre plaisir…


NCBI de tenir deux jours génomique hackathon en Janvier

Parce que ce est venu à mon email sur le mercredi avant les vacances, il me semblait que certaines personnes pourraient manquer ceux qui aimeraient y participer. Donc, je voulais juste pour amplifier le signal un peu en re-publiant. Il venait de la NCBI Annonce liste de diffusion si vous voulez voir le tout, Je extrayant quelques-unes des ici. Il dispose d'une pièce d'application, FYI.

Du 5 Janvier to 7th, NCBI tiendra une hackathon de génomique mettant l'accent sur la bioinformatique avancée analyse des données de séquençage de prochaine génération. Cet événement est destiné aux étudiants, post-doctorants et chercheurs déjà engagés dans l'utilisation de pipelines pour les analyses génomiques à partir de données de séquençage de prochaine génération. Des groupes de travail de 5-6 personnes seront formées pour l'ADN-Seq / multiomics, ARN-Seq, métagénomique et Epigenomics. Ces groupes seront construire des pipelines pour analyser de grandes séries de données au sein d'une infrastructure cloud.

Après une session d'organisation de base, équipes passeront 2.5 jours analysant un ensemble difficile de problèmes scientifiques liés à un groupe d'ensembles de données. Les élèves analyseront et de combiner des ensembles de données pour travailler sur ces problèmes. Ce cours aura lieu sur le campus principal NIH à Bethesda, Maryland.

Les ensembles de données:
Les ensembles de données proviendront des dépôts publics logés au NCBI. Au cours, les étudiants auront la possibilité d'inclure d'autres ensembles de données et des outils d'analyse. Notez se il vous plaît, si vous utilisez vos propres données au cours, nous vous demandons de le soumettre à une base de données publique dans les six mois suivant la fin de l'événement.

Tous les pipelines et autres scripts, logiciels et programmes générés dans ce cours seront ajoutés à un dépôt GitHub publique prévu à cet effet. Un manuscrit décrivant la conception du hackathon et descripting processus de participants, produits et résultats scientifiques seront soumis à une revue appropriée.

Pour appliquer, remplir le formulaire ci-dessous liée (environ 10-15 minutes à remplir). Les applications sont dues 1st Décembre 17:00 HNE par.

Les participants seront sélectionnés à partir d'un bassin de candidats; les élèves avant la priorité sera accordée en cas d'égalité. Les candidats retenus seront avisés le 10 Décembre à 9h HNE, et ont jusqu'au 12 Décembre à midi pour confirmer leur participation. Se il vous plaît inclure une adresse e-mail surveillé, en cas il ya des questions de suivi.

[des trucs retiré ici, aux exigences, pré-reqs, et quelques autres détails sur les choses réelles de l'événement. Voir la version complète ici.]

* Génomique formulaire de demande hackathon: https://docs.google.com/forms/d/1isJT0Ns-5MHX8mH4xQnDEFbhlu4HombXspQQaADQoec/viewform

Hack loin.

Astuce Vidéo de la semaine: NCBI Variation Viewer

Les gens de NCBI a récemment organisé un webinaire qui couvre un nombre de ressources: GTR, ClinVar, et MedGen. C'était une belle introduction à ces ressources à l'aide d'une étude de l'exploration des informations sur un enfant de 9 ans qui avait besoin d'obtenir l'autorisation pour la participation à des activités sportives cas. Donc, ils suivent le cours de certains détails au sujet de cette enfant à travers les différentes ressources à NCBI à montrer ce que vous pouvez apprendre sur les différents sites.

J'espérais que l'enregistrement deviendrait disponible qui pourrait être un triple astuce de la semaine, mais je n'ai pas vu toutes les annonces de ce; Je vais garder un œil sur et mettre en surbrillance dans l'avenir si elle ne. Ci-dessous j'ai aussi mentionné un document qui couvre une partie de la même terre que celle webinaire. Mais dans l'intervalle, ils ont aussi récemment ajouté une nouvelle courte vidéo sur le Viewer Variation que j'ai trouvé très pratique ainsi. Donc, ça va être la vidéo la pointe de cette semaine.

J'ai particulièrement aimé la façon dont vous pouvez facilement sélectionner un exon de se concentrer sur, avec les petites bulles près du sommet. Ce n'était pas évident pour moi d'abord. Les gens sont souvent me demandent des moyens pratiques de se concentrer sur les détails d'un seul exon.

En plus de cette vidéo, Je vais aussi proposer un écran-plafond de l'une des lames de la webinaire plus que liée à des ressources connexes autour de NCBI. Si vous n'avez pas vérifié ces outils associés vous voulez regarder ainsi. Il ya beaucoup d'outils formidables disponibles et ils sont toujours en ajoutant de nouvelles fonctionnalités utiles. Suivez-les sur Twitter pour les annonces au sujet de leurs outils et de formations–c'est comme ça que je reste au-dessus des nouveaux articles.

NCBI webinar sitesLiens rapides:

Variation Viewer: http://www.ncbi.nlm.nih.gov/variation/view/

MedGen: http://www.ncbi.nlm.nih.gov/medgen

GTR: http://www.ncbi.nlm.nih.gov/gtr/

ClinVar: http://www.ncbi.nlm.nih.gov/clinvar/


Landrum M.J., G. R. Riley, Dans. Jang, Dans. S. Rubinstein, D. M. Eglise & D. R. Maglott (2014). ClinVar: archives publiques des relations entre les variations de séquence et le phénotype humain, Nucleic Acids Research, 42 (D1) D980-D985. DOI: http://dx.doi.org/10.1093/nar/gkt1113

Astuce Vidéo de la semaine: NCBI séquence Viewer exportation PDF

Un couple de semaines en arrière nous avons fait un atelier sur la UCSC Genome Browser, et on m'a posé une question, nous voyons assez fréquemment: Est-il possible d'exporter la vue de navigateur que vous avez sélectionné avec des pistes spécifiques, filtres, régions, etc? Les gens peuvent vouloir avoir un enregistrement de leur vue personnalisée dans un cahier de laboratoire, ou l'utiliser pour l'enseignement, ou peut-être à un séminaire–ou bien sûr de publier vos observations impressionnants dans des revues.

La plupart du temps je prends juste des captures d'écran de ce que j'ai besoin d'un outil de capture d'écran (mon préféré est Snag-It de TechSmith). Mais il peut arriver que vous voulez quelque chose d'un peu plus robuste. Si vous allez faire une affiche, ou le soumettre pour publication, par exemple,, vous voudrez peut-être une belle version PostScript, vous pouvez travailler avec et éditer plus loin. À l'UCSC, la façon de le faire est avec le “Voir” option de menu ici pour PDF / PS:

Export the browser image to a file for further editing or use.

Exporter l'image du navigateur dans un fichier pour le modifier ou de l'utilisation.

Lorsque vous obtenez un fichier, vous pouvez prendre vers le bas et utiliser les outils graphiques d'Adobe si vous en avez, ou libre open-source comme un Inkscape. Vous pouvez changer les couleurs, supprimer des trucs, ajouter des annotations, etc.

Alors quand j'ai vu qu'il y avait une fonction similaire avec le NCBIL 'outil Sequence Viewer, J'ai pensé que je devrais mentionner que bien. Ils ont une belle et claire vidéo qui illustre comment accomplir obtenir l'image de l'Observateur et dans un fichier.

Pour essayer vous-même sur le fichier de l'échantillon, ils ont montré, vous pouvez aller à NC_000022.10 dans la base de données de nucleotides. De cette page, cliquez sur le “Graphisme” lien comme indiqué ici:

Click the "Graphics" link on the page to open the Sequence Viewer.

Cliquez sur le “Graphisme” lien sur la page pour ouvrir la visionneuse de séquence.

Après vous arrivez à la visionneuse de séquence, suivez les instructions comme il joue dans la vidéo YouTube. C'est assez simple–juste attention à cliquer sur le menu de droite pour les fichiers PDF.

Si vous n'avez pas utilisé la séquence NCBI Viewer beaucoup, vous devriez certainement vérifier. Il ya quelques autres vidéos utiles pour plus de fonctionnalités ainsi. Et une autre caractéristique intéressante est que vous pouvez visionneuse de séquence incorporer dans vos propres pages Web.

Tous les navigateurs du génome ont différentes caractéristiques et fonctions, et il est bon de savoir qu'il existe différentes stratégies pour accomplir les tâches que vous pourriez avoir besoin de se faire.

Liens rapides:

Viewer Séquence page d'accueil http://www.ncbi.nlm.nih.gov/tools/sviewer/

Vidéos: http://www.ncbi.nlm.nih.gov/tools/sviewer/videos/


Karolchik D., Barber G.P., J. Casper, Clawson H., Cline M.S., Diekhans M., Dreszer T.R., Fujita P.A., Guruvadoo L. & Haeussler M. & (2013). La base de données UCSC Genome Browser: 2014 mise à jour, Nucleic Acids Research, 42 (D1) D764-D770. DOI:

Acland A., Agarwal R., Barrett T., J. Beck, Benson D.A., Bollin C., Bolton E., Bryant S.H., Canese K. & Eglise D.M. & (2013). Base de données des ressources du Centre national d'information sur la biotechnologie, Nucleic Acids Research, 42 (D1) D7-D17. DOI:

Antique (ou peut-être “classique”) UCSC Genome Navigateurs retraite

Tout le monde est assez à l'aise avec le concept de la non-standard, mais couramment utilisée chiens années- comme un moyen de comparer l'espérance de vie pour les humains. Les amateurs de voitures ont une taxonomie pour les âges de véhicules. Mais je suis assis ici se demander ce que l'échelle du génome navigateur ans devrait être. J'ai réfléchi à ce sujet en raison de la récente annonce sur la liste UCSC l'autre jour:

Changement dans l'accès de visualisation pour les anciens ensembles

Bonjour tout le monde!

Au cours de la dernière 12 années, nous avons fait des efforts pour maintenir la visualisation de nombreux anciens, assemblées archivées sur notre serveur d'archives à http://génome archive.cse.ucsc.edu /, en plus de donner accès à télécharger les jeux de données associés. Malheureusement, cette visualisation n'est plus viable pour les très anciennes assemblées en raison des nombreux changements dans le logiciel de Genome Browser comme il a mûri. Nous sommes donc en réduisant l'accès à certaines anciennes assemblées au téléchargement de données seulement, et annoncent l'arrêt de notre serveur d'archives. Nous allons continuer à fournir un accès Genome Browser pour l' 4 ensembles humains les plus courants, et au moins l' 2 la plupart des assemblées actuelles pour tous les autres organismes, à quelques exceptions. Nous allons interrompre notre support de visualisation pour tous les autres ensembles de vieux, mais continuera à faire de ces ensembles de données disponibles sur nos serveurs de téléchargement. Les assemblées actuellement sur notre serveur d'archives pour laquelle nous avons cessé support de visualisation comprennent des premières ébauches d'assemblage de l'homme, HG4, HG5, HG6, HG7, HG8, HG10, HG11, HG12, HG13, hg15, rn1, RN2, MM1, mm2, mm3, mm4, mm5, rheMac1, bosTau1, ce1, danRer1, et danRer2. Liens vers les données et les annotations associées à ces assemblées ont été ajoutés dans les endroits appropriés sur notre page de téléchargement de http://hgdownload.soe.ucsc.edu /. S'il vous plaît nous contacter si vous avez des difficultés à trouver un ensemble d'intérêts de données.

Matthew Speir
UCSC Genome Bioinformatics Group

A view of the UCSC Genome Browser in the early days, ~2004.

Une vue de l'UCSC Genome Browser dans les premiers jours, ~ 2004.

Je suis sûr que les versions de navigateurs ne sont pas utilisés plus beaucoup, mais c'était quelque chose que j'avais besoin d'être conscient de. Dans nos ateliers, je mentionne que les anciennes versions sont disponibles à partir de la “Archives” navigation sur la page d'accueil, Mais ce sera fini maintenant. Parfois il ya des vieux papiers qui font référence à une durée génomique que vous souhaitez revoir–mais qui devient moins fréquent pour les très vieux ensembles à ce point. Les données vont persister à télécharger, mais les visuels du navigateur seront partis. Mais ça m'a donné envie de revenir et de regarder à travers mes matériaux anciens pour voir ce que les premiers navigateurs ressemblaient (cliquez sur l'image pour Embiggen). Un grand nombre de la structure fondamentale est la même, mais si vous regardez une de ces vieilles assemblées vous pourriez être surpris. Beaucoup moins de pistes, c'est sûr. Dans mon coup, il n'y a que quelques espèces de la piste de conservation (de l'homme, chimpanzé, la souris, rat, le poulet). Nous n'avions tout simplement pas que beaucoup de données disponibles–non seulement à travers les espèces, mais d'autres types de techniques et d'outils. Moins de pistes. Boutons de fonctionnalités moins.

C'était presque autant de plaisir que de regarder en arrière à les vieilles interfaces NCBI que je me souviens de retour. Ceux d'entre vous qui ont été dans ce rodéo pendant un certain temps peut se souvenir de ceux. Certains d'entre vous me souviens même pas la clé “Pedro Outils” de retour dans la journée. Parfois, il vaut la peine de regarder en arrière où nous en sommes venus à réaliser combien nous sommes plus que nous avons réalisé. Je sais qu'il ya beaucoup de râler de ne pas avoir le cancer guéri et a changé l'industrie pharmaceutique avec la séquence du génome humain encore–mais nous n'avons pas vraiment eu les données longues dans le navigateur ans. Ou c'est peut-être plus comme Mars ans–plus que vous réalisez, malgré la durée relativement comparables d'une seule journée. L'arc de la science est longue, mais il se penche vers des réponses.

Modifier: J'ai réalisé que je devrais regarder le plus ancien et ajouter que la référence ci-dessous. Découvrez Figure 1 pour une vue encore plus des données.

Quick link:

UCSC Genome Browser: http://genome.ucsc.edu


WJ Kent, Sugnet C.W., Furey T.S., Roskin K.M., Pringle T.H., Payer A.M. & Haussler D. (2002). Le navigateur du génome humain à l'UCSC, Genome Res., 12 996-1006. DOI:

Astuce de la semaine: NCBI Genome Workbench

Pointe d'aujourd'hui est de NCBI. Spécifiquement, NCBI Génome Workbench. Le plan de travail est

…une application intégrée pour la visualisation et l'analyse des données de séquence. Avec Génome Workbench, vous pouvez afficher les données dans les bases de données de séquences accessibles au public au NCBI, et mélanger ces données avec vos propres données privées.

C'est un programme utile et ils ont un grand ensemble de vidéos pour vous présenter les fonctions du Workbench et caractéristiques. La vidéo intégrée ici est l'introduction, mais ils ont aussi plusieurs autres vidéos y compris la façon de charger un génome dans le plan de travail, phylogénies et d'autres. Check it out.

( pardonner le retard de la pointe de cette semaine. Neige annulée travail, et frappa sur l'accès à Internet!)