UCSC Genome Bioinformatics

Video Tipp der Woche: UCSC Genome Browser Exon-only-Modus,en

Das Team von UCSC Genome Browser continues to update their resources and offer new ways to find and visualize features of interest to researchers. One of the newer features is the “Multi-Region” option. When it was first launched, I did a tip on how to use that, with some of the things that I noticed while I was testing it pre-launch. But now the folks at UCSC have their own video on the exon-only display that you might also find useful.

One of the things that is illustrated here is how the exon-only mode is handy to enhance your exploration of RNA-Seq data. It also uses a great ENCODE data set as an example, and if you haven’t been using that collection it’s a good reminder of the kinds of things you can find in that resource still. And this extensive data set shows how much easier it is to look at different isoforms in the data in this new exon-only mode.

So have a look at this display option if you haven’t before, especially how it can help you to see transcript differences. If you aren’t familiar with the ENCODE Daten that’s being used, you can also see our training on that which will help you to understand how to use that data and the filtering features that are also used in this video.

Besonderer Hinweis: I have updated the UCSC Intro slides to include the new Gateway strategies as well. So download those slides for the latest look.


UCSC Genome Browser: http://genome.ucsc.edu

UCSC Genome Browser training materials: http://openhelix.com/ucsc

ENCODE: http://www.openhelix.com/ENCODE2


UCSC Genome Bioinformatics

Video Tipp der Woche: UCSC features for ENCODE data utilization

UCSC Genome BioinformaticsAs noted in der letzten Woche Spitze about the ENCODE DCC at Stanford, there was a workshop recently for the ENCODE Projekt. There were a lot of folks speaking and a big room full of attendees. You should check out the full agenda and the playlist at the NHGRI site for all the videos, Folien, and handouts: ENCODE 2015: Research Applications and Users Meeting.

This week I’m highlighting another video from this event. In this one, Pauline Fujita from the UCSC Genome Browser covers ways to work with ENCODE data in their browser.

Some of the talk includes intro stuff for brand new users, because there were certainly some in this workshop. If you are new to the tools, Auch, you can also see our free tutorial suites (unten). Pauline also quickly highlights their Genome Browser in a Box virtual machine option for folks who have privacy sensitive or protected data, but only briefly. If you want some more info on that, lesen Sie in unseren Tip of the Week on GBIB.

But soon she covered more detail on features like track hubs and how to use those (if you wanted to jump to that part, it begins around 20min). That extra search for items in the Track Hub is really good to know about. file_formats_helpAuch, there’s some guidance here on the types of file formats that you may want to use to structure your data. Also why you want BED vs Wiggle, zum Beispiel. For the part that addresses these formats, jump to about 33min.

Towards the end there’s coverage of the Data Integrator. The idea with this feature is that maybe you’ve got some information on a region and you have this structured as a BED file–or a number of regions–and you want to find out what else is going on in those regions. The Data Integrator can help you with that by finding overlaps among different tracks of data (around 45min). The Variant Annotation Integrator does kind of a similar thing, but for VCF files with variation information (~48min). A smidge more guidance on track hubs comes in at 50min.

In our paper for Current Protocols (which is now in PubMedCentral), we talk a bit about the hubs structure too. So if it runs too quickly at the end, our paper shows some of that detail pretty much the same way. That might help you to think about how to structure them if the concept is new to you. But if you are ready to dive in, there’s a paper specifically about hubs. And there’s also more background on the browser’s tools and in the NAR database issue papers. There’s a lot of ENCODE data available to mine, and I really hope more folks can use the tools to find new insights into genomic regions they are interested in.


Track hubs: http://genome.ucsc.edu/cgi-bin/hgHubConnect

Data Integrator: http://genome.ucsc.edu/cgi-bin/hgIntegrator

Variant Annotation Integrator: http://genome.ucsc.edu/cgi-bin/hgVai

ENCODE features at UCSC: http://genome.ucsc.edu/ENCODE

UCSC tutorial suites:

UCSC Intro Tutorial suites (Video, with our free slides + Übungen): http://www.openhelix.com/ucscintro

UCSC Advanced Tutorial suites (Video, Folien, Übungen): http://www.openhelix.com/ucscadv


Video Tipp der Woche: ENCODE Daten Coordination Center, phase 3


Image via: Eine Bedienungsanleitung für die Encyclopedia of DNA Elements (ENCODE). doi:10.1371/journal.pbio.1001046.g001

Das ENCODE project began many years ago, with a pilot phase, that examined just 1% des menschlichen Genoms. But this initial exploration helped the consortium participants to iron out some of the directions for later stages–including focusing on specific cell lines, Techniken, and technologies in Phase 2. There have been a number of publications that came out from consortium members, but in addition to the participant’s papers, a lot of other folks have mined this data for various investigations as well. There’s still plenty of opportunity for discovery. Some people may not realize that there’s an also ENCODE phase 3 Gange.

When we had a contract with the folks at UCSC Genome Browser for outreach on ENCODE, we developed materials to help people explore the data. But we hadn’t delved into it much since phase 3 began. But the other day I got a note from my NHGRI YouTube subscription (GenomeTV) that a whole workshop of ENCODE phase 3 information had been made available. So I wanted to have a look.

There is a series of video segments that correspond to this agenda from the ENCODE workshop. I’ll be highlighting one of them here, the one that introduces the features of the Phase 3 Data Coordination Center at Stanford now. But there may be others that you want to examine for your research goals as well. Another way to work through the different segments is available from the NHGRI page here: http://www.genome.gov/27561910 That page offers the slides, Handouts, and exercises too.

The video is longer than our typical tips, but it’s worth seeing for the context and framework details. There’s also a section on searching and filtering, which explains how to locate precisely the things you want to find. There’s a helpful and funny analogy to searching for shoes as you would at Zappos. I’ve used the Zappos tool exactly that way, and I also like it very much. If you want more details on how their ontology structure helps them to accomplish this, check out the paper linked below. Also in the video, there’s a piece about how the metadata is structured, und was Sie erwarten können, dort finden.

There’s also a part about how to visualize the things you find. You end up loading them as a UCSC Genome Browser track hub, which is integrated with all they other data at UCSC. There’s another video with Pauline Fujita on the hubs which I’ll address separately later.

Das playlist for the whole meeting is here. I won’t be highlighting all of them, but I may select more of them for future tips.


ENCODE-Portal: https://www.encodeproject.org/


Video Tipp der Woche: New UCSC “gestapelt” wackeln Trackansicht

Diese Woche im Video-Tipp zeigt Ihnen eine neue Möglichkeit, an den multiWig Track-Daten an der UCSC Genome Browser sehen. Ein neue Option wurde vor kurzem veröffentlicht (siehe 06 Mai 2014), ein “gestapelt” Blick, und es ist eine praktische Möglichkeit, um auf die Daten mit einer neuen Strategie aus. Aber ich gebe zu, es hat mich ein wenig, während der Arbeit mit ihm, um die Details zu verstehen. Also in diesem Tipp, den ich hoffe, dass Sie, was die neue Visualisierung Angebote zu sehen.

Ich werde nicht auf die vielen Arten von Annotation Tracks erhältlich in den Hintergrund–Wenn Sie brauchen, um auf die Idee, den Grund Blick auf die Rennstrecke eingeführt werden, beginnen mit unserer Einführung Tutorial , die auf die verschiedenen Arten von grafischen Darstellungen berührt. Individuelle Spuren auf in die berührt erweiterte Tutorial. Für Hinweise speziell wie die verschiedenen Spurtypen erstellen, finden Sie in der Dokumentation UCSC. Die Art der Strecke, die ich bin in dem Video veranschaulicht, heute, ein MultiWig track, hat seinen eigenen Abschnitt dort zu. Im Grunde, wenn man völlig neu in diesem, der “wackeln” Stil ist eine Möglichkeit, eine Histogramm-Anzeige über einen Bereich zeigen. MultiWig können Sie mehrere dieser Histogramme überlagert in einem Raum. Im Beispiel habe ich hier zeigen,, Die Ergebnisse des Betrachtens 7 verschiedenen Zelllinien sind für einige Histon Markensignale gezeigt (Layered H3K27Ac Spur).

Annotation track cell lines

Annotation Spur Zelllinien

Als ich die Ankündigung, Ich dachte, das war ein guter Weg, um alle Daten gleichzeitig zeigen. Wenn wir das tun Grund Workshops, wir nicht immer Zeit haben, um in die Details dieser Ansicht gehen, obwohl wir erforschen in der ENCODE Material, weil die Strecke bin ich mit einer der ENCODE Datensätzen. Ich werde die gleiche Strecke in der Region: der Ankündigung verwenden, die hier dargestellte:

stack announcementAber als ich zum ersten Mal sah diese, Ich war mir nicht sicher, ob der Spitzen–konzentrieren sich auf die rosa Spitze, die die NHLF Zelllinie stellt–sollte den gesamten Bereich unterhalb oder nicht decken. Was ich versuche, herauszufinden, ist im Wesentlichen diese (eine grafische Darstellung der mein Gedankengang folgt):


Durch den Versuch, die verschiedenen Arten war ich ziemlich sicher, dass ich die Idee hatte, was wirklich gezeigt, aber ich bestätigt, dass mit einem der Spur Entwickler. Der Wert ist nur die rosa Bandsegment, nicht die gesamte Fläche darunter. Und Matthew mir auch angemerkt, dass sie sortieren die Titel in umgekehrter alphabetischer Reihenfolge (NHLF so ist die höchste in dem Stapel). Das war ein Aspekt, den ich noch nicht realisiert. Sie sind nicht Sortierung auf der Basis der Werte an dieser Stelle. Dies macht Sinn,, natürlich, aber es war nicht offensichtlich für mich auf den ersten.

Ich mag diese Option sehr–aber ich dachte, wenn ich etwas noodling auf, was es eigentlich bedeutet, andere die gleichen Fragen haben, vielleicht zu tun hatte.

In dem Video werde ich Ihnen zeigen, wie dieses Segment sieht mit den verschiedenen “Overlay-Methode” Einstellungen auf dieser Spur Seite. Werde ich mir auf der SOD1-Bereich, wie beispielsweise die Bekanntgabe. Ich zwickte ein paar von den anderen Einstellungen von den Standardeinstellungen so, es wäre einfacher, auf dem Video zu sehen (siehe Pfeilspitzen für meine Änderungen). Aber ich hoffe, dass dies vermittelt die Möglichkeiten Sie haben nun bei dieser Art von Track-Daten effektiv aussehen.

Track settings for videoSo, hier ist das Video mit SOD1-5′ Bereich in der Mitte, mit Hilfe der 4 verschiedene Möglichkeiten der Overlay-Methode, Darstellung der Histon-Markendaten in die 7 Zelllinien. Ich bin nicht in die Details der Daten gehen hier, aber ich werde Ihnen zu einem Referenz mit dieser Arbeit für mehr verbunden, wie es gemacht wird zeigen–finden Sie in der Bernstein-Labor Papier unter. Ich wollte nur diese neue Art von Anzeige-Optionen, die auf wackeln Titel verfügbar sein wird zeigen,. Einige Titel werden zu viele Daten für einen oder anderen Art haben, oder mit der einen oder anderen Stil klarer. Aber jetzt haben Sie eine zusätzliche Möglichkeit, sie zu prüfen haben.


UCSC Genome Browser: genome.ucsc.edu

UCSC Intro-Tutorial: http://openhelix.com/ucscintro

UCSC Erweiterte Tutorial: http://openhelix.com/ucscadv

VideoTip der Woche: ENCODE @ Ensembl

Wir haben eine Menge von Tutorials (2 in der Tat, ENCODE Stiftungen & ENCODE @ UCSC), Tipps und Informationen über ENCODE. Wir haben auch eine Menge Tutorials (wieder 2, Ensembl und Ensembl Vermächtnis- auf den älteren Versionen ), Tipps und Informationen über Ensembl, die Datenbank und Browser bei EBI.

Jetzt ist hier ein Tipp der Woche sowohl Ensembl und Codieren. Dies ist einer der neueren Ergänzungen Ensembl die Video-Tutorials. Dieses Video schaut, wie Sequenzen, die in der Genregulation beteiligt sein könnten. Die meisten dieser Daten an Ensembl auf CODIEREN Daten. Dies ist mit der “Matrix,” eine Möglichkeit, die Regulierung Daten wählen Sie braucht auf Zelltypen basieren und die TF. Am Ende der 8 minütigen Video diskutieren sie ein bisschen mehr darüber, wie man alle Daten kodieren.

So, jetzt haben Sie eine Fülle von Informationen hier bei OpenHelix durch unsere Tutorials und unserem Blog über codieren und Ensembl.


ENCODE: http://encodeproject.org/ENCODE/
ENCODE @ UCSC: http://genome.ucsc.edu/ENCODE/
Ensembl: http://www.ensembl.org
ENCODE Tutorials: http://openhelix.com/encode
Ensembl Tutorials: http://openhelix.com/cgi/tutorialInfo.cgi?id=95

Video Tipp der Woche: ENCODE ChIP-Seq Bedeutung Werkzeug

Wir haben getan, Schulungen und Workshops auf der UCSC Genome Browser für 10 Jahren. Es ist eine ungeheure Werkzeug, das ein grundlegendes Element in Ihrem Toolkit in der Genomik hat. Aber–Es kann vorkommen, dass Sie einige der Daten, die Sie dort finden können in einer anderen Art und Weise untersuchen möchten, mit einem anderen Schwerpunkt oder Schwerpunkt. Es könnte möglich sein, einige clevere Handwerk Tabelle Browser Abfragen, die Sie bekommen, was Sie wollen. Manchmal, obwohl, jemand anderes hat einen Weg für Sie erstellt die zugrunde liegenden Daten für ein Thema, die nützlich sein könnten auch zur Abfrage. Und die heutigen Tipp der Woche ist genau diese Art von Werkzeug. Ein Web-Interface, um die Daten kodieren, die in der UCSC Genome Browser wohnt abfragen, mit einem Schwerpunkt auf der Suche nach Transkriptionsfaktoren mit angereichertem Bindung in einer Region, die Sie Interesse an der Erforschung. Das heutige Video Tipp ist für die ENCODE ChIP-Seq Bedeutung Werkzeug.

Es gibt eine Tonne von großer Daten, die in der UCSC Genome Browser als Teil des geflossen ENCODE Projekt. Es wird Jahre Bergbau für Biologen bieten. Was wäre toll, ist für die biomedizinische Forscher, die Interesse an bestimmten Genen haben–oder Gruppen von Genen–um einen Blick auf die Daten kodieren, um zu sehen, wenn sie können ausgraben einige nützliche Erkenntnisse über die Regulation dieser Gene oder Listen von Genen. Sie können die ChIP-Seq Bedeutung Werkzeug, um durch die Daten zu sichten.

Das Video, dass die Butte lab Team hat ist sehr schön. Sehr spezifische Beratung, wie sie ihre Tool verwenden–was für den Menüoptionen wählen, was die Möglichkeiten sind, und was man aus den Ergebnissen erwarten. Hier ist ihr Video:

Natürlich sollten Sie ihr Papier über dieses Tool für den Hintergrund müssen Sie lesen (unten verlinkt), und die Referenzen, die helfen auch zu verstehen, was dieses Tool bietet. Lesen Sie dazu auch auf die damit verbundenen Daten kodieren. Die Ergänzung mit dem Papier ist auch schön in einer klaren Sprache geschrieben, um Ihnen helfen, die Funktionen zu verstehen.

Eines der Dinge, die ich war neugierig war, ob dies auf die Maus Daten zu ergänzen zu werden. Eine Sache, die Leute schimpfen mit mir darüber ist, dass kodieren Zelllinie Daten, und Gewebe Daten wäre wirklich toll. Aber ich sah, Diskussion auf Stephen Turner Blog (Lesen Sie Kommentare) über den Fokus auf die menschliche jetzt. Es war auch die Diskussion CsCAN Werkzeug, obwohl, was tut decken die Mausdaten. Also, wenn dies ist ein Werkzeug, das Sie interessiert sind, in, möchten Sie vielleicht zu erkunden CsCAN.

Hutspitze zu Stephen Turner für das Bewusstsein:


ENCODE ChIP-Seq Bedeutung Werkzeug: http://encodeqt.stanford.edu/

CsCAN: http://www.beaconlab.it/cscan


