Tipp der Woche: Erste flankierenden Sequenz

getflank_thumbIn einer früheren Was ist Ihr Problem Thread, Forscher hatten Hunderte von SNP Orten, an denen sie versuchen, leicht die flankierenden Sequenz von denen Hunderte von SNPs wurden, ohne auf jedem Standort in der go UCSC Genome Browser und Augenmaß. Wahrscheinlich gibt es ein paar Möglichkeiten, dies zu tun, aber ich fand, dass Galaxy war ein guter Anfang. So, die Spitze in dieser Woche, dass zwei SNP Standorten über das menschliche Genom und die Erlangung der flankierenden Sequenz von den Standorten und die Rückgabe einer Datei, die entweder könnte als Tabelle gespeichert werden, Text oder sogar zurück in eine UCSC Genome Browser eigene Spur, dann können hochgeladen hat, eingesehen und durchsucht bei UCSC. Der Prozess für den einzelnen Wissenschaftler wird ein bisschen unterschiedlich, je nachdem die Daten und wie die excel / Arbeitsblatt / Datei ist so konfiguriert,, aber hoffentlich werden Sie auf die Idee kommen. Die Schritte sind so:
1. Laden Sie Ihre Datei (Reiter abgegrenzt Text)
2. Konvertieren Sie die Datei auf die "Intervall’ Format
3. Schneiden Sie alle Spalten mit Daten aus Original-Datei zur späteren Verwendung zu speichern.
4. Holen Sie sich flankierenden chromosomalen Standorten (dann verschmelzen vor-und nachgelagerten Datensätze in einem Datensatz)
5. Holen Sie sich flankierenden Sequenz
6. Fügen Sie Datenspalten aus Schritt 3 die Datenspalten (chromosomale Position und Reihenfolge) Schritt 5.

Hier, jetzt hast du einen tab-abgegrenzte Textdatei, die in Excel geöffnet werden kann, machte in einem benutzerdefinierten track (in Galaxy), usw..

Irgendwelche Vorschläge auf andere Methoden, dies zu tun?

(OpenHelix nicht Training auf Galaxy und UCSC Genome Browser).

4 thoughts on "Tipp der Woche: Erste flankierenden Sequenz

  1. Lon Phan

    Hallo,

    dbSNP haben verschiedene Report-Formate (FIXED, XML, und ASN.1) mit flankierenden Sequenzen, wenn Web-Recherchen abgerufen werden können oder als FTP-Downloads. Die am einfachsten zu bedienen ist wahrscheinlich das FASTA-Format, das von der "Display"-Option auf EntrezSNP Web-Suche ausgewählt werden können (http://www.ncbi.nlm.nih.gov/sites/snp/limits) oder abgerufen programmgesteuert Eutils API(http://www.ncbi.nlm.nih.gov/bookshelf/br.fcgi?book=coursework&part=eutils).

    Verschiedene dbSNP Report-Formate können auch in großen Mengen abgerufen werden unter Verwendung dbSNP Batch Abfrage (http://www.ncbi.nlm.nih.gov/SNP/batchquery.html) mit Variante ID oder Download von der FTP-Site (ftp://ftp.ncbi.nih.gov/snp/organisms/) von Organismus und Chromosom.

    Bitte zögern Sie nicht Kontakt dbSNP (snp-admin@ncbi.nlm.nih.gov) Wenn Sie Fragen oder Anregungen.

    Prost,

    Lon
    NCBI / dbSNP

  2. Trey Beitrag Autor

    Vielen Dank Lon. Es ist wirklich eine großartige Möglichkeit, um Batch-Daten und flankierenden Regionen erhalten. Ich habe es getan, und es funktioniert perfekt. Vielen Dank!

    Diese besondere Frage wurde dem Forscher wollten eine bestimmte Anzahl von bps Upstream-und Downstream und wollte es in einem Tab-abgegrenzte Form (für Tabellenkalkulation) mit den anderen Daten, die er hatte,. Nicht sicher, ob das mit dbSNP möglich, aber ich sollte versuchen,.

    Sowieso, das ist ein guter Weg, um Batch-flankierenden Region Daten zu erhalten. Ich könnte es mein nächster Tipp tatsächlich. Ich könnte eine Reihe von immer Sequenzdaten von verschiedenen Formen zu tun, flankierenden Regionen von SNPs aus dbSNP könnte eine gute erste sein.

    Dank!

  3. Ria

    Das war ein sehr hilfreicher Tipp, Dank! Ich bin in der Mitte zu tun, das selbst, über 7 Millionen potenzielle SNP Standorten. Ich habe tatsächlich einige Perl-Skripte geschrieben, um mit dieser Hilfe, mit Bio::perl. Hat man Zugriff auf Server-Enterprise-Klasse und Cluster Rechenressourcen, das ist wahrscheinlich die schnellste Option sein.

  4. Pingback: Tipp der Woche: Jahr der Tipps, Teil zwei | Die OpenHelix Blog

Kommentare sind geschlossen.