Tag Archives: Ensembl

unirule_sample

Video Tipp der Woche: UniProt Aktuelles, jetzt einschließlich beweglicher Bett-Dateien

UniProt ist eine der Kernressourcen, die enorm wichtig kuratierten Informationen über Proteine ​​bietet. Finden Sie Links zu UniProt in vielen anderen Tools und Datenbanken sowie zu finden, aber wir haben immer verfochten werde dort direkt für den vollen Blick auf all die breite Palette von Informationen, die sie bieten. Ihre Gründung vor solide, aber auch weiterhin neue und nützliche Features, im Laufe der Zeit hinzufügen. Vor kurzem ein Webinar, um einige der neuen Dinge zu beschreiben mussten sie, und die Aufnahme dieses Webinar wird in dieser Woche Video Tip fo der Woche.

Das Video beginnt mit einem Überblick über die gesamte UniProt Website. Der Kern ihrer großartige Ressource ist die gleiche, natürlich. UniProtKB, UniRef, und UniParc sind für verschiedene Wege, um für die Daten zu suchen. Das handliche Proteome Sammlung der Proteine, die in einer bestimmten Art ist verfügbar, und sie haben auch Referenz Proteome von diesem Zugangspunkt. Es gibt einen kurzen Abschnitt im Video, das ein Führer zu den grundlegenden Suchfunktionen ist.

Über 9 Minuten in sie einzuführen, die UniRule Annotation-Features. Wenn bestimmte Bedingungen erfüllt sind, eine Anmerkung wird auf ein Protein angewendet–die Sie aus dem Protein-Seiten, indem Sie auf den Link UniRule für diese Annotation verfolgen können. unirule_sampleUnd deren Software bietet eine sehr coole Art zu schauen und zu sehen, wie / wann Vereinbarungen gelten. Es wird eine Entscheidung Strömungspfad laden und zeigt auf, was die logischen Regeln wurden in diesem speziellen Fall verwendet, so können Sie sie zu verfolgen und zu verstehen, wie ein Protein, das eine gegebene Einzelteil erhielten. Das ist, was ich zu veranschaulichen im Screenshot hier.

Über 14 meine, ist das Thema der neuen Genome Annotation Tracks verändert. They now offer you a way to take their annotations for a UniProtKB entry and use them with a separate genome browser. Sie euch Bett oder BigBed Dateien für verschiedene Funktionen. Sie können auch die ganze Sache zu laden als Hub-Datei, um alle Folgestrukturdaten auf einmal zu sehen. Sie sind artspezifische, und mit menschlichen begonnen, aber andere kommen. Sie können sie von dem Access “Downloads” Bereich der Homepage. Das Video auch dort beschrieben ein wenig über die Struktur als auch. So konnte man diese Dateien zu übernehmen ENSEMBL oder UCSC Genome Browser und laden Sie sie, mit all den UniProt verfügt nun zu den bestehenden genomischen Kontext bei diesen Browsern vergleichen. Sie veranschaulichen, wie Sie bei der Suche “aktive Seite” Anmerkungen, Sie können aber auch bei Post-Übersetzung Modifikationsstellen suchen, Domains, usw.. Dies war ein Feature, das mir neu war, und sieht aus wie eine tolle Idee.

Also selbst wenn Sie denken, Sie wissen, UniProt, sehen Sie sich diese neue Optionen für die weiteren Möglichkeiten, mit dem qualitativ hochwertige Informationen, die sie interagieren. Good stuff.

Quick-Links:

UniProt: http://www.uniprot.org/

Referenz:

Die UniProt Consortium (2014). UniProt: eine Drehscheibe für Proteininformationen Nucleic Acids Research, 43 (D1) DOI: 10.1093/Granatapfel / gku989

SNPpets_2

Freitag SNPpets

This week’s SNPpets include transcription factor binding site evolution–with their secret partners transposable elements; PrecisionFDA coming along; bad habits of bioinformaticians; new synthetic biology tools and rock star status; consumer reluctance to share their health data; Russian genomes on the way. Und mehr, including the XKCD on DNA in case you missed it.


SNPpets_2Herzlich Willkommen auf unserer Friday Feature Linksammlung: SNPpets. Während der Woche kommen wir auf eine Vielzahl von Links und liest, dass wir denken, sind interessant, sondern machen es nicht zu einem Blog-Eintrag. Hier sind sie für Ihr Vergnügen…


Video Tipp der Woche: TargetMine, Data Warehouse for Drug Discovery

Browsing around genomic regions, layering on lots of associated data, and beginning to explore new data types I might come across are things that really fire up my brain. Für mich, visualization is key to forming new ideas about the relationships between genomic features and patterns of data. But frequently I want to take this to the next step–asking where else these patterns appear, how many other instances of this situation are there in a data set, and maybe adding additional complexity to the problem and refine the quest. This is not always easy to do with primarily visual software tools. This is when I turn to tools like the UCSC Table Browser, BioMart, und InterMine to handle some list of genes, or regions, or features.

We’ve touched on all of these before–sometimes with full tutorial suites (UCSC, BioMart), and sometimes as a Tipp der Woche, InterMine und InterMine für komplexe Abfragen. Learning about the foundations of these tools will let you use various versions or flavors of them at other sites. I love to see tools that are re-used for different topics when that’s possible, rather than building a whole new system. There are ModENCODE, Ratte, yeast mines, und mehr. This week’s tip is about one of those others–TargetMine is built on the InterMine foundation, with a specific focus on prioritizing candidate genes for pharmaceutical interventions. Von their site overview, I’ll add this description they use: TargetMine

TargetMine is an integrated data warehouse system which has been primarily developed for the purpose of target prioritisation and early stage drug discovery.

For more details about their framework and philosophy, you should see their papers (unten verlinkt). The earlier one sets out the rationale, the data types, and the data sources they are incorporating. They also establish their place in the ecosystem of other databases in this arena, which helps you to understand their role. But you should see the next paper for a really good grasp of how their candidate prioritization work with the “Integrated Pathway Clusters” concept they’ve added. They combined data from KEGG, Reactome, und NCI’s PID collections to enhance the features of their data warehouse system.

This week’s Video Tip of the Week highlights one of the tutorial movies that the TargetMine team provides. There’s no spoken audio with it, but the captions that help you to understand what’s going on are in English. I followed along on a browser with their example–they have a sample list to simply click on, and you can see various enrichments of the sets–Wege, Gene Ontology, Disease Ontology, InterPro, CATH, and compounds. They call these the “biological themes” and I find them really useful. You can create new lists from these theme collections. They also illustrate the “template” option–pre-defined queries with typical features people may wish to search. The example shows how to go from the list of genes you had to pathways–but there are other templates as well.

Another section of the video has an example of a custom query with the Query Builder. They ask for structural information for proteins targeted by acetaminophen. It’s a nice example of how to go from a compound to protein structure–a question I’ve seen come up before in discussion threads.

In their more recent paper (also below), they have some case studies that illustrate the concepts of prioritizing targets for different disease situations with their system. They also expand on the functions with additional software to explore the pathways: http://targetmine.mizuguchilab.org/pathclust/ .

So have a look at the features of TargetMine for prioritization of candidate genes. I think the numerous “themes” are a really useful way to assess lists of genes (or whatever you are starting with).

Quick Links:

TargetMine: http://targetmine.mizuguchilab.org/ [beachten: their domain name has changed since the publications, this is the one that will persist.]

InterMine: http://intermine.github.io/intermine.org/

Referenzen:

Chen, Y., Tripathi, L., & Mizuguchi, C. (2011). TargetMine, an Integrated Data Warehouse for Candidate Gene Prioritisation and Target Discovery PLoS ONE, 6 (3) DOI: 10.1371/journal.pone.0017844

Chen, Y., Tripathi, L., Dessailly, B., Nyström-Persson, J., Ahmad, S., & Mizuguchi, C. (2014). Integrated Pathway Clusters with Coherent Biological Themes for Target Prioritisation PLoS ONE, 9 (6) DOI: 10.1371/journal.pone.0099030

Kalderimis A., R. Lyne, D. Butano, S. Contrino, M. Lyne, J. Heimbach, F. Hu, R. Smith, R. Stěpán, J. Sullivan & G. Micklem & (2014). InterMine: extensive web services for modern biology, Nucleic Acids Research, 42 (W1) W468-W472. DOI: http://dx.doi.org/10.1093/nar/gku301

Bioinformatik-Tools von einer typischen Säugetiergenom-Projekt extrahiert [Ergänzung]

Dies ist der Tabelle 1 dass begleitet die volle Blog-Post: Bioinformatik-Tools von einer typischen Säugetiergenom-Projekt extrahiert. Siehe die Hauptpost für die Details und Erklärung. Der Tisch ist zu lang, um in der Post halten, aber ich wollte es um Web-sucht werden. Eine Kopie befindet sich auch FigShare: http://dx.doi.org/10.6084/m9.figshare.1194867

Lesen Sie weiter

Bioinformatik-Tools von einer typischen Säugetiergenom-Projekt extrahiert

In diesem erweiterten Blog-Post, Ich beschreibe meine Bemühungen um die Informationen über die Bioinformatik-bezogene Artikel aus einer aktuellen Genom-Sequenzierung Papier extrahieren, und die größeren Probleme wirft dies im Bereich. Es ist lange, und es ist so etwas wie ein Hybrid zwischen einem Blog-Post und ein Papier-Format, nur um es etwas Struktur für meine eigene Organisation zu geben. Eine Kopie wird dies auch bei FigShare mit der vollen Datensatzes veröffentlicht werden. Vielen Dank an den Gibbon-Genom-Projekt-Team für eine tolle Papier und ausführlich dokumentierte Sammlung ihrer Prozesse und Ressourcen. Die Fragen, die ich wollte Highlight sind über den Zugang zu der Bioinformatik im Allgemeinen und sind nicht spezifisch für dieses Projekt überhaupt, sind aber über das Feld.

==============================================
Einführung:

Auf dem Gebiet der Bioinformatik, gibt es eine Menge Diskussionen über Daten und Code Verfügbarkeit, und Reproduzierbarkeit oder Replikation der Forschung, die Ressourcen in früheren Arbeiten beschrieben. Um das Ausmaß des Problems zu untersuchen, Ich habe die letzten Veröffentlichung des gut dokumentierten Gibbon Genomsequenz Projekt als Ausgangspunkt, um die Werkzeuge zu bewerten, Repositories, Datenquellen, und andere Bioinformatik bezogenen Elemente, die in den Einsatz in einem aktuellen Projekt gewesen war. Details der genannten Bioinformatik Artikel wurden aus der Veröffentlichung extrahiert, und Lage und Informationen zu den Tools wurde dann untersucht.

Nur ein kleiner Bruchteil der Bioinformatik Elemente aus dem Projekt wurden in den Hauptkörper des Papier bezeichnet (~ 16%). Die meisten von ihnen wurden in den ergänzenden Materialien gefunden. Wie wir in der Vergangenheit festgestellt haben, weder die Daten noch die notwendigen Werkzeuge werden in der traditionellen Papierstruktur nicht mehr veröffentlicht. Unter den über 100 Bioinformatik Elemente in der Arbeit beschrieben, Verfügbarkeit und Nutzbarkeit stark variiert. Einige befinden sich auf der Fakultät oder Student Websites, einige auf den Projektstandorten, einige in Code-Repositories. Einige sind in der traditionellen Literatur veröffentlicht, einige sind Studienarbeit Publikationen, einige sind nie veröffentlicht und nur eine Website oder Software-Dokumentation Handbuch dient, um die erforderlichen Angaben zu machen. Dies bedeutet, dass Informationen darüber, wie Sie die Werkzeuge benutzen, ist sehr uneben, und Unterstützung ist oft nicht vorhanden. Zugang zu den verschiedenen Software-Versionen stellt eine zusätzliche Herausforderung, entweder für Open-Source-Tools oder kommerzielle Produkte.

Neue Publikation und Lagerstrategien, neue technologische Werkzeuge, und breite Community Sensibilisierung und Unterstützung beginnen, diese Dinge zum Besseren zu verändern, und wird sicherlich helfen, für die Zukunft. Strategien für konsequent Referenzierung Werkzeuge, Versionen, und Informationen über sie wäre äußerst nützlich sein. Die Bioinformatik-Community können auch zu der Notwendigkeit, einige der historischen verwalten betrachten, grundlegenden Stücke, die für dieses Feld sind, von denen einige möglicherweise von ihrem aktuellen Status, um gerettet zu werden, um an die Gemeinde in der Zukunft verfügbar bleiben.

Methoden:

Von der Natur Webseite, Ich eine Kopie der kürzlich veröffentlichten Papier erhalten: Gibbon-Genom und die schnelle Entwicklung der Karyotyp kleinen Affen (Carbone et al, 2014). Aus dem Text des Papiers und der Ergänzungen, Ich manuell alle Verweise auf den Namen Datenbank-Tools extrahiert, Datenquelle Websites, Dateitypen, Programme, Versorgungsunternehmen, oder anderes Rechen beweglichen Teile, die ich identifizieren konnte. Einige von diesem Prozess verpasst es vielleicht werden, zum Beispiel, Namen, die ich nicht kannte oder nicht mit irgendeiner vorhandenen Werkzeug verbinden (oder einige Bild von einem Werkzeug erzeugt, vielleicht). Einige Referenzen waren "im Haus Perl-Skripte" oder andere "custom" Szenarien wurden in der Regel nicht enthalten, es sei denn sie waren zur Verfügung gestellt worden. Stück als Ersatz, die "in einer Weise ähnlich zu der bereits beschriebenen" getan in einer anderen Referenz vorhanden waren, und ich wollte nicht gehen, um stromaufwärts vor, diese Papiere Details extrahieren. Software mit Laborgeräten verbunden, wie Sequenzern (an verschiedenen Institutionen befindet) oder PCR-Maschinen wurden nicht berücksichtigt. So dürfte dies stellt eine Unterzahl der Software-Produkte im Einsatz. Ich kontaktierte auch das Forschungsteam für ein paar zusätzliche Dinge, und schnell Hilfe und Anleitung erhalten. Mit typischen Internet-Suchmaschinen oder interne Suche für den Herausgeber oder Ressourcen Websites, Ich habe versucht, die Einzelteile zu Quellen der Software oder Zitate für die Einzelteile passen.

Was ich in den Eimer setzen enthalten spezifische Namen der Elemente oder Objekte, die wahrscheinlich notwendig und / oder fremd Studenten oder Forscher außerhalb der Bioinformatik-Gemeinschaft zu sein, würde. Einige sind damit verbundenen, aber anders. Zum Beispiel, Sie brauchen, um zu verstehen, was "Gene Ontology"Ist als Ganzes, aber Sie müssen auch wissen, was "GOslim"Ist, eine konzeptionelle Unterschied und ein separates Objekt in meiner Bezeichnungssystem hier. Einige Teilkomponenten anderer Werkzeuge, aber wichtige Aspekte zu verstehen (GOTERM_BP_FAT an DAVID oder von randomBed BEDTools) und sind individuell benannten Elemente in dem Bericht, diese könnten obskure nicht-Praktiker. Andere Bioinformatik-Profis könnten mit ihrer Zuordnung zu dieser Sammlung nicht einverstanden. Wir können die Entfernung oder die Einbeziehung dieser in den Diskussionen über sie in Zukunft Iterationen der Liste diskutieren.

Ergebnisse:

Nach der Erstellung einer Master-Liste von Referenzen auf Objekte oder Bioinformatik Artikel, Die Liste wurde überprüft und für Duplikate oder unauffindbar Aspekte gekeult. Verweise auf "im Haus Perl-Skripte" oder andere "custom" Skripte wurden in der Regel beseitigt, es sei denn, besondere Bezugnahme auf eine Code-Repository zur Verfügung gestellt wurde. Dies ergab 133 Artikel restlichen.

Wie sind sie verwiesen? Sofern in den Arbeits?
Sowohl Haupt Veröffentlichung (14 PDF-Seiten) und die ersten Zusatzinformationen Datei (133 PDF-Seiten) für dieses Projekt die Namen der Bioinformatik Objekte im Einsatz. Alle Elemente in der Hauptpapier verwiesen wurden auch in der Beilage verwiesen. Die Anzahl der benannten Objekten in der Hauptpapier war 21 der 133 aufgeführten Komponenten (~ 16%). Dies steht im Einklang mit anderen ähnlichen Arten von Konsortium oder "Big Data" Papiere, die ich schon erkundet: der Großteil der notwendigen Informationen über Software-Tools, Datenquellen, Methoden, Parameter, und Merkmale sind in den umfangreichen Zusatzmaterialien gewesen.

Die Artikel werden in verschiedener Weise verwiesen. Manchmal sind sie in dem Körper des Haupttext genannt, oder die Methoden. Manchmal werden sie als Anhang beigefügt werden. Manchmal Tools werden nur in Gestalt Legenden erwähnt, oder nur in Referenzen. In diesem Fall, Einige Details wurden in dem Abschnitt "Urheber Informationen".

author_info_sm

Wie oben angemerkt, die meisten wurden in der zusätzliche Informationen gefunden. Und in diesem Beispiel, dies könnte im Text oder in Tabellen sein. Das ist ganz typisch für diese große Projektarbeiten, in unserer Erfahrung. Jeder, der versucht, Text-Mine Publikationen für diese Art von Informationen sollte sich dieser Vielzahl von Standorten für diese Informationen sein.

Die Bioinformatik Objekte werden in dieser Arbeit beteiligt?
Beschreibt der Bioinformatik, Ressourcen, Datenbanken, Dateien, usw., war schon immer eine Herausforderung gewesen,. Diese sind analog zu den "Reagenzien", die ich in meinem Rohbau Biologie Papiere vor Jahren gesetzt haben. Sie können auf das Ergebnis egal, wie Enzym Anbieter, Mausstamm Versionen, oder Antikörperspezies Details. Sie stellen Dinge, die Sie brauchen, um zu reproduzieren oder zu erweitern, die Arbeit, oder, um den Kontext zu verstehen, entsprechend. Aber im Fall der Bioinformatik, dies kann Dateiformate wie die mittlere Fastq oder AXT Format UCSC Genome Browser. Sie können Repository-Ressourcen wie die mittlere SRA. Sie können verschiedene Versions heruntergeladen Datensätze aus sein ENSEMBL (Version 67, 69, 70, oder 73 hier, die aber nur einmal gezählt ENSEMBL). Es könnte sein, Verweise auf Reactome in einer Tabellen.

Mit dieser breiten Definition im Sinn, Tabelle 1 enthält die Liste der Namen der Bioinformatik Objekte aus diesem Projekt gewonnen. Der Name oder Spitzname oder Bezeichnung, der Ort, an dem es gefunden werden kann (falls verfügbar), und eine Publikation oder ein Zitat ist im Lieferumfang enthalten, wenn möglich. Schließlich, eine Säule bezeichnet, ob es in der Hauptpapier auch gefunden.

Was nicht gezeigt ist, dass einige Referenzen mehrfach in verschiedenen Zusammenhängen und Verwendungen, mit Menschen könnte dazu führen, dass nicht, wie oft diese genutzt werden. Zum Beispiel, ironisch, RepeatMasker wurde so viele Male verwiesen Ich begann zu stoppen Kennzeichnung es an einer Stelle.

Tabelle 1. Software-Tools, Objekte, Formate, Dateien, und Ressourcen von einer typischen Säugetiergenom-Sequenzierungsprojekt extrahiert. Sehen die Web-Version Ergänzung zu diesem Blog-Post: http://blog.openhelix.eu/?p=20002, oder den Zugang zu FigShare: http://dx.doi.org/10.6084/m9.figshare.1194867

Bioinformatik-Tools von einer typischen Säugetiergenom-Projekt extrahiert [Ergänzung] – Mehr unter: http://blog.openhelix.eu /?p = 20002&preview = true # sthash.pcNdYhOZ.dpuf
Bioinformatik-Tools von einer typischen Säugetiergenom-Projekt extrahiert [Ergänzung] – Mehr unter: http://blog.openhelix.eu /?p = 20002&preview = true # sthash.pcNdYhOZ.dpuf

Table1

Was können wir über die Quelle oder Verwendung dieser Gegenstände lernen?
Suche nach Informationen über den Quellcode, Datensätze, Dateitypen, Repositories, und zugehörige beschreibende Informationen über die Einzelteile liefert eine Vielzahl von Zugangs. Einige Objekte sind mit traditionellen wissenschaftlichen Publikationen verbunden und haben gültige und aktuelle Links zu Software-oder Daten (sind aber auch manchmal falsch zitiert). Diese können in bestimmten Publikationen paywalled werden, oder in nicht verfügbar Sitzungspapiere beschrieben. Einige haben nicht zugeordneten Publikationen auf allen, oder stammen oder in Vorbereitung beschrieben. Einige Werkzeuge bleiben unveröffentlicht in der Literatur, lange, nachdem sie in breiten Gebrauch weg, und deren Dokumentation oder Handbuch zitiert statt. Einige befinden sich auf den Seiten der Fakultät Forschungs, einige sind Schüler Dissertationen. Einige Tools werden auf projektspezifische Seiten. Einige bestehen auf Code-Repositories manchmal veraltet diejenigen, die verschwinden können. Eine Reihe von ihnen sind von ihren anfänglichen Publikationen verschoben, ohne Weiterleitungsadressen. Einige sind Anspielungen auf andere Publikationen Verfahren. Einige von ihnen sind wie eine Zeitreise zurück bis zu den 1990er Jahren, mit Seiten, erscheinen Original für die Zeit zu sein,. Einige können in Gefahr zu verschwinden vollständig das nächste Mal ein Update an einer Universität Website sein Website Zugriff ändert.

Andere Werkzeuge sind kommerzielle Pakete, die unbekannte Details haben können, Versionen, oder fragwürdige Nachhaltigkeit und Zukunfts Zugang.

Wenn Details der Datenverarbeitung oder Software-Implementierungen zur Verfügung gestellt werden, die Menge kann variieren. Manchmal Parameter sind im Lieferumfang enthalten, andere nicht.

Fehlt Werkzeug, das ich haben wollte
Einer meiner Lieblings-Datendarstellungen in der Projektergebnisse war Abbildung 2 in der Hauptpapier, Oxford Netze der Arten Vergleiche in einer Baumstruktur organisiert phylogenetische. Dies vermittelt eine enorme Menge an Informationen in einem kleinen Bereich sehr effektiv. Ich hatte gehofft, dass dies eine bestehende Tool irgendwo, aber beim Schreiben an das Team fand ich, es ist ein R-Skript von einem der Autoren, mit einer nachfolgenden Baumanordnung im Grafikprogramm "Zeichner" von einem anderen Mitarbeiter. Ich mochte diese, obwohl, und hoffen, dass sie verfügbar sind breiter.

Ostereier
Am meisten Spaß Zitat stieß ich war der Seite für PHYLIP, und die FAQ und Kredite waren bemerkenswert. Trotz der Tatsache, dass es keine traditionellen Publikation mir zur Verfügung, ein langwieriger "Credits" Seite bietet einige interessante Einblicke über das Projekt. Das "Nein, danke zu" Teil war eigentlich ein faszinierender Blick auf die Wirrungen der Fördermittel zu bekommen, um Software-Entwicklung und Wartung unterstützen. Der Teil über die "Outreach" war besonders amüsant zu uns:

"Hat alles" Outreach "Zeug meine, ich habe zu Zeit gibt Workshops zu kulinarischen Kunststudenten mystifiziert widmen? Diese Zuschüsse sind für die Entwicklung von fortschrittlichen Methoden, und Briefing "die öffentliche oder nicht-universitären Erzieher" zu diesen Methoden scheint eine Verschwendung von Zeit — obwohl ich verbringen einige Anstrengungen auf die Bekämpfung der Kreationisten und Intelligent Design Befürworter, aber ich weiß nicht bringen diese Methoden dabei. "

Auch die Idee der "Reichweite" und Unterstützung für die Nutzung der Werkzeuge ist sicherlich unklar Werkzeuganbietern, offenbar. Training? Yeah, in keiner Weise formal.

Diskussion:

Die Gibbon Genom-Sequenzierungsprojekt stellte eine wichtige und gut dokumentiertes Beispiel für ein typisches Projekt in diesem Bereich. Nach meiner Erfahrung, dies war eine detaillierte Auflistung und Beschreibung als viele andere Projekte, die ich untersucht, und einige Tools, die mir neu und interessant waren bereitgestellt wurden. Eindeutig eine enorme Anzahl und Umfang der Bioinformatik Artikel, Werkzeuge, Repositories, und Konzepte für den Rahmen einer Genom-Sequenzierungsprojekt benötigt. Auf den Spuren der Herkunft von ihnen, obwohl, ist uneben und herausfordernde, und das ist nicht nur in diesem Projekt-es ist ein Problem unter dem Feld. Zugang zu aktuellen Bioinformatik Objekte ist auch unebene, und des künftigen Zugangs kann sogar noch eine Hürde sein, wie Alterungsprojektseiten verschwinden oder unbrauchbar. Dieses Projekt hat eine interessante Momentaufnahme der Stand der Dinge zur Verfügung gestellt, und guten Überblick über den Umfang des Bewusstseins, Fähigkeiten, Ressourcen, und das Wissen, dass die Forscher, Support-Mitarbeiter, oder Studenten müssten Projekte von ähnlichen Umfang erreichen.

little_macEs verwendet einfacher zu sein. Früher haben wir die geringe Zahl der Werkzeuge auf der VAX verwenden, bergauf, im Schnee, in beide Richtungen, natürlich. Als ich ein Doktorand, einen Tag der Rückseite des Labor in den frühen 1990er Jahren, mein Kollege Trey und ich waren auf etwas herumstöbern wir gerade über-das World Wide Web gehört. Wir hatten eines dieser kleinen lustigen Macs mit den Teenie-Bildschirme, und wir fanden die Leute machen texty Web-Seiten mit banalen Schriftarten und Farben ungerade, und über ihre Forschung sprechen.

Obwohl wir beide waren mit einer Vielzahl von installierten Programmen oder Befehlszeilen für Sequenz Lesen und Ausrichtung, Manipulation, Plasmidkarten, Literatursuche und Lagerung, Bildverarbeitung, Phylogenien, und so weiter-wir wussten, dass diese Web-Sache ging, das Thema offen zu brechen.

Nicht lange nach, Ich wurde mehr und mehr Zeit in den hinteren Raum des Labors verbringen, Herausziehen Sequenzen aus diesem Ort NCBI (sehen eine Mitte der 1990er Jahre Schnittstelle hier), und auf der Suche nach neuen Splice-Varianten. Ich fand sie. Nur durch Eingabe-keine Radioaktivität und Gele von mir verlangt! Wie cool war, dass? Wir verließen uns auf Pedros Liste, um mehr nützliche Tools finden (Archiv von Pedro Molekularbiologie Suche und Analyse-Tools.).

Beide von uns ging dann in Postdocs und Arbeitsplätze, die stark in biologische Software und / oder Datenbankentwicklung waren. Wir haben eine Vordersitz auf die Veränderungen in diesem Zeitraum hatte, und es ist wirklich erstaunlich, zu beobachten. Und es war großartig für uns, die wir unsere Interessen-in eine Gesellschaft, die Menschen besser zu nutzen diese Tools hilft entwickelt, und es hat sich wirklich gelohnt.

Am OpenHelix, Wir versuchen immer, im Auge behalten, welche Werkzeuge sind Menschen mit. Wir durch die lange Schleppnetz regelmäßig, lange, lange ergänzende Materialien aus den "Big Data" Arten von Projekten, mit einem Kiemennetz, um die Software-Tools, die in Gebrauch sind in der Gemeinde zu extrahieren. Welche Datenbanken und Websites sind Menschen, die die? Was sind die grundlegenden Dinge, die jeder braucht? Was sind die innovative Dinge zu halten Ausschau nach? Welche Dateiformate oder Begriffe würden die Leute mit einer Ressource herstellen müssen?

Aber als ich begann, es zu tun, Ich dachte,: vielleicht sollte ich das als Ausgangspunkt nutzen, um einige der Probleme von Software-Tools und Daten in der Genomik diskutieren. Wenn Sie waren neu auf dem Feld und musste herausfinden, wie ein Projekt wie das geht, oder welches Wissen, Fähigkeiten, und Werkzeuge, die Sie benötigen würde, können Sie eine Vorstellung davon, wo Sie wollen zu etablieren? So habe ich dieses Papier, um den Stand der Dinge zu analysieren Art: Welche Websites Bioinformatik / tools / Formate / Objekte / Elemente werden in einer Arbeit dieses Umfangs enthalten? Können Sie sie finden? Wo sind die Barrieren oder Gefahren? Könnten Sie lernen, sie zu nutzen und zu replizieren, die Arbeit, oder vorantreiben von hier?

Es wurde Beleuchtungs mir eigentlich bauen sie alle an einem Ort. Es dauerte ein wenig Zeit, um die Werkzeuge, aufzuspüren und zu lokalisieren Informationen über sie. Aber es schien eine Momentaufnahme wert Nahme sein. Und ich hoffe, es werden einige der Bedürfnisse im Bereich, vor einige der wichtigsten Stücke verloren gehen, um den Launen der Zeit und Technik. Und auch ich hoffe, dass das Bewusstsein fördert gutes Verhalten in der Zukunft. Die Dinge scheinen besser zu werden-Gemeinschaft Druck auf Datensätze und Code-Repositories in unterstützten veröffentlichen gestiegen. Wir konnten einige standardisierte Zitat Strategien für die Werkzeuge verwenden, Quellen, und Parameter. Das US NIH ernst über die Verwaltung von "Big Data" und sicherzustellen, dass es ordnungsgemäß verwendet werden kann wurde mit großer Begeisterung aufgenommen worden. Aber es gibt noch einige Hügel zu erklimmen, bevor wir auf der Oberseite sind diese.

Referenz:

L. Carbone, R. Alan Harris, Sante Gnerre, Krishna R. Veeramah, Belén Lorente-Galdos, John Huddleston, Thomas J. Meyer, Javier Herrero, Christian Roos, Bronwen Aken & Fabio Anaclerio & der. (2014). Gibbon-Genom und die schnelle Entwicklung der Karyotyp kleinen Affen, Nature, 513 (7517) 195-201. DOI: http://dx.doi.org/10.1038/nature13679

FigShare Version dieses auf: http://dx.doi.org/10.6084/m9.figshare.1194879

VideoTip der Woche: ENCODE @ Ensembl

Wir haben eine Menge von Tutorials (2 in der Tat, ENCODE Stiftungen & ENCODE @ UCSC), Tipps und Informationen über ENCODE. Wir haben auch eine Menge Tutorials (wieder 2, Ensembl und Ensembl Vermächtnis- auf den älteren Versionen ), Tipps und Informationen über Ensembl, die Datenbank und Browser bei EBI.

Jetzt ist hier ein Tipp der Woche sowohl Ensembl und Codieren. Dies ist einer der neueren Ergänzungen Ensembl die Video-Tutorials. Dieses Video schaut, wie Sequenzen, die in der Genregulation beteiligt sein könnten. Die meisten dieser Daten an Ensembl auf CODIEREN Daten. Dies ist mit der “Matrix,” eine Möglichkeit, die Regulierung Daten wählen Sie braucht auf Zelltypen basieren und die TF. Am Ende der 8 minütigen Video diskutieren sie ein bisschen mehr darüber, wie man alle Daten kodieren.

So, jetzt haben Sie eine Fülle von Informationen hier bei OpenHelix durch unsere Tutorials und unserem Blog über codieren und Ensembl.

Quick-Links:

ENCODE: http://encodeproject.org/ENCODE/
ENCODE @ UCSC: http://genome.ucsc.edu/ENCODE/
Ensembl: http://www.ensembl.org
ENCODE Tutorials: http://openhelix.com/encode
Ensembl Tutorials: http://openhelix.com/cgi/tutorialInfo.cgi?id=95

Video Tipp der Woche: Browsing Schmetterlinge mit GBrowse und Ensembl

Ein paar Monate zurück, wenn der Heliconius (Briefträger) Schmetterlings-Genom Papier wurde veröffentlicht, bekamen wir ein anderes Beispiel dafür, wie die neuen Technologien Sequenzierung geben uns Zugang zu mehr und mehr Genomdaten sehen–bei Arten, die nicht die wichtigsten Modellorganismen. Monarchfalter Genomdaten hatte vor, dass freigelassene sowie. Und Sie wissen vielleicht nicht, dass es einen riesigen Aufwand, um Tausende von Insekten-Genome erhalten–das Projekt i5k. Ich denke, das ist mein Favorit, was ungefähr wo wir heute stehen: Wir können mehr Arten genauer zu untersuchen, als wir jemals zuvor. Nicht nur, dass wir interessante Details aus der Genomsequenz Rahmen, aber interessante Infos über Art evolutionären Beziehungen, und faszinierende Biologie und neuartige Funktionen können ebenso erforscht werden. Ich meine,–das menschliche Genom und seine Variationen sind groß–aber Monarchfalter eine Sonnenkompass! Wie cool ist das??

Und wie die meisten Genom Papiere heute, nur ein Bruchteil der Daten, die erhalten ist im Hauptkörper des Papiers. Das “überzeugende Beispiele” könnte es sein,. Aber der “12,699 vorhergesagte Protein kodierenden Genen” der Heliconius Genom, nur eine Handvoll wirklich im Text angesprochen. Ein paar weitere Handvoll in einigen Zahlen. Der frühere Monarch-Schmetterling Papier geliefert “ein Satz von 16,866 Protein-kodierenden Genen” (und 10 Ergänzungen über das Papier!). Aber für den Zugriff auf die Daten selbst und vergleichen Sie Ihre Gene und Arten von Interesse müssen Sie den Browser machen, die sie begleiten die Papiere.

In diesem Fall haben Sie zwei Möglichkeiten für die Browser-Stile: der Heliconius Genome Consortium (Autoren des Artikels) Aufrechterhaltung eines gbrowse Installation bei ihrer Butterflygenome.org Site. Der Monarch Gruppe hat eine gbrowse am MonarchBase. Darüber hinaus, die Daten für beide ist auch jetzt in inbegriffen Ensembl Als der Juli- 2012 Freigabe 15. [beachten: siehe administrativen Details in den Kommentaren - mm]

Für diese Woche Tipp, den wir fliegen um von den artspezifischen GBrowsers zu den gesammelten Mengen an Ensembl. Es ist großartig, die Spezies-spezifische Seiten für Tiefe von Informationen über die Projekte und Ressourcen, aber es ist auch schön, die zusätzliche Werkzeuge und Anzeigen der größeren Genom Browser haben. Gemeinschaft Browser bieten sehr aktuelle und neue Daten, die noch nicht in den Super-Browser aufgenommen werden könnten, und die super-Browser bieten zusätzliche Werkzeuge und Infrastruktur, die nicht von der Gemeinde Browser verfügbar. Ihre beste Wette ist, um sich bewusst sein, sowohl, und sich bequem mit den wichtigsten Software-Features und ihre Stärken und Schwächen.

Die Bugs Are Coming–und Tausende von ihnen. Bereit sein. Und hüte dich: suchen Sie nach der Recht Superhelden

Note: Ich war unfähig, die Mothra Genom, das war alles in heller Aufregung ist für die letzten paar Tage zu lokalisieren.

Quick-Links:

Heliconius GBrowse: http://butterflygenome.org/

MonarchBase: http://monarchbase.umassmed.edu/genome.html

Ensembl Metazoa: http://metazoa.ensembl.org/

i5k Insekten und anderen Arthropoden Genome Sequencing-Initiative http://arthropodgenomes.org/wiki/i5K

Wenn Sie kamen auf der Suche nach Fotos Schmetterling, try this: http://www.butterfliesandmoths.org/ Dies ist auch ein Bürger der Wissenschaft Website, wo Sie Ihren eigenen Sichtungen einreichen können–Ich habe getan, dass in der Vergangenheit.

Referenzen:

Dasmahapatra, K.K., Walters, J.R., Briscoe, N.Chr., Davey, J.W., Whibley, A., Nadeau, N.J., Zimin, A.V., Hughes, D.S.T., Ferguson, L.C., Martin, S.H. & (2012). Schmetterlings-Genoms offenbart Promiscuous Austausch von Mimikry Anpassungen zwischen den Arten, Nature, DOI: 10.1038/nature11041

Zhan, S., Merlin, C., Boore, J. & Reppert, S. (2011). Die Monarch Butterfly Genome Renditen Einblicke in Long-Distance Migration, Zelle, 147 (5) 1185. DOI: 10.1016/j.cell.2011.09.052

Stensmyr, M. & Hansson, B. (2011). Ein Genom eher zu einem Monarch, Zelle, 147 (5) 972. DOI: 10.1016/j.cell.2011.11.009

Kersey, P.J., Staines, DM, Lawson, D., Kulesha, E., Derwent, P., Humphrey, J.C., Hughes, D.S.T., Keenan, S., Kerhornou, A., Koscielny, G. & (2011). Ensembl Genomes: eine integrative Ressource für genomweite Daten aus Nicht-Wirbeltierarten, Nucleic Acids Research, 40 (D1) D97. DOI: 10.1093/nar/gkr895

Video-Tipps der Woche: Annual Review IV, 2zweiten Hälfte

Wie Sie vielleicht wissen, wir getan haben, diese Video- Tipps-of-the-Woche für FOUR Jahren. Wir haben rund abgeschlossen 200 kleinen Leckerbissen Einführungen zu verschiedenen Ressourcen aus dem letzten Jahr, 2011 (ja, es ist 2012 jetzt). Am Ende des Jahres haben wir eine Art von Urlaub Tradition etabliert: wir machen eine Zusammenfassung Post, sie alle zu sammeln. Wenn Sie irgendwelche von ihnen verpasst haben, es ist ein guter Weg, um einen schnellen Blick an, was nützlich sein könnte, um Ihre Arbeit haben.

Sie sehen den letzten Jahren’ Tipps hier: 2008 In, 2008 II, 2009 In, 2009 II, 2010 In, 2010 II. Das Zusammenfassung der ersten Hälfte des 2011 ist aus der vergangenen Woche zur Verfügung.

Juli 2011

Juli 6: Priorisierung von Genen mit Hilfe der Gene Priorisierung Portal

Juli 13: PolySearch, Suche viele Datenbanken auf einmal

Juli 20: Menschliche Epigenomics Visualisierung Hub

Juli 27: Die neue SIB Bioinformatics Resource Portal

 

August 2011

August 3: SNPexp, Korrelation zwischen SNPs und Genexpression

August 10: CompaGB für den Vergleich von Genom-Browser-Software

August 17: Greifen, Vergleich von Genomen revisited

August 24: Domain Draw für die schnelle Motiv-Diagrammen

August 31: Von UniProt der PSI SBKB und wieder zurück

 

September 2011

September 7: Anlage vergleichende Genomik mit Plaza

September 14: phiGENOME für Bakteriophagengenom Exploration

September 21: Erste flankierenden Sequenzen der genomischen Standorten

September 28: Einführung in die Statistik-Software R

 

Oktober 2011

Oktober 5: VND Ressource für genetische Variation und Arzneimittel-Informationssystem

Oktober 12: Track-Hubs in UCSC Genome Browser

Oktober 19: Mitochondriale Transkriptom gbrowser

Oktober 26: Variation von Daten aus Ensembl

 

November 2011

November 2: MizBee Syntenie Browser

November 9: Die neue Datenbank von genomischen Varianten: DGV2

November 16: MapMi, automatisierte Zuordnung von microRNA locin

November 23: BioMart zentrales Portal das neue

November 30: Phosphida, eine post-translationale Modifikation Datenbank

Dezember 2011

Dezember 7: VarSifter, für die Identifizierung wichtiger Sequenzvariationen

Dezember 14: Große Veränderungen zu NCBI das Genom Ressourcen

Dezember 21: Eierlikör für die Feiertage (oder zu erforschen orthologen Genen)

Dezember 28: Video-Tipps der Woche: Annual Review IV (ersten Halbjahr 2011)

Bekanntgabe der Aktualisierung Tutorial Materials: UniProt, Übersicht der Genome Browser, und World Tour von Ressourcen

Wie viele von Ihnen wissen,, OpenHelix ist spezialisiert auf den Menschen hilft, Zugang und nutzen die Goldmine des öffentlichen bioscience Daten, um die weitere Forschung. Eine der Möglichkeiten, dass wir dies tun, ist durch die Schaffung von Materialien zu trainieren Menschen – Forscher, Kliniker, Bibliothekare, und wer in der Wissenschaft interessiert - auf, wo man Daten, die sie daran interessiert sind, finden, und wie man Daten bei bestimmten öffentlichen Datenbanken und Daten-Repositories zugreifen. Wir haben über habe 100 solche Tutorials auf alles aus PubMed zum Functional Glycomics-Gateway (dazu später mehr).

Darüber hinaus schafft diese Tutorials, wir verbringen auch viel Zeit, um sie genaue und up-to-date. Dies kann eine Herausforderung sein, vor allem, wenn viele Datenbanken oder Ressourcen haben alle Major-Releases um die gleiche Zeit. Unser Team prüft und aktualisiert ständig unsere Materialien und in diesem Beitrag Ich bin glücklich, vor kurzem veröffentlichten Updates zu drei unserer Tutorials ankündigen: UniProt, World Tour, und Übersicht der Genome Browser.

Unsere Einleitende UniProt Tutorial zeigt dem Nutzer, wie man: Text sucht bei UniProt für relevante Protein Informationen, Suche mit Sequenzen als Ausgangspunkt, verstehen, die verschiedenen Arten von UniProt Aufzeichnungen, und erstellen Multi-Sequenz-Alignments von Protein Datensätze mit Clustal.

Unsere Übersicht der Genome Browser stellt Nutzern zur Einführung Ensembl, Map Viewer, UCSC Genome Browser, der Integrierte mikrobielle Genome (IMG) Browser, und die GBrowse Software-System. Wir haben auch auf berühren WebGBrowse, JBrowse, der Integrative Genomics Viewer (IGV), der ARGO Genome Browser, der Integrierte Genome Browser (IGB)Schar, und die Circular Genome-Viewer, oder CGView.

Unsere World Tour für Genomik Resources ist kostenlos und ohne Registrierung zugänglich. Es beinhaltet eine Führung durch Beispiel Ressourcen, organisiert nach Kategorien wie Algorithms and Analysis Tools, Ausdruck Ressourcen, Genom-Browser (beide Eukaryotische und Prokaryotic / Mikrobielle) , Literatur-und Text-Mining-Ressourcen, und Ressourcen auf konzentrierte Nukleotide, Proteine, Wege, Krankheit und Variation. Diese Haupt-Diskussion wird dann in eine Diskussion darüber, wie die Ressourcen mit den freien finden führen OpenHelix Ressource Search Portal, gefolgt von Lern-Ressourcen mit OpenHelix-Tutorials, und eine Diskussion über zusätzliche Methoden des Lernens über Ressourcen.

Quick Links:

OpenHelix Einleitende UniProt Tutorial suite: http://www.openhelix.com/cgi/tutorialInfo.cgi?id=77

OpenHelix Übersicht Genome Browser Tutorial suite: http://www.openhelix.com/cgi/tutorialInfo.cgi?id=65

Kostenlose OpenHelix World Tour für Genomik Ressourcen Tutorial suite: http://www.openhelix.com/cgi/tutorialInfo.cgi?id=119

 


Haben Sie ein Genom + Transkriptom. Nun, was?

Ich war Nachholbedarf in einigen Mailing-Liste Lesen der letzten Woche, als ich sah ein ungewöhnliches Element auf dem kommen UCSC Diskussions-Mailingliste. Jemand, der in den Prozess der Erlangung Genom und Transkriptom-Sequenz für ein neues Projekt wird gebeten die UCSC Gruppe als Anleitung, was zu tun. Es ist eigentlich eine Frage, die wir bereits hören habe viel in Workshops–Menschen sind angesichts Zuschüsse für diese Art von Projekt, oder Pläne für ein neues Sequenzer, dass an ihrem Standort angekommen ist. Ich dachte, andere Menschen könnten diese Empfehlungen nützliche Informationen zu prüfen,, so bin ich wieder Entsendung es hier:

Frage:

Sehr geehrte UCSC Genome Bioinformatics,

Mein Name ist Padraig Doolan und ich bin der Programmleiter für Expression
Microarrays und Bioinformatik an das Nationale Institut für Zelluläre
Biotechnologie (NICB), Irland (www.nicb.ie/). Wir sind ein öffentlich finanzierter
Grundlagenforschung Forschungsinstitut.

Unser kleines Bioinformatik-Gruppe sind gerade erst dabei,
analysisng ein neues Genom (und Transkriptom) für den chinesischen Hamster
Eierstock (FÜR) Zelllinie, die kürzlich veröffentlicht wurde, (Xu et al., Das
genomische Sequenz des chinesischen Hamsters (FÜR)-K1-Zelllinie. Nat
Biotechnol. 2011 Juli 31;29(8):735-41. doi: 10.1038/nbt.1932.) von einem anderen
Gruppe. Wir tun eine Menge von funktionalen Arbeit an diesem Organismus und wir wollen
für ein paar gute Richtlinien (veröffentlichten Arbeiten, Online-Ressourcen, usw.)
die uns helfen könnte, Karte einige erreichbare Ziele im Hinblick auf die
In-silico-Charakterisierung dieses Genoms.

Zum Beispiel, Nach der Sequenz veröffentlicht, was sind den nächsten Schritt(mit)
bei der Bereitstellung von relevanten Informationen? Listen von SNPs? Predicted
Proteom / Sekretom / Anzahl der vorhergesagten Protein-Typen (g.
Kinasen / g-coupled / Atom-/ Membran-lokalisierten), usw.?

Ich bin durch das Human Genome Project Publications Liste suchen
(http://www.ornl.gov/sci/techresources/Human_Genome/publicat/publications.shtml)
für Inspiration, aber diese Art von Analyse-Ausgang ist relativ neu für
unserer Gruppe (Wir sind in der Regel auf der translationalen Medizin fokussiert). Ist
Gibt es eine empfohlene Richtlinien Ihres Instituts für schlagen können
in die Fußstapfen des HGP in in-silico-Analyse des Romans
Genome / Transkriptomen? Kann Ihre Organisation empfehlen ein paar Schlüssel
Papiere oder vielleicht eine gute Analyse-Strategie?

Mit freundlichen Grüßen,
Padraig Doolan

UCSC der Regel versucht, ihre Diskussion zu Besonderheiten der Daten und Software Grenze auf ihrer Seite–denn das ist ihre Mission, natürlich, und weil sie nicht alles Genomik für jedermann sein–sie würden nicht die Zeit für die eigene Arbeit. Aber das war ein besonderer Fall, und sie versammelten eine sehr coole Antwort für Padraig und sein Team.

Die CHO Papier, Padraig Referenzen hatte ich erinnerte mich an die Zeit, aber ich wusste nicht weiter zu untersuchen. Also ging ich zu schauen, ob die Gruppe einen Browser einrichten, und ich war nicht in der Lage, einen zu finden. Ich fand ein Vorschau Montage am Ensembl. Aber ich kann verstehen, warum eine lokale Gruppe würde mehr Details in der eigenen Sammlung und warum sie würde wollen, um einige Dinge selbst zu tun, müssen. Und möglicherweise eine einfache Möglichkeit, die Referenz-Sequenz mit ihren eigenen Daten nicht zu verlängern wartet ein großes Browser-Team um dorthin zu gelangen.

Antwort:

Hallo Padraig,

Ich fragte unseren Ingenieuren und habe diese Liste von Empfehlungen für Sie:

1) Die Ausrichtung aller GenBank mRNAs von Chinese Hamster
2) Die Ausrichtung aller ihrer eigenen Transkriptom-Daten
3) Ausrichten alle GenBank ESTs aus Chinese Hamster
4) Mapping menschlichen Proteinen als entweder aus der UCSC Gen gesetzt oder RefSeq abgeleitet
5) Mapping-Maus-Proteine ​​aus UCSC oder RefSeq
6) Doing a multiple Arten Genom Ausrichtung mit der Maus, Ratte, Kaninchen,
Hund, Elefant, Beutelratte, Schnabeltier, Huhn. Sie paarweise Alignments sowie.
7) Mine der genomischen liest und liest transcriptomic für SNPs. Achten
nicht zu nennen kürzlich vervielfältigt und nur geringfügig abwich Regionen
leichte Abweichungen als SNPs wenn.
\8) Führen Sie mehrere wiederholen Finder.
9) Führen Sie einen CpG-Insel-Detektor.
10) Führen Sie einen guten Genvorhersagen Programm wie Augustus.
11) Versuchen Sie einen nassen Labor-Gruppe bereit, einige DNAse-Assays zu tun….

Ich hoffe, dass dies hilfreich ist. Viel Glück mit Ihrer Arbeit!


Brooke Rhead
UCSC Genome Bioinformatics Gruppe

 

Ich dachte, das war so ziemlich die Liste der Dinge, die ich will mit einem neuen Genom auf einem neuen Browserfenster angezeigt werden sollen. Und der Grund, warum ich denke, dies ist vor allem Schlüssel ist, weil es nur geht das zu mehr und mehr von dieser. Mit dem neuen Sequenzierung Technologien und die Datenflut, mehr Gruppen gehen, um sich mit wichtigen Sequenz-Daten finden für ihre Labors oder ihre lokalen Forschern. Könnten Patienten, könnte Modell-Organismen werden, könnte Spezies. Wie geht es weiter mit diesen Daten ist wichtig.

Was würden Sie tun,? Haben Sie Vorschläge für Gruppen mit diesem Problem konfrontiert?

Auch heute bin gerade passiert ist zu beachten, dass Jonathan Eisen, ein Papier, dass Beratung für Menschen mit neuen Genome bieten könnte verbunden: Wichtige Papier auf Annotation Standards für bakterielle / archael Genome — bereitet für die “Datenflut”. Ich denke, das ist toll, und eine entscheidende Diskussion und das Bewusstsein sich jetzt haben. Für genau den gleichen Gründen–neue Leute sind jetzt mit der Montage und Kommentierung von Features der neuen Genome bei unglaublichen Preisen konfrontiert werden, und wir haben einige Dinge über Best Practices und die Bedürfnisse gelernt. Natürlich, Dinge sich entwickeln–aber ein paar gute Ansatzpunkte sind wirklich hilfreiche Orientierung.

EDIT: habe gerade einen Brief von der CHO Papier Forscher, und sie zeigen Sie mir diese Seite für einige Werkzeuge: http://www.chogenome.org/

Referenzen:

XuK.span>, Z., Sanders-Lorenz, E., Axen, S., Kim, E., Johns, M., Scott, K., & Kerfeld, C. (2010). Einbeziehung Genomik und Bioinformatik über die Life Sciences Curriculum PLoS Biology, 8 (8) DOI: 10,1371 / journal.pbio.1000448, X., Nagarajan, H., Lewis, N., Pfanne, S., Cai, Z., Liu, X., Chen, W., Xie, M., Wang, W., Hammond, S., Andersen, M., Neff, N., Passarelli, B., Koh, W., Fan, H., Wang, J., Gui, Y., Lee, K., Betenbaugh, M., Beben, S., Familie, I., Palsson, B., & Wang, J. (2011). Die genomische Sequenz des chinesischen Hamsters (FÜR)-K1-Zelllinie Nature Biotechnology, 29 (8), 735-741 DOI: 10.1038/nbt.1932

Klimke, W., O'Donovan, C., Weiß, O., Mängel, J., Clark, K., Fedorov, B., Mizrachi, I., Pruitt, K., & Tatusova, T. (2011). Lösung des Problems: Genomannotation Standards vor der Datenflut Standards in Genomic Sciences, 5 (1), 168-193 DOI: 10.4056/sigs.2084864