Tag Archives: biomart

Video Tipp der Woche: TargetMine, Data Warehouse for Drug Discovery

Browsing around genomic regions, layering on lots of associated data, and beginning to explore new data types I might come across are things that really fire up my brain. Für mich, visualization is key to forming new ideas about the relationships between genomic features and patterns of data. But frequently I want to take this to the next step–asking where else these patterns appear, how many other instances of this situation are there in a data set, and maybe adding additional complexity to the problem and refine the quest. This is not always easy to do with primarily visual software tools. This is when I turn to tools like the UCSC Table Browser, BioMart, und InterMine to handle some list of genes, or regions, or features.

We’ve touched on all of these before–sometimes with full tutorial suites (UCSC, BioMart), and sometimes as a Tipp der Woche, InterMine und InterMine für komplexe Abfragen. Learning about the foundations of these tools will let you use various versions or flavors of them at other sites. I love to see tools that are re-used for different topics when that’s possible, rather than building a whole new system. There are ModENCODE, Ratte, yeast mines, und mehr. This week’s tip is about one of those others–TargetMine is built on the InterMine foundation, with a specific focus on prioritizing candidate genes for pharmaceutical interventions. Von their site overview, I’ll add this description they use: TargetMine

TargetMine is an integrated data warehouse system which has been primarily developed for the purpose of target prioritisation and early stage drug discovery.

For more details about their framework and philosophy, you should see their papers (unten verlinkt). The earlier one sets out the rationale, the data types, and the data sources they are incorporating. They also establish their place in the ecosystem of other databases in this arena, which helps you to understand their role. But you should see the next paper for a really good grasp of how their candidate prioritization work with the “Integrated Pathway Clusters” concept they’ve added. They combined data from KEGG, Reactome, und NCI’s PID collections to enhance the features of their data warehouse system.

This week’s Video Tip of the Week highlights one of the tutorial movies that the TargetMine team provides. There’s no spoken audio with it, but the captions that help you to understand what’s going on are in English. I followed along on a browser with their example–they have a sample list to simply click on, and you can see various enrichments of the sets–Wege, Gene Ontology, Disease Ontology, InterPro, CATH, and compounds. They call these the “biological themes” and I find them really useful. You can create new lists from these theme collections. They also illustrate the “template” option–pre-defined queries with typical features people may wish to search. The example shows how to go from the list of genes you had to pathways–but there are other templates as well.

Another section of the video has an example of a custom query with the Query Builder. They ask for structural information for proteins targeted by acetaminophen. It’s a nice example of how to go from a compound to protein structure–a question I’ve seen come up before in discussion threads.

In their more recent paper (also below), they have some case studies that illustrate the concepts of prioritizing targets for different disease situations with their system. They also expand on the functions with additional software to explore the pathways: http://targetmine.mizuguchilab.org/pathclust/ .

So have a look at the features of TargetMine for prioritization of candidate genes. I think the numerous “themes” are a really useful way to assess lists of genes (or whatever you are starting with).

Quick Links:

TargetMine: http://targetmine.mizuguchilab.org/ [beachten: their domain name has changed since the publications, this is the one that will persist.]

InterMine: http://intermine.github.io/intermine.org/

Referenzen:

Chen, Y., Tripathi, L., & Mizuguchi, C. (2011). TargetMine, an Integrated Data Warehouse for Candidate Gene Prioritisation and Target Discovery PLoS ONE, 6 (3) DOI: 10.1371/journal.pone.0017844

Chen, Y., Tripathi, L., Dessailly, B., Nyström-Persson, J., Ahmad, S., & Mizuguchi, C. (2014). Integrated Pathway Clusters with Coherent Biological Themes for Target Prioritisation PLoS ONE, 9 (6) DOI: 10.1371/journal.pone.0099030

Kalderimis A., R. Lyne, D. Butano, S. Contrino, M. Lyne, J. Heimbach, F. Hu, R. Smith, R. Stěpán, J. Sullivan & G. Micklem & (2014). InterMine: extensive web services for modern biology, Nucleic Acids Research, 42 (W1) W468-W472. DOI: http://dx.doi.org/10.1093/nar/gku301

Video Tipp der Woche: InterMine für komplexe Abfragen

Wir waren Fans von InterMine für eine lange Zeit. Wir haben eine tip-of-the-Woche in eine Weile her hervorgehoben, dass Möglichkeiten, die diese Software, um mir von großen Daten-Projekte für viele Arten verwendet werden. Die generische Rahmen InterMine können für den Einsatz bei verschiedenen Projekten angepasst werden–heute werde ich Videos von der FlyMine Installation und der Geschmack sind YeastMine–aber Sie Versionen von diesem handlichen Werkzeug in vielen anderen Orten finden kann sowie.

Das erste Video ist ein breiter Überblick über die verschiedenen Arten von Dingen, die Sie tun können–und obwohl dies FlyMine, Sie werden ein ähnliches Verhalten an den anderen Minen zu finden.

Das nächste Video ist spezifischer zu einer Aufgabe, die Menschen brauchen, um zu erreichen–Arbeiten mit einer Liste von Genen. Dieses Beispiel wurde vor kurzem von den Leuten produziert YeastMine, aber auch dies sollte in ähnlicher Weise in anderen Minen arbeiten. Lesen Sie dazu auch die SGD Blog-Post auf sie–Schaffen, Analysieren, Sparen: Die Macht der Gene-Listen in YeastMine.

Die andere Sache, die ich über dieses Rahmens fallen ist, ist der Aufwand von mehreren dieser Modellorganismus Mines in diesem Koordinaten Intermod Struktur. Ich bin zwar oft vorsichtig “Ein Klick, um sie alle zu knechten” möglichen Anstrengungen, kann es in diesem Wert sein als zentrale Organisationsprinzip, wie wir halten das Hinzufügen mehr Arten Genome, die nicht so gut entwickelten Gemeinden und Infrastruktur, um sie zu unterstützen haben können.

Ich sicherlich verwenden eine Menge von Abfrage-Tools, die ähnlich wie diese sind–wie die UCSC Table Browser, und BioMart. UniProt bietet Möglichkeiten, um Abfragen zu erstellen, die unterschiedliche, aber vom Konzept her ähnlich ist. Mit Hilfe dieser Schnittstellen können Sie einige clevere und komplexe Möglichkeiten, Informationen aus Datenbeständen zu ziehen konstruieren.

Quick-Links:

InterMine: http://intermine.github.io/intermine.org/

FlyMine: http://www.flymine.org/

YeastMine: http://yeastmine.yeastgenome.org/

Intermod: http://intermod.intermine.org

Referenzen:

Smith R.N., Aleksic, J., Butano D., Carr A., Contrino S., Hu F., Lyne M., Lyne R., Ein Kalderimis. & Rutherford K. & (2012). InterMine: eine flexible Datenlagersystem für die Integration und Analyse der heterogenen biologischen Daten., Bioinformatik (Oxford, England), DOI:

Lyne R., R. Smith, Rutherford K., Wakeling M., Varley A., Guillier F., Janssens, H., Ji W., Mclaren P. & Nord-P. & (2012). FlyMine: eine integrierte Datenbank für die Drosophila und Anopheles Genomik., Genome Biology, PMID:

R. Balakrishnan, Park J., K. Karra, Hitz v. Chr., Binkley G., Hong E.L., J. Sullivan, Micklem G. & Kirsch J.m. (2012). YeastMine–ein integriertes Data-Warehouse für Saccharomyces cerevisiae Daten als Mehrzweck-Werkzeug-Set., Database : The Journal of Biological Datenbanken und Kuration, PMID:

J. Sullivan, K. Karra, Moxon S.A.T., Vallejos, A., Motenko H., Wong J.D., Aleksic, J., R. Balakrishnan, Binkley G. & Harris T. & (2013). Intermod: integriert Daten und Werkzeuge für die Vereinigung der Modellorganismus Forschung., Wissenschaftliche Berichte, 3 (1802) PMID:

Video Tipp der Woche: ICGC-Portal für die Krebsgenomforschung

Ein Frage an Biostar über Krebs “Gen-Sets” vor kurzem hat mich Blick auf eine meiner Lieblings-Datenquellen wieder–der ICGC, International Cancer Genome Consortium, und deren Datenportal. Früher Beiträge wir getan haben, wurden auf ihre Legacy-Portal auf Basis (die immer noch auf ihrer Website zur Verfügung). Sie veränderten die Dinge ein wenig mit einem Release im letzten Herbst, und ich hatte nicht diese Änderungen noch bedeckt.

Günstig, sie haben ein kurzes Video erklärt, wie man die Daten, die sie bieten Zugang getan. Sie haben weiterhin neue Daten hinzufügen, und die Software, um zu verfeinern. Sie sollten check it out.

ICGC Data Portal Tutorial von ICGC auf Vimeo.

In der Vergangenheit habe ich einige wirklich nützliche Informationen, um mit einer Lungenkrebs-Zelllinie hatte ich die Prüfung vergleichen. Ich sah die gleiche Mutation im eigentlichen Tumorproben wie es in dieser Zelllinie Jahren gefunden. Aber es gab auch Publikationen, die vor kurzem im Detail über das Projekt und einige interessante Ergebnisse aus den Daten, die dort gefunden worden ist sprechen (unten verlinkt).

Sie müssen wirklich Bergbau werden diese Projekte für die Daten, wenn sie decken Ihren Forschungsbereich. Es gibt eine Menge zu lernen, dass ist noch nicht veröffentlicht worden–nur sicher sein, lesen, auf sein ihre Nutzungsrichtlinien bevor Sie Ihre große Entdeckungen zu den Fachzeitschriften liefern!

Quick-Link:

Datenportal: http://dcc.icgc.org/

Projekt-Homepage: http://icgc.org/

Referenzen:

Hudson (Vorsitzende) T.J., W. Anderson, Areta A., Barker n. Chr., Bell-C, Bernabé R.R., Bhan M.K., Calvo F., Ich Eerola. & Gerhard D.S. & viele andere in einem großen Konsortium… (2010). Internationales Netzwerk von Krebs-Genom-Projekten, Nature, 464 (7291) 993-998. DOI:

Alexandrov L. B., Nik-Zainal S., Gleichstrom-Keil, Aparicio S.A.J.R., Behjati S., Biankin A.V., Bignell G.R., Bolli N., Borg A. & Borresen-Dale A.L. & viele andere in einem großen Konsortium…; (2013). Unterschriften der Mutationsprozesse in menschlichen Krebs, Nature, 500 (7463) 415-421. DOI:

Gonzalez-Perez A., Mustonen, V., Reva B., Ritchie G.R.S., Creixell P., Karchin R., Vazquez M., Fink J. L., Kassahn K.S. & Pearson J.V. & viele andere in einem großen Konsortium… (2013). Computational Ansätze zur funktionellen genetischen Varianten in Krebsgenomen identifizieren, Nature Methods, 10 (8) 723-729. DOI:

Was ist die Antwort? (Gene ID Umwandlung)

Biostar ist ein Ort für die Nachfrage, beantworten und diskutieren Fragen der Bioinformatik. Wir sind Mitglieder derGemeinde und finde es sehr nützlich. Oft Fragen und Antworten ergeben sich bei BioStar dass Germane an unsere Leser sind (Endanwender von Genomik Ressourcen). Jeden Donnerstag werden wir Hervorhebung eine jener Fragen und Antworten hier in diesem Thread. Sie können Fragen in diesem Thread fragen, oder kann man immer mitmachen bei BioStar.

Diese Woche hervorgehoben Frage:

Was ist ein guter “Gen-ID-Konvertierungstool

Dies ist eine ältere Frage, von 2 Jahren, aber immer noch relevant und die Antworten immer noch recht hilfsbereit und voller Ressourcen wie DAVID, BioDBnet, BioMart und andere.

Check it out. Auch, Vielleicht möchten Sie bitte zuerst die dritte Übung unserer UCSC Lernprogramm für Fortgeschrittene . Die Übung:

“Aus einer Liste von Genen UCSC, hinzufügen Gen Symbole und GO-IDs für zusätzliche Informationen über das Gen-Set. Bonusschritt: Add Gehe Begriffe.”

Spaziergänge durch, wie Sie in der Lage sein, dies mit dem UCSC Table Browser tun, mit einigen einfachen Modifikationen.

Video-Tipps der Woche: Annual Review IV, 2zweiten Hälfte

Wie Sie vielleicht wissen, wir getan haben, diese Video- Tipps-of-the-Woche für FOUR Jahren. Wir haben rund abgeschlossen 200 kleinen Leckerbissen Einführungen zu verschiedenen Ressourcen aus dem letzten Jahr, 2011 (ja, es ist 2012 jetzt). Am Ende des Jahres haben wir eine Art von Urlaub Tradition etabliert: wir machen eine Zusammenfassung Post, sie alle zu sammeln. Wenn Sie irgendwelche von ihnen verpasst haben, es ist ein guter Weg, um einen schnellen Blick an, was nützlich sein könnte, um Ihre Arbeit haben.

Sie sehen den letzten Jahren’ Tipps hier: 2008 In, 2008 II, 2009 In, 2009 II, 2010 In, 2010 II. Das Zusammenfassung der ersten Hälfte des 2011 ist aus der vergangenen Woche zur Verfügung.

Juli 2011

Juli 6: Priorisierung von Genen mit Hilfe der Gene Priorisierung Portal

Juli 13: PolySearch, Suche viele Datenbanken auf einmal

Juli 20: Menschliche Epigenomics Visualisierung Hub

Juli 27: Die neue SIB Bioinformatics Resource Portal

 

August 2011

August 3: SNPexp, Korrelation zwischen SNPs und Genexpression

August 10: CompaGB für den Vergleich von Genom-Browser-Software

August 17: Greifen, Vergleich von Genomen revisited

August 24: Domain Draw für die schnelle Motiv-Diagrammen

August 31: Von UniProt der PSI SBKB und wieder zurück

 

September 2011

September 7: Anlage vergleichende Genomik mit Plaza

September 14: phiGENOME für Bakteriophagengenom Exploration

September 21: Erste flankierenden Sequenzen der genomischen Standorten

September 28: Einführung in die Statistik-Software R

 

Oktober 2011

Oktober 5: VND Ressource für genetische Variation und Arzneimittel-Informationssystem

Oktober 12: Track-Hubs in UCSC Genome Browser

Oktober 19: Mitochondriale Transkriptom gbrowser

Oktober 26: Variation von Daten aus Ensembl

 

November 2011

November 2: MizBee Syntenie Browser

November 9: Die neue Datenbank von genomischen Varianten: DGV2

November 16: MapMi, automatisierte Zuordnung von microRNA locin

November 23: BioMart zentrales Portal das neue

November 30: Phosphida, eine post-translationale Modifikation Datenbank

Dezember 2011

Dezember 7: VarSifter, für die Identifizierung wichtiger Sequenzvariationen

Dezember 14: Große Veränderungen zu NCBI das Genom Ressourcen

Dezember 21: Eierlikör für die Feiertage (oder zu erforschen orthologen Genen)

Dezember 28: Video-Tipps der Woche: Annual Review IV (ersten Halbjahr 2011)

Video Tipp der Woche: BioMart zentrales Portal das neue

BioMart ist weit verbreiteten Datenmanagement Open-Source-Software, mit einer Schnittstelle, dass die Endnutzer, um komplexe und individuelle Abfragen über viele Arten und Quellen von biologischen Daten generieren können. Es ist Teil des GMOD Tool-Kit, und viele Projektteams, die große Daten haben die Wahl BioMart Software zu organisieren und ihre Daten zur Verfügung.

Wir haben Fans von BioMart seit Jahren. Es war eines der ersten Software-Tools, die wir beschrieben, wie es war in vielen der Websites integriert, dass wir abgedeckt–wie Ensembl. Schließlich brachen wir es in seine eigene Tutorial-Suite, obwohl, wie es jetzt Dutzende von Gruppen, die Marts eigenen gebaut haben. Obwohl die Haut kann sich ändern, und die Datensätze, die verfügbar sind, werden an verschiedenen Standorten unterschiedlich, der zugrunde liegenden Software-Funktionen sind die gleichen. Learning zu den wichtigsten BioMart Portal nutzen wird Ihnen helfen, alle von ihnen nutzen. Bis vor kurzem die Liste der Datenanbieter, BioMart verwendet wurde auf der Homepage, aber hier ist ein Vorgeschmack auf die Liste von meinen Dias:

In diesem Video-Tipp Ich werde Einführung der neu gestalteten BioMart Haupt-Website, und berühren einige der anderen Version von BioMart, dass Sie kennen zu lernen. Wir werden unsere unser Tutorial Suiten mit dem neuen Look bald, aber die meisten der Software-Funktionalität ist die gleiche wie wir sonst bedeckt (im Abonnement erhältlich).

Es gibt zwei Versionen von BioMart zirkulierenden jetzt. Der v 0.7 ist derjenige, der wahrscheinlich die meisten vertrauten Menschen, die BioMart begegnet sind an jedem der Genomik Websites, die Anlagen haben im Moment. Aber es gibt eine neue und neu gestaltet v 0.8 das ist in der Entwicklung. Es ist derjenige, der an der International Cancer Genome Consortium verwendet wird (ICGC.org) und es gibt auch eine 0.8 BioMart Zentral-Portal zur Verfügung ausprobieren. Schließlich kann dies ersetzen viele der 0.7 Setups, dies hängt jedoch von der Website. Einige können mit Beharrlichkeit 0.7 für eine Weile nicht aktualisiert. So ist es wahrscheinlich sinnvoll, eine Idee, wie man sie beide zu diesem Zeitpunkt verwenden müssen.

Eines der Merkmale des neuen BioMart Schnittstelle, die bereits bekam der Bioinformatik Leute sprechen, ist die ID-Konverter. Dies ist ein häufiges Problem im Bereich, und Steven Turner dachte, das war ein schöner Aspekt der Facelift: BioMart Gene ID-Konverter.

Ich wollte auch zu beachten, dass BioMart eines der Tools, die Sie verwenden können, ist bei Galaxy zu großen Teilen von Daten für weitere Analysen zugreifen. Bei Galaxy, öffnen Sie die “Get Data” Menü, um die BioMart sehen, ist eine der Optionen.

Es gab auch eine Menge Buzz über BioMart letzte Woche, wenn ein “Virtuelle Ausgabe”der Zeitschrift Database veröffentlicht wurde, dass war nicht nur ein Übersichtsartikel über BioMart als Ganzes, sondern auch einige der Mittel, die BioMart für ihre Verwaltung und Abfrage-Schnittstellen sowie. So können Sie sehen, wie weit nützlicher Software ist, unter vielen verschiedenen Arten von Daten-Provider. Sie können die lokale Installationen von BioMart bei einem Anbieter-Website verwenden, oder Sie können die Haupt-Website zur Abfrage verwenden aus einer dieser Quellen sowie–und stärker können Cross-Datenbank-Abfrage zu.

Quick-Links:

BioMart Haupt-Website: http://www.biomart.org/

BioMart neuen Stil Bio Central Portal: http://central.biomart.org/

BioMart Seiten bei GMOD: http://gmod.org/wiki/BioMart

Virtuelle Ausstellung der Datenbank auf BioMart: http://www.oxfordjournals.org/our_journals/databa/biomart_virtual_issue.html

Referenzen:

Kasprzyk, Ein. (2011). BioMart: Fahren einen Paradigmenwechsel in der biologischen Daten-Management Database, 2011 DOI: 10.1093/database/bar049

Zhang, J., Haider, S., Baran, J., Cros, A., Guberman, J., Hsu, J., Liang, Y., Yao, L., & Kasprzyk, Ein. (2011). BioMart: eine Daten Föderation Rahmen für große Verbundprojekte Database, 2011 DOI: 10.1093/database/bar038

Guberman, J., Zu, J., Arnaiz, O., Baran, J., Blake, A., Baldock, R., Chelala, C., Kate, D., Cros, A., Cutts, R., Von Genua, A., Forbes, S., Fujisawa, T., Gadaleta, E., Goodstein, D., Gundem, G., Haggarty, B., Haider, S., Halle, M., Harris, T., Haw, R., Hu, S., Hubbard, S., Hsu, J., Iyer, V, Jones, P., Katayama, T., Kinsella, R., Kong, L., Lawson, D., Liang, Y., Lopez-Bigas, N., Luo, J., Üppig, M., Maurer, J., Moreews, F., Ndegwa, N., Oakley, D., Perez-Llamas, C., Primig, M., Rivkin, E., Rosanoff, S., Schäfer, R., Simon, R., Skarnes, B., Smedley, D., Sperling, L., Spooner, W., Stevenson, P., Stein, K., Teague, J., Wang, J., Wang, J., Whitty, B., Wong, D., Wong-Erasmus, M., Yao, L., Youens-Clark, K., Ich, C., Zhang, J., & Kasprzyk, Ein. (2011). BioMart Zentral-Portal: eine offene Datenbank-Netzwerk für die biologische Gemeinschaft Database, 2011 DOI: 10.1093/database/bar041

Haider, S., Ballester, B., Smedley, D., Zhang, J., Reis, P., & Kasprzyk, Ein. (2009). BioMart Zentral-Portal–einheitlichen Zugang zu biologischen Daten Nucleic Acids Research, 37 (Web Server) DOI: 10.1093/nar/gkp265

World Tour von Workshops, jüngsten Anschlag: Marokko, Afrika

Trainer & Veranstalter

Letztes Jahr hatte ich die Gelegenheit, einen geben Workshop in Ifrane Marokko (UCSC Genome und Tabelle Browser, Galaxy) bei Al Akhawayn Universität. Dieses Jahr, Mary und ich kehrte für einen längeren 3-Tages-Workshop an Universität Hassan II in Mohammadia. OpenHelix war ein Co-Sponsor des Workshops (Spenden unserer Zeit, Materialien und Know-how). Der Workshop deckte eine Vielzahl von Themen aus einer Welt-Tournee von Ressourcen (Tutorial-frei) und einleitende UCSC Genome Browser (Tutorial-frei) und ENCODE (Tutorial-frei) zur Genom-Analyse in Variation dbSNP (Tutorial-Abo) und Analyse mit Galaxy (Tutorial-Abo). Sie können die gesamte Zeitplan der Themen Mohammadia Workshop-Programm hier (pdf).

Wie im letzten Jahr, waren wir mit den Studenten beeindruckt (es gab 117 gesamt, über 50/50 Geschlechterverhältnis). Englisch ist ihre 3. oder 4. Sprache in den meisten Fällen, Marokkanischen Arabisch, Französisch oder verschiedenen afrikanischen Sprachen, die der Sprache ihrer Wahl. Doch, sie waren aufmerksam und fragte sehr scharfsinnig und spannende Fragen. Sie waren auch sehr begeistert

Der Workshop Studenten

Lernende. Es war eine Freude, sie zu lehren.

Wir möchten danken Mohammed Bourde am NIH, wer verbrachte viel Zeit und finanzielle Ressourcen, um diese zu organisieren (und im letzten Jahr) Werkstatt. Wir hoffen, zu wiederholen und erweitern diese für das nächste Jahr und vielleicht in den kommenden Jahren. Wir werden für Sponsoren zu suchen.

Mehrere Fragen wurden in der Werkstatt gefragt, möchten wir die Antworten wiederholen Sie hier und suchen ein paar Antworten von unseren Lesern:

*Ein Student wurde für Weizen-Genom Ressourcen suchen für die Gestaltung von Grundierungen. Der Weizen-Genom ist noch unvollständig, aber es gibt einige Mittel, um loszulegen:
Wheat Genome Sequencing Consortium
Gramene Weizen-Ressourcen
Weizen Genetische und Genomic Resource Center @ Kansas State
Vielleicht auch COGE für konservierte Sequenzen
Herausgegeben hinzufügen:
CerealsDB und
James’ Beitrag auf dem Weizen Entwurf Reihenfolge könnte einen Einblick in die riesige Genom geben.
*Ein anderer Schüler fragte nach Dotplot Tools:
Galaxy bietet eine große Sammlung von Tools, einschließlich EMBOSS Dotplot Analyse, ebenso wie EBI Relief-Tool

* Eine weitere Frage betrifft Suche nach einem "dynamischen Programmierung’ (optimale Lösung) multiples Sequenz-Alignment-Tool, um eine Heuristik einen gegenüberliegenden. Das Problem dabei ist, die Komplexität des Suchraums der dynamischen Programmierung Lösung, Diese Folien-Set kann mit dem Verständnis helfen, Besonders Dias 1-5 und 17-22. Es ist noch zu rechenintensiv. Das sagte, der Student vielleicht prüfen wollen, MSAProps und diese Liste bei Wikipedia.

Sie unseren Lesern noch andere Hinweise zu diesem?

Teaching Moment

* Ein anderer Schüler fragte, ob wir wissen, wie DC-Bereich Praktika in den biologischen Wissenschaften finden. Ein anderer Schüler (Mathematiker aus Mali) war etwas in den USA in der Bioinformatik suchen. Irgendwelche Ideen von Programmen zur afrikanischen Biologie-Studenten in die USA oder Kanada zu bringen?

Wenn unsere marokkanischen Studenten (oder jemand anderes) weitere Fragen haben, wenden Sie sich bitte, sie hier zu fragen,!

 

Und eine Randnotiz. Letztes Jahr hatte ich alle 3 Stunden-Tour Fes. Dieses Jahr habe ich nutzte meine Reise. Mary und ich verbrachten ein paar Tage in Fes und Marrakesch. Meine Familie kam uns in Marrakech und später meine Familie und ich tourte für 8 Tage lang besuchen das Atlas-Gebirge, der Sahara und Fes. Unnötig zu sagen,, es war eine Reise des Lebens. Marokko ist ein faszinierendes und schöner Ort. Ich freue mich auf Ihren Besuch erneut.

Tore und Türen von Fes sind schön

Kamel Ausflug in die Sahara

 

 

 

 

International Cancer Genome Consortium; Interview mit Tom Hudson

Wir haben sprach über der International Cancer Genome Consortium (ICGC) vor eine Reihe von Zeiten, und wir hatten eine Tipp der Woche über das Projekt und die Datenbank im vergangenen Jahr. Es kann einige Zeit für einen neuen Tipp, weil ihre Website und Software hat sich verändert. Einer der ganz cool Aspekte der Zugriff auf die Daten ist, dass sie mit dem BioMart Abfrage-Tool für die Schnittstelle–aber es ist die v0.8 topaktuelle Stil BioMart, dass ein paar nette neue Features hat.

Sowieso, Ich sah einen tweet an diesem Morgen über ein Interview mit einer der Direktoren der ICGC, Tom Hudson. Es ist ein schönes Interview, dass über das Projekt spricht, den Fortschritt, und mehr. Wenn Sie noch folgende gewesen ICGC Arbeit könnten Sie das Interview als ein netter Einstieg nutzen, um die. Und dann sehen Sie sich die Daten–und die BioMart Schnittstelle, die verfügbar ist auf der Baustelle.

Interview (Hut und Spitze zum Hochtöner, der mich darauf gibt):

RT @ ResearchMedia: Dr. Thomas Hudson der ICGC Sekretariat umreißt den Vorteil der Arbeit als Konsortium im Kampf gegen den Krebs # http://t.co/CqM1UQm

Besuchen Sie die ICGC: http://www.icgc.org/ und auf dem Data Portal klicken damit zu beginnen, die Daten, die in nun fließt das.

 

Tipp der Woche: InterMine für den Bergbau “Große Datenmengen”

Die Integration großer Datensätze für Abfragen innerhalb–und über–verschiedenen Sammlungen ist eine der Arenen, die in letzter Zeit wurde sehr aktiv in der Bioinformatik. Da mehr und mehr “Große Datenmengen” Projekte bringen riesige Anzahl von Datenpunkten und Datentypen, dies ist nur immer notwendig. Ich liebe es, Daten durchsuchen, aber es gibt Zeiten, in denen eine groß angelegte angepasste Abfrage ist das, was Sie wollen etwas breiteren Entdeckungen zu machen.

Im Moment gibt es eine Reihe von Ressourcen und Schnittstellen, die ich mich wenden, für die strukturierte und individuelle Anfragen von Datensammlungen. Das UCSC Table Browser, BioMart, Galaxy–diese sind es, ich habe meine Hände auf nahezu kontinuierlich. Aber es gibt noch Lager-und Interface-System, dass wir sehen mehr und mehr: InterMine.

Meine erste wirkliche Begegnung mit InterMine wurde für die modENCODE Daten. Es gibt einige wirklich tolle Datenfluss aus diesem Projekt jetzt (Ich sprach ein wenig über die vor kurzem hier), und die Schnittstelle und Storage-System sie verwenden, ist InterMine.

FlyMine war die Initialzündung für die “Meine” System. Vor einigen Jahren FlyMine wurde als Lager-und Abfrage-System für die steigenden Mengen von fly Daten, die aus verschiedenen Projekten kommenden erstellt wurde. Ziel war es, ein System leistungsfähig genug für Bioinformatik haben + Super User, sondern auch eine freundliche und leistungsstarke Schnittstelle zur Bank Biologen verwenden.

Die erste Papier beschreibt die grundlegenden Komponenten: eine Benutzeroberfläche mit 3 Hauptkomponenten: eine Schnellsuche, die große für das Durchsuchen der; Vorlage Bibliothek, mit der Benutzer Zugriff auf einige vordefinierte Standard-oder wahrscheinlich Abfrage-Typen, die sie für ihre Bedürfnisse optimieren können; und eine voll anpassbare Query Builder für die modernsten Zugang. Da dieses Papier die Entwicklung geht weiter, und es gibt auch andere neue und coole Features, die auch.

Ein weiteres großes Ziel der FlyMine Anstrengung war in der Lage sein, mit Listen umgehen. Eine der häufigsten Fragen, die wir noch in der Werkstatt zu bekommen ist: “Ich habe eine Liste von _____. Was ist der beste Weg, um damit umzugehen?” FlyMine–und die InterMines im Allgemeinen–Menschen zu helfen, abzufragen und zu verwalten ihre Erkundungen mit Listen von Sachen.

Die MyMine Merkmal der InterMines ist auch eine schöne Komponente. Sie können einen Benutzernamen und ein Geschäft Dinge, die Sie wiederholt Zugang zu haben: Anfragen, Listen, usw..

Es gibt andere Leute mit InterMine für ihre Systeme zu–einer neueren Arbeit auf TargetMine, für “Gene Priorisierung und Target Discovery” ist verfügbar, und könnte als eine bevorstehende Spitze erscheinen! Jennifer hat einen Tipp YeastMine von SGD einmal als gut.

Aber was ausgelöst mich zu diesem Tipp ist, dass ein Schreiben der kam RGD Mailing-Liste der vergangenen Woche, dass dies so:

Effektive Freitag, Mai 20th, 2011 der MCW BioMart Werkzeug eingezogen werden von RGD und der MCW Proteomics-Center. Für den Bergbau Ratte Daten, Wir haben festgestellt, dass die RatMIne Werkzeug einfacher zu bedienen ist, flexibler und umfasst mehrere Typen von Daten als BioMart. Darüber hinaus, RatMine umfasst Analyse-Tools nicht in BioMart gefunden, geben RatMine Benutzer nur einen einzigen, intuitive Schnittstelle sowohl für Beschaffung und Analyse von Daten.

So sind sie voll Umzug nach InterMine und zurückhaltend den Rat BioMart, ausschließlich mit RatMine bei ihrer Installation. Also das Tipp der Woche erkunden InterMine, RatMine, und einige andere Mines. Das ist eine Menge Boden zu decken–aber es ist wohl wert Ihre Zeit, um über InterMine wissen, wie es ganz allgemein verfügbar wird. Es ist auch wichtig zu verstehen, wie man mit den Minen abfragen, wenn Sie die Daten auf Galaxy bringen für die weitere Analyse wollen. Wenn Sie Galaxy besuchen Sie feststellen, dass ihre “Get Data” Abschnitt ermöglicht Ihnen den Zugriff Bergwerk-Tools–aber Sie müssen noch wissen, wie man die grundlegenden Fragen bei der Host-Seite zuerst tun.

Obwohl dieser Tipp auf RatMine Touch, der Schwerpunkt liegt in der allgemeinen InterMine suite. RGD sagte auch, dies in ihrer Mitteilung:

Für einen Überblick über RatMine und wie man es benutzt, Gehen Sie auf die RGD Tutorial-Video, “Eine Einführung in die RatMine Database”, bei http://rgd.mcw.edu/wg/home/rgd_rat_community_videos/an-introduction-to-the-ratmine-database2. Alternativ, folgen Sie dem “self-guided tour” von RatMine durch Klicken auf die “Machen Sie eine Tour” Link am Anfang jeder Seite RatMine.

Zum Ausprobieren RatMine für sich selbst, gehen Sie zu http://ratmine.mcw.edu/ und mit vereinfachten Data-Mining-und Analyse loslegen.

Also, wenn Sie wollen mehr spezifische Informationen über die Verwendung RatMine haben, sicher sein, zu prüfen, ihre Einführung.

Quick Links:

InterMine: http://intermine.org/

RatMine: http://ratmine.mcw.edu/

modENCODE: http://www.modencode.org/

Galaxy: http://usegalaxy.org/

Referenz:
Lyne, R., Smith, R., Rutherford, K., Wakeling, M., Varley, A., Guillier, F., Janssens, H., Ihr, W., Mclaren, P., Nördlich, P., Rana, D., Riley, T., Sullivan, J., Watkins, X., Woodbridge, M., Lilley, K., Russell, S., Ashburner, M., Mizuguchi, K., & Micklem, G. (2007). FlyMine: eine integrierte Datenbank für Drosophila und Anopheles Genomik Genome Biology, 8 (7) DOI: 10.1186/gb-2007-8-7-R129

Mining die “Große Datenmengen” ist…faszinierend. Und notwendig.

Wenn wir Workshops kommenden up, Ich verbringe einige Zeit Werkzeugkosten um in den großen Daten zu sehen, ob es Änderungen seit ich das letzte Mal darüber gesprochen haben, Aktualisierung der Folien bei Bedarf, und manchmal bilden eine Hypothese und Prüfung ist. (PS: wir sind an der Baylor nächsten, wenn jemand für einen Workshop dort suchen.) Am Freitag habe ich total verloren mich in einer Abfrage, die an begann UCSC im ENCODE Daten, und landete in der ICGC BioMart. Und wow. Muss ich wünschte, ich hätte ein Labor somedays….

Einer der Kommentare bei unserem letzten Workshop war, dass die ENCODE Daten über Zelllinien ist nicht dasselbe wie Blick auf Gewebe. Und ich stimme völlig mit, dass–aber die Maus ENCODE Daten geht um Hilfe zu holen, die Art von Daten. Aber als jemand, der viel Zeit Kultivieren von Zellen in der Vergangenheit verbracht, Ich bin daran interessiert zu wissen, wie verschiedene Zelllinien sind “Referenz” Genom ergänzen. Und es gibt einen bestimmten Teil des menschlichen ENCODE-Projekt, das an dieser Suche ist: Gemeinsamen Zelle CNV track.

Hier ist, was ich habe: Eine Tabelle Browser-Abfrage für die strukturellen Veränderungen aussehen, dass immer wieder in den waren 3 Zelllinien, die untersucht wurden: GM12878, HepG2, und K562. Ich fragte mich,: wie viele dieser CNVs Überschneidungen mit bekannten Genen? Und welche Arten von Variationen gibt es? Hier ist ein Beispiel dafür, wie ich strukturiert, dass Abfragen für eine der Zelllinien:

Diese Abfrage liefert normalen Abschnitte, Amplifikationen, Löschungen–und einige Streichungen sind homozygot und einige sind heterozygot. Einer der Punkte, die ich machen in der ENCODE Workshop ist, dass wenn ich mit einem Zelllinie Ich wäre neugierig auf diese Art von Dingen darüber wissen–Ich wünschte, jemand würde HeLa und die anderen großen Zelllinien da draußen zu tun. (Wahrscheinlich jemand, aber ich weiß nicht über die Daten wissen. Wenn jemand hat es, gib mir ein Holler.)

Also bin ich um diese Variationen arbeiten, und ich habe neugierig eine bestimmte Region in einer der Zelllinien. Es dauerte eine Region mit einigen ziemlich wichtig aussehende Gene. Ich ging in die Literatur zu finden, die diese Region bekannt ist, um ein Problem in einigen Krebsarten werden.

Ich ging auf die ICGC Daten, um zu sehen, wenn etwas Interessantes drehte sich mit diesen Genen. Und wow–whadda ya know: es gibt nicht eine Tonne Daten in diesem Datensatz noch, aber ich fand einen signifikanten Zusammenhang zwischen einigen der Daten, die bereits dort von echten Tumoren und was ich in der Zelllinie gefunden. Es ist zu früh für Schlussfolgerungen über die. Es ist schwer, in diese großen Daten-Projekte wissen, was Sie * sind nicht * zu sehen, wie viel ist schon drin, wie viel ist nicht, usw.. Aber ich überprüft eine Reihe von anderen Genen und keiner zeigte diese Art von Muster sah ich.

Wegen des ICGC Nutzungsrichtlinien, Ich glaube nicht, dass ich gezielt darüber sprechen, was ich sah. Aber es war sehr neugierig. Wenn ich ein Labor hätte, würde ich als Student auf sie gesetzt haben heute Morgen ;)

Und mein Punkt ist, diese: die Daten nicht in den Zeitungen mehr. Es ist in den Datenbanken. Und Sie müssen es Bergbau–diese großen Daten-Projekte werden übergeben Sie die Spitzhacken und verweist Sie auf die Minen.

++++++++++++

Was Sie tun müssen, was ich getan habe:

1. Ein Verständnis für die UCSC Funktionen und die ENCODE Daten. Schauen Sie sich unsere Tutorials auf diejenigen, die frei verfügbar sind, wie sie von UCSC und der ENCODE Team UCSC sind gesponsert.

2. BioMart: haben wir ein Tutorial auf dieser, aber es ist in unserem Abo-Paket.

Was brauchen Sie nicht: aktuellen Literatur. Es ist nicht in der Zeitung, und vielleicht nie. Das “Große Datenmengen” Zeug ist in den Datenbanken, und nur geringe Mengen können wirklich in die traditionelle Art und Weise veröffentlicht werden.