Margaret Dayhoff, einer der Gründer der Bereich der Bioinformatik

Wenn Sie eine biomedizinische Forscher, Haben Sie jemals Protein-Datenbanken wie UniProt, um Informationen über Proteine, die Sie sich interessieren, erhalten? Weißt du, wie die Datenbank dort ankamen? Ich meine nicht heute, Ich meine vor Jahrzehnten-how hat eine Ressource wie diese kommen auch bestehen, auf allen? Wenn Forscher suchen ein Protein-Datenbank oder richten Aminosäuresequenzen, Häufig werden sie über einen Namen kommen half Start alles Jahren. Margaret Dayhoff war einer der Menschen, die diese wichtige Funktionalität Pionierarbeit, eine wahre Gründer im Bereich der Bioinformatik. Aber in einigen Geschichten und Timelines der Bioinformatik bekommt sie kaum eine Erwähnung. Um das zu feiern Ada Lovelace Day, Ich werde Sie an Dr. einführen. Dayhoff und ich hoffe, das Bewusstsein für ihre wichtige grundlegende Arbeiten auf dem Gebiet der Bioinformatik erhöhen.

Weil wir alle das Protein Informationen zugreifen können wir mit wenigen Tastendrücken heute stehen, es wird leicht vergessen, dass diese Daten 1) nicht immer vorhanden, und 2) wenn es nicht gab, es war nicht leicht zu finden und mit der Arbeit. In den 1960er Jahren, nur eine Handvoll von Protein-Sequenzen wurden bekannt. Aber es war klar, dass mehr dieser Daten wäre unglaublich nützlich in einer Reihe von Möglichkeiten,, und wurde sicher gehen, um in einem immer schnelleren Tempo erzeugt werden. Und bald würde es überwältigen jemandes Person, die Fähigkeit zu analysieren und zu behalten. DNA-Sequenzen ... nicht einmal dahin noch ....

use_of_computersAber es gab einige vorbereitete Geist bereit zu beginnen darüber nachzudenken, diese Daten und die damit verbundenen Chancen um sie herum. Sie waren sich bewusst, dass Computer könnte bei diesen Problemen helfen. Robert Ledley war einer von ihnen. Ledley hatte als Zahnarzt trainiert, aber einen Abschluss in Physik und zunehmend Interesse an den Möglichkeiten der Anwendung von Computer-Ressourcen für die biomedizinische Probleme. Ein Bericht verfasst von Ledley ist eine der ersten Studien der biomedizinischen Berechnung, und können auf Google Books eingesehen werden heute.

Arbeiten mit Ledley in der National Biomedical Research Foundation war eine Frau namens Margaret Dayhoff. Mit einem Bachelor-Abschluss in Mathematik und Studium in Chemie, Dayhoff hatte Pionierarbeit geleistet mit Lochkarten und Datenverarbeitungsmaschinen, molekulare Resonanzenergien von organischen Molekülen bewerten. Sie erhalten eine Watson Computing Laboratory Fellowship, um die Arbeit zu verfolgen, um ihre Doktorarbeit abzuschließen, was beschrieben durch ein Biograph als:

Der Prozess wurde iterativ und benötigt manuell Durchführung Karten von einer Art Maschine zur anderen (4 Arten), da keine einzige Maschine könnte dies die gesamte Iteration. Konvergenz war langsam und über mehrere Monate konnte ein Ergebnis verlangt werden.

800px-punch-card-5081Ich stelle mir vor, sie benutze Maschinen der Antiquitäten können wir sehen, in ein Artikel Zeitgenosse Dayhoff's Fellowship, wobei Miss Eleanor Krawitz, Tabulating Supervisor, bietet einen Rundgang durch die Lochkarten und die Prozesse im Engineering-Quarterly in Columbia 1949. (Dieser Artikel stellt ferner fest, dass Miss Krawitz wurde “die erste weibliche Autorin auf die COLUMBIA ENGINEERING VIERTELJÄHRLICH beitragen.”)

So Dayhoff war jemand, der verstanden hatte und tatsächlich verwendeten "Automatische Berechnung Methoden und Geräte", um Daten zu generieren (Krawitz). Gepaart mit Ledley, sie hatten die Gelegenheit, um die Arbeit zu Protein-Analyse bewegen. In 1962, Dayhoff und Ledley schrieb:

In diesem Beitrag beschreiben wir eine abgeschlossene Computerprogramm für die IBM 7090, die unseres Wissens ist der erste erfolgreiche Versuch der Hilfe für die Analyse der Aminosäure-Chain-Struktur von Proteinen.

Das IBM 7090 finden Sie im Internet in einer Reihe von Orten eingesehen werden. Es sieht aus wie etwas aus einem Science-Fiction-Film. Eine monströse Sammlung von Metall-Kästen mit Spinnen Band Festplatten. Aber wenigstens hatte es Transistoren Anstelle der Röhren an dieser Stelle. Und es funktionierte.

comprotein_title

Das Programm, das Dayhoff und Ledley beschrieben hieß COMPROTEIN. Es war eigentlich ein "Programmiersystem", die aus sechs einzelnen Programme umfasste wurde: MAXLAP, MERGE, PEPT , SUCHE, Qlist, und LOGRED. Das Papier bietet den theoretischen Rahmen für die Montage Protein Chain-Daten von Peptid verdaut, und bietet Schreibmaschine Flussdiagramme, jedes einzelne der einzelnen Programme erklären. Es ist fast unerträglich, an dieser Stelle zu lesen, weil es scheint alles so einfach. Und zu wissen, dass es so lange dauern, bis tatsächlich erzeugen und führen sie macht mein Kopf weh ....

Die Idee wurde von uns in begriffen 1958, aber eigentliche Programmierung wurde erst spät eingeleitet 1960.

Und das Papier wurde in der veröffentlichten 1962. Egads, Ich konnte mich lehren genug Perl, dies in einem Wochenende wollen jetzt.

Aber ich weiß,, es war nicht leicht, und ich meine nicht, dass vorschlagen. Und es war enorm wichtige Arbeit. Es bildete die Grundlage für wichtige allem was ich tue jetzt jeden Tag in der Bioinformatik. Das Ende dieser COMPROTEIN Papier sagt:

Genau wie die Proteine ​​sind Ketten von den gleichen Arten von Molekülen zusammengesetzt, der genetischen Substanzen Desoxyribonukleinsäure (DNA) und Ribonukleinsäure (RNA) sind aus Ketten von zusammen nur 4 verschiedenen Arten von Molekülen als die Nukleotidbasen. Es ist möglich, dass die Reihenfolge der Moleküle in dieser Substanzen kann mit Hilfe des Computer-Programms und einige Computer Versuche in dieser Richtung bestimmt worden sind. Allerdings, Anwendung dieser Techniken auf DNA-und RNA wartet noch auf die weitere Entwicklung in der chemischen experimentellen Methoden.

Ich weiß, Margaret würde Next-Gen-Sequenzierung geliebt habe, die High-Throughput-, High-Volume-, großen Datenmengen Kraftwerksleistung wir heute haben,.

Aber das war nur der Anfang ihrer Arbeit in der Bioinformatik. Sie kann sich mit ihren Ein-Buchstaben-Code für die Aminosäuren, die weniger Lochkarte Stanzen erforderlich. Dayhoff gebrauchte Computer, um Algorithmen zu entwickeln und analysieren die Proteinsequenzen sie zur Verfügung hatte und große Fortschritte im Verständnis evolutionären Beziehungen. Sie schuf Scoring Methoden und Matrizen dass immer noch Grundlagenforschung in diesem Bereich–und wenn du Sequenzalignments Sie können ihren Namen in der Ausgabe sehen! Sie war enorm für diese Arbeit respektiert, wurde durch die Gewährung Agenturen für sie unterstützt.

atlas_cover_1965Es gab eine separate Aspekt ihrer Arbeit, obwohl, Das war weniger gut durch die Finanzierung von Gruppen unterstützt. Sie fing an zu sammeln und zu veröffentlichen regelmäßig die Atlas der Protein-Sequenz und Struktur Bücher. Die erste Ausgabe enthielt 65 Sequenzen. Es scheint, dass Geldgeber waren nicht scharf auf die Finanzierung der Arbeit, dass einige als "Briefmarkensammeln" statt Experimente wahrgenommen. Der Atlas verwandelte in einer Datenbank zur Verfügung gestellt, dass Dayhoff durch Zeichnung, um diese Arbeit zu unterstützen. Allerdings, dieser Aspekt Abonnement erstellt Spannungen zwischen biomedizinischen Forscher, die dachten, dass da die Protein-Sequenzen waren frei verfügbar, Erhebung von Gebühren für eine Datenbank wurde ungerechtfertigte.

Bruno Strasser'S Untersuchung dieser Frist ist eine faszinierenden Blick (pdf) auf die Geschichte, Haltungen, und Rahmen, in dem dies alles aufgetreten. Bei einer Rede zum Jahrestag der GenBank, Strasser untersucht sowohl die visionäre Arbeit Dayhoff, die Datenbank sie gegründet und anderen parallelen Datenbank Entwicklungsprojekte in der Molekularbiologie, und die Spannung um den Wert der Datenbank Kuration.

strasser_talk(http://videocast.nih.gov / Summary.asp?File = 14412 Strasser sprechen beginnt bei etwa 1:09 und endet um 1:45. Sie können per Drag den Fortschrittsbalken an den richtigen Ort und beginnen zu beobachten.)

Aus dem Papier und der Diskussion, wir hören Dayhoff auf die Bedeutung der Arbeit, die sie tat sprechen:

Da erklärte sie an einen Kollegen: "Es gibt eine enorme Menge von Informationen über die Evolutionsgeschichte und biochemische Funktion implizit in jeder Sequenz und die Anzahl der bekannten Sequenzen wächst explosionsartig. Wir halten es für wichtig, diese bedeutenden Informationen zu sammeln, korrelieren sie zu einem einheitlichen Ganzen und zu interpretieren. "

(Dayhoff 1967, von Strasser pg. 111)

Ich möchte Sie ermutigen, das Video zu sehen, wo Strasser erklärt dies, und lesen Sie die Begleiter-Papier ist es ein faszinierender Blick auf eine Zeit, die die Welt der Bioinformatik gegründet, wie wir sie heute kennen,. Es kündet und informiert viel von der Schlacht um Open-Source-Software und Daten, wie wir sie kennen. Nachdem ich gelernt diese Details über diese Zeit, mein Verständnis der Rahmenbedingungen und Diskussionen des Open-Source-Welt, in der wir uns heute wurde viel tiefer. Ich entdeckte in ein Nachruf dass die “stabil, angemessene, langfristige Finanzierung” für PIR (der direkte Nachfahre des Atlas) schließlich kam durch ein paar Monate nach ihrem Tod.

Wenn Sie PIR, das Protein Information Resource heute, oder UniProt , oder eine beliebige Anzahl von anderen Datenbanken und Analysetools für Sequenzvergleiche, oder wenn Sie verlassen sich auf die biomedizinische Forschung für Ihre Gesundheit und Wohlbefinden, Sie sollten schätzen das Leben der Margaret Oakley Dayhoff sowie.

Ich lasse Margaret Dayhoff mit dieser engen, und ich wünschte, ich könnte ihr sagen, wie wichtig ihr Glied in der Kette war zu mir:

Wir sichten über unsere Finger die ersten Körner dieses großen Ausgießung des Informations-und sagen uns, dass die Welt von ihm geholfen werden. Der Atlas ist ein kleines Glied in der Kette aus der Biochemie und Mathematik, Soziologie und Medizin.

(Dayhoff 1968, von Strasser pg. 112)

Referenzen:

• Dayhoff, M. Das. und G. E. Kimball. Lochkarte Berechnung der Resonanzenergien J. Chem.. Phys. 17, 706-717, Ph.D. These, Columbia University, Graduate School of Chemistry, 1949. DOI:10.1063/1.1747374

• Dayhoff, M. Das. und R. S. Ledley. Comprotein: Ein Computerprogramm, um Hilfe Primary Proteinstrukturbestimmung. In Proceedings of the Fall Joint Computer Conference, 1962, 262-274. Santa Monica, CA: American Federation of Information Processing Societies, 1962. http://portal.acm.org/citation.cfm?id=1461546

• Dayhoff, M. Das. 1965. Computer Hilfsmittel zur Bestimmung Proteinsequenz. J. Theor. Biol.. 8: 97-112. doi:10.1016/0022-5193(65)90096-2

• Krawitz, E. Die Watson Scientific Computing Laboratory: Ein Zentrum für wissenschaftliche Forschung mit Rechenmaschinen. Columbia Ingenieurwesen Quarterly, November 1949. http://www.columbia.edu/acis/history/krawitz/index.html

• Ledley, RS. Bericht über den Einsatz von Computern in Biologie und Medizin. National Research Council (US-). Beratenden Ausschusses für Electronic Computer in Biologie und Medizin, National Research Council (US-). Division of Medical Sciences. Veröffentlicht von National Academy of Sciences – National Research Council, 1960. http://books.google.com/books?id=J5grAAAAYAAJ&output=html

• Strasser, BJ. “Sammeln und Experimentieren: Die moralische Volkswirtschaften der biologischen Forschung, 1960s 1980er-Jahre.”, Preprints des Max-Planck-Institut für Wissenschaftsgeschichte, 310, 105-23. 2006. http://www.yale.edu/history/faculty/materials/strasser-MPI-2006.pdf EDIT: neue Lage dieses PDF: http://biologie.unige.ch/assets/brunostrasser/Strasser_MPI_2006.pdf

Andere Quellen:

http://www.dayhoff.cc/ Dr. Margaret Oakley Dayhoff — Pioneer in der Bioinformatik; hat umfangreichere Bibliographien und Biographie. Und Familienfotos.
http://www.springerlink.com/content/9w1118639vl11603/ Margart Oakley Dayhoff 1925-1983

http://books.google.com/books?id=J5grAAAAYAAJ&pg=PP1&output=html Der Einsatz von Computern in Biologie und Medizin Bericht.
http://en.wikipedia.org/wiki/Punch_cards Lochkarte Bild
http://www.columbia.edu/acis/history/krawitz/index.html Lochkartenmaschinen
http://www.uniprot.org/ UniProt
http://pir.georgetown.edu/pirwww/index.shtml PIR
http://www.yale.edu/history/faculty/strasser.html Bruno Strasser homepage
http://videocast.nih.gov/Summary.asp?File=14412 GenBank Jahrestag Gespräche
http://www.biology.arizona.edu/biochemistry/problem_sets/aa/Dayhoff.html Ein-Buchstaben-Code von Dayhoff
http://www.molecularevolution.org/mbl/resources/models/aamodels.php Mehr über Matrizen und Substitutionen
http://www.inf.ethz.ch/personal/gonnet/DarwinManual/node146.html Mehr über Matrizen und Substitutionen

+++++++++++

Dieser Beitrag wurde angeregt durch See Jane Compute, zur Unterstützung der Ada Lovelace Day 2009. Es wird auch auf die eingereicht werden Giant's Shoulder's Blog-Karneval.

Um zu sehen, der Mash Up von Ada Lovelace Day Beiträge von Standort, Thema, oder als Liste gehen Sie hier: http://ada.pint.org.uk/

5 thoughts on "Margaret Dayhoff, einer der Gründer der Bereich der Bioinformatik

  1. Pingback: Der Giant's Shoulders #10 : Stochastische Scribbles

  2. Mary Beitrag Autor

    Dank gioby! Und Sie haben einen ausgezeichneten Geschmack in Namen.

    Es war eigentlich ganz lustig, für die frühesten Programme aussehen. Ich hatte eine gute Zeit mit diesem. Ich liebe die alte Literatur.

  3. Pingback: Proteinstrukturanalyse – How Far We've Come! | Die OpenHelix Blog

  4. Pingback: Tipp der Woche: Neue und verbesserte OMIM ® | Die OpenHelix Blog

Kommentare sind geschlossen.