تلميح فيديو للأسبوع: UniProt updates, now including portable BED files

UniProt is one of the core resources that provides tremendously important curated information about proteins. You will find links to UniProt in lots of other tools and databases as well, but we’ve always championed going directly there for the full look at all the wide range of information they offer. Their foundation remains solid, but they also continue to add new and useful features over time. Recently they had a webinar to describe some of the new things, and the recording of that webinar will be this week’s Video Tip fo the Week.

The video starts with an overview of the whole UniProt site. The core of their great resource is the same, بالطبع. UniProtKB, UniRef, and UniParc are there for various ways to look across the data. The handy Proteomes collection of the proteins in a given species is available, and they also have reference proteomes from that access point. There’s a short section in the video that’s a guide to the basic search functions.

حول 9 minutes in they introduce the UniRule annotation features. When certain conditions are met, an annotation gets applied to a protein–which you can trace from the protein pages by clicking on the UniRule link for that annotation. unirule_sampleAnd their software offers a very cool way to look and see how/when conditions are applied. It will load a decision flow path and highlights what the logic rules were used in that particular case, so you can trace it and understand how a protein got a given item. That’s what I illustrate in the screen shot here.

حول 14 لي, the topic changed to the new Genome Annotation Tracks. They now offer you a way to take their annotations for a UniProtKB entry and use them with a separate genome browser. They hand you BED or BigBed files for different features. You can also load the whole thing as a Hub file to see all the sequence feature data at once. They are species-specific, and started with human, but others are coming. You can access them from the “التنزيلات” area of the homepage. The video also described a bit about the structure there as well. So you could take these files to ENSEMBL أو UCSC متصفح الجينوم and load them, with all the UniProt features now to compare to the existing genomic context at those browsers. They illustrate how you can look at the “active site” شروحه, but you can also look at post-translation modification sites, المجالات, الخ. This was a feature that was new to me, and looks like a terrific idea.

So even if you think you know UniProt, check out these new options for additional ways to interact with the high-quality information they provide. الاشياء الجيدة.

UniProt: http://www.uniprot.org/


وUniProt كونسورتيوم (2014). UniProt: a hub for protein information أبحاث الأحماض النووية, 43 (D1) دوى: 10.1093/nar/gku989


الجمعة SNPpets

This week’s SNPpets include transcription factor binding site evolution–with their secret partners transposable elements; PrecisionFDA coming along; bad habits of bioinformaticians; new synthetic biology tools and rock star status; consumer reluctance to share their health data; Russian genomes on the way. وأكثر من ذلك, including the XKCD on DNA in case you missed it.

SNPpets_2ترحيب لدينا ميزة جمع الجمعة الارتباط: SNPpets. خلال الأسبوع صادفنا الكثير من الروابط والقراءات التي نعتقد أنها مثيرة للاهتمام, ولكن لا تجعل من لبلوق وظيفة. ها هم لمتعتك…

تلميح فيديو للأسبوع: TargetMine, Data Warehouse for Drug Discovery

Browsing around genomic regions, layering on lots of associated data, and beginning to explore new data types I might come across are things that really fire up my brain. بالنسبة لي, visualization is key to forming new ideas about the relationships between genomic features and patterns of data. But frequently I want to take this to the next step–asking where else these patterns appear, how many other instances of this situation are there in a data set, and maybe adding additional complexity to the problem and refine the quest. This is not always easy to do with primarily visual software tools. This is when I turn to tools like the UCSC الجدول المستعرض, BioMart, و الدولية لإزالة الألغام to handle some list of genes, or regions, or features.

We’ve touched on all of these before–sometimes with full tutorial suites (UCSC, BioMart), and sometimes as a نصيحة الأسبوع, الدولية لإزالة الألغام و InterMine لاستعلامات معقدة. Learning about the foundations of these tools will let you use various versions or flavors of them at other sites. I love to see tools that are re-used for different topics when that’s possible, rather than building a whole new system. There are ModENCODE, نصيحة, yeast mines, وأكثر. This week’s tip is about one of those others–TargetMine is built on the InterMine foundation, with a specific focus on prioritizing candidate genes for pharmaceutical interventions. من their site overview, I’ll add this description they use: TargetMine

TargetMine is an integrated data warehouse system which has been primarily developed for the purpose of target prioritisation and early stage drug discovery.

For more details about their framework and philosophy, you should see their papers (ترتبط أدناه). The earlier one sets out the rationale, the data types, and the data sources they are incorporating. They also establish their place in the ecosystem of other databases in this arena, which helps you to understand their role. But you should see the next paper for a really good grasp of how their candidate prioritization work with the “Integrated Pathway Clusters” concept they’ve added. They combined data from KEGG, ركتوم, و NCI’s PID collections to enhance the features of their data warehouse system.

This week’s Video Tip of the Week highlights one of the tutorial movies that the TargetMine team provides. There’s no spoken audio with it, but the captions that help you to understand what’s going on are in English. I followed along on a browser with their example–they have a sample list to simply click on, and you can see various enrichments of the sets–مسارات, أنتولوجيا الجينات, Disease Ontology, InterPro, CATH, and compounds. They call these the “biological themes” and I find them really useful. You can create new lists from these theme collections. They also illustrate the “template” option–pre-defined queries with typical features people may wish to search. The example shows how to go from the list of genes you had to pathways–but there are other templates as well.

Another section of the video has an example of a custom query with the Query Builder. They ask for structural information for proteins targeted by acetaminophen. It’s a nice example of how to go from a compound to protein structure–a question I’ve seen come up before in discussion threads.

In their more recent paper (also below), they have some case studies that illustrate the concepts of prioritizing targets for different disease situations with their system. They also expand on the functions with additional software to explore the pathways: http://targetmine.mizuguchilab.org/pathclust/ .

So have a look at the features of TargetMine for prioritization of candidate genes. I think the numerous “themes” are a really useful way to assess lists of genes (or whatever you are starting with).

TargetMine: http://targetmine.mizuguchilab.org/ [مذكرة: their domain name has changed since the publications, this is the one that will persist.]

الدولية لإزالة الألغام: http://intermine.github.io/intermine.org/


تشن, Y., تريباثي, L., & Mizuguchi, K. (2011). TargetMine, an Integrated Data Warehouse for Candidate Gene Prioritisation and Target Discovery بلوس ONE, 6 (3) دوى: 10.1371/journal.pone.0017844

تشن, Y., تريباثي, L., Dessailly, ب., Nyström-Persson, ج., أ ت. الإعلانية, س., & Mizuguchi, K. (2014). Integrated Pathway Clusters with Coherent Biological Themes for Target Prioritisation بلوس ONE, 9 (6) دوى: 10.1371/journal.pone.0099030

Kalderimis A., R. لين, D. Butano, S. Contrino, M. لين, J. Heimbach, F. هو جين تاو, R. سميث, R. Stěpán, J. سوليفان & G. Micklem & (2014). الدولية لإزالة الألغام: extensive web services for modern biology, أبحاث الأحماض النووية, 42 (W1) W468-W472. دوى: http://dx.doi.org/10.1093/nar/gku301

أدوات المعلوماتية الحيوية المستخرجة من مشروع جينوم الثدييات نموذجي [تكملة]

هذا هو الجدول 1 الذي يصاحب بلوق وظيفة كاملة: أدوات المعلوماتية الحيوية المستخرجة من مشروع جينوم الثدييات نموذجي. رؤية آخر الرئيسية للحصول على التفاصيل والشرح. جدول طويل للغاية للحفاظ على في آخر, ولكن أردت أن تكون على شبكة الانترنت للبحث. توجد نسخة أيضا في FigShare: http://dx.doi.org/10.6084/m9.figshare.1194867

مواصلة القراءة

أدوات المعلوماتية الحيوية المستخرجة من مشروع جينوم الثدييات نموذجي

في هذا بلوق وظيفة ممتدة, أصف جهودي لاستخراج المعلومات حول البنود المتعلقة المعلوماتية الحيوية، من ورقة تسلسل الجينوم الأخيرة, وهذا يثير قضايا أكبر في مجال. انها طويلة, وهذا شيء من هجين بين بلوق وظيفة وشكل ورقة, فقط لإعطائه بعض هيكل لتنظيم بلدي. كما سيتم نشرها نسخة من هذا في FigShare مع مجموعة البيانات الكاملة. بفضل ضخمة لفريق المشروع جيبون الجينوم لورقة رائع وجمع الموثقة على نطاق واسع من العمليات ومواردها. القضايا أردت أن أسلط الضوء على وشك الوصول إلى أدوات المعلوماتية الحيوية بصفة عامة وليست محددة لهذا المشروع على الإطلاق, ولكن لا حول الحقل.


في مجال المعلوماتية الحيوية, هناك الكثير من النقاش حول البيانات وتوافرها مدونة, واستنساخ أو تكرار البحث باستخدام الموارد وصفها في الأعمال السابقة. لاستكشاف نطاق المشكلة, لقد استخدمت نشر مؤخرا مشروع تسلسل الجينوم جيبون موثقة جيدا كنقطة انطلاق لتقييم الأدوات, مستودعات, مصادر البيانات, والبنود ذات الصلة المعلوماتية الحيوية الأخرى التي تم استخدامها في المشروع الحالي. انتزعت تفاصيل البنود المعلوماتية الحيوية اسمه من النشر, والموقع والمعلومات حول الأدوات واستكشاف ثم.

وتدل سوى جزء صغير من العناصر المعلوماتية الحيوية من المشروع في الجسم الرئيسي للورقة (~ 16٪). تم العثور على معظمها في المواد التكميلية. وكما نوهنا في الماضي, لا تنشر البيانات ولا الأدوات اللازمة في هيكل الورقية التقليدية أكثر من ذلك. من بين أكثر من 100 البنود المعلوماتية الحيوية وصفت في العمل, توافر وسهولة الاستخدام يختلف كثيرا. يقيم بعض أعضاء هيئة التدريس أو الطلاب على المواقع على شبكة الإنترنت, بعض المواقع على المشروع, البعض في مستودعات كود. وتنشر بعض في الأدب التقليدي, بعضها المنشورات أطروحة طالب, بعض لا يتم نشر أي وقت مضى وفقط موقع على شبكة الإنترنت أو دليل ثائق البرنامج يعمل على توفير البيانات المطلوبة. وهذا يعني أن المعلومات حول كيفية استخدام أدوات غير متساوية جدا, والدعم في كثير من الأحيان غير موجودة. الوصول إلى إصدارات البرامج المختلفة يشكل تحديا إضافيا, إما لأدوات مفتوحة المصدر أو المنتجات التجارية.

استراتيجيات نشر وتخزين جديدة, أدوات تكنولوجية جديدة, والوعي المجتمعي الواسع والدعم بدأت تتغير هذه الأمور إلى الأفضل, وسوف يساعد بالتأكيد للمضي قدما. استراتيجيات لأدوات الرجوع باستمرار, إصدارات, والمعلومات المتعلقة بها سيكون مفيدا للغاية. يجوز للمجتمع المعلوماتية الحيوية تحتاج أيضا إلى النظر في الحاجة إلى إدارة بعض تاريخية, القطع الأساسية التي تعتبر مهمة لهذا الحقل, وبعضها قد تحتاج لانقاذهم من وضعهم الحالي من أجل أن تبقى متاحة للمجتمع في المستقبل.


من موقع الطبيعة, أنا حصلت على نسخة من الصحيفة التي نشرت مؤخرا: جيبون الجينوم وتطور النمط النووي سريع القردة الصغيرة (كاربوني وآخرون, 2014). من نص ورقة والمكملات, استخلصت جميع المراجع يدويا لأدوات قاعدة البيانات المسمى, مواقع مصدر البيانات, أنواع الملفات, برامج, المرافق, أو غيرها من أجزاء متحركة الحسابية أن أتمكن من تحديد. ربما تكون هناك بعض غاب عن هذه العملية, مثلا, الأسماء التي لم تعترف أو لا اتصال مع بعض الأدوات الحالية (أو بعض الصورة ولدت من أداة, ربما). وكانت بعض الإشارات إلى "في بيت بيرل البرامج النصية" أو لم تدرج سيناريوهات "العرف" أخرى عادة ما لم تكن قد تتاح. قطع اعتبرت ويجري "بطريقة مماثلة لتلك التي سبق وصفها" في بعض مرجعية أخرى كانت موجودة, وأنا لم أذهب المنبع إلى الأوراق السابقة لاستخراج هذه التفاصيل. البرامج المرتبطة معدات المختبرات, مثل التعاقب (تقع في مختلف المؤسسات) أو لم تدرج آلات PCR. لذلك هذا على الأرجح يمثل العد تحت البنود البرمجيات المستخدمة. كما أنني اتصلت الفريق البحثي لبضعة أشياء إضافية, وسرعان ما تلقت المساعدة والتوجيه. باستخدام محركات البحث على الإنترنت نموذجية أو البحث عن ناشر أو الداخلية في الموارد المواقع, حاولت لمطابقة البنود على مصادر البرمجيات أو الاستشهادات للعناصر.

ما أنا وضعت في دلو شملت أسماء محددة من العناصر أو الكائنات التي من المحتمل أن تكون ضرورية و / أو غير مألوفة للطلاب أو الباحثين من خارج مجتمع المعلوماتية الحيوية. بعضها ذات الصلة, ولكن مختلفة. مثلا, تحتاج إلى فهم ما "أنتولوجيا الجينات"هو ككل, ولكن عليك أيضا أن تعرف ما "GOslim"هو, الفرق المفاهيمي وكائن منفصل في نظام التعيين وجودي هنا. بعضها المكونات الفرعية من الأدوات الأخرى, لكن جوانب مهمة لفهم (GOTERM_BP_FAT في DAVID أو من randomBed BEDTools) وتكون كل بند من البنود الواردة أسماؤهم في التقرير, وهذه قد تكون غامضة لغير الممارسين. قد نختلف مع الآخرين المتخصصين في المعلوماتية الحيوية انتدابهم إلى هذه المجموعة. يجوز لنا مناقشة إزالة أو إدراج هذه في المناقشات حول لهم في التكرار المستقبلية للقائمة.


بعد إنشاء قائمة رئيسية من مراجع الكائنات المعلوماتية الحيوية أو البنود, تم فحص القائمة وأعدمت عن التكرارات أو جوانب لا يمكن تعقبها. وعادة ما يشير إلى القضاء "في بيت بيرل البرامج النصية" أو البرامج النصية "العرف" أخرى, إلا إذا تم تقديم إشارة خاصة إلى مستودع مدونة. وأدى ذلك إلى 133 البنود المتبقية.

كيف يتم الرجوع إليها? حيث في العمل?
كل من نشر الرئيسي (14 صفحات PDF) و أول ملف معلومات تكميلية (133 صفحات PDF) قدمت أسماء الأشياء في استخدام المعلوماتية الحيوية لهذا المشروع. تم الرجوع إليها كافة العناصر المشار إليها في الورقة الرئيسية أيضا في الملحق. كان عدد الكائنات اسمه في الورقة الرئيسية 21 من 133 المكونات المدرجة (~ 16٪). وهذا يتفق مع أنواع أخرى مماثلة من كونسورتيوم أو أوراق "البيانات الكبيرة" التي كنت استكشافها قبل: الجزء الأكبر من المعلومات الضرورية حول أدوات البرمجيات, مصادر البيانات, طرق, المعلمات, وميزات كانت في المواد التكميلية واسعة.

يتم الرجوع إليها في البنود بطرق مختلفة. أحيانا تتم تسمية أنها في متن النص الرئيسي, أو الطرق. أحيانا يتم تضمينها كما تلاحظ. أحيانا يرد ذكره إلا في الأساطير أدوات شخصية, أو فقط في المراجع. في هذه الحالة, تم العثور على بعض التفاصيل في قسم "معلومات الكاتب".


كما ذكر أعلاه, تم العثور على الأكثر في المعلومات الإضافية. وفي هذا المثال, هذا يمكن أن يكون في النص أو في الجداول. هذا هو نموذجي جدا من هذه الأوراق المشروع كبيرة, في تجربتنا. يجب على أي شخص يحاول المنشورات النص من الألغام لهذا النوع من المعلومات يكون على علم بذلك مجموعة متنوعة من المواقع لهذه المعلومات.

المعلوماتية الحيوية الأشياء التي تشارك في هذه الورقة?
وصف أدوات المعلوماتية الحيوية, موارد, قواعد البيانات, ملفات, الخ, كان دائما تحديا. هذه هي مشابهة ل"الكواشف" أن كنت قد وضعت في أوراقي benchwork الأحياء منذ سنوات. ويمكن أن يهم إلى نتائج, مثل البائعين انزيم, الإصدارات سلالة الماوس, أو تفاصيل أنواع الأجسام المضادة. وهي تشكل الأشياء التي ستحتاج إلى إعادة إنتاج أو تمديد عمل, أو لفهم سياق مناسب. ولكن في حالة المعلوماتية الحيوية, هذا يمكن أن يعني صيغ الملفات مثل FASTQ أو AXT شكل من UCSC متصفح الجينوم. يمكن أن يعني مخزون الموارد مثل SRA. ويمكن أن تكون مختلف إصداراتها مجموعات البيانات المختلفة تحميلها من ENSEMBL (الإصدار 67, 69, 70, أو 73 هنا, ولكن التي عدها مرة واحدة فقط كما ENSEMBL). قد يكون من الإشارات إلى ركتوم في جدول.

مع هذا التعريف الواسع في الاعتبار, جدول 1 يوفر قائمة المعلوماتية الحيوية يدعى الأجسام المستخرجة من هذا المشروع. اسم أو لقب أو تسمية, الموقع الذي يمكن العثور عليها (إذا كان متوفرا), ويتم تضمين النشر أو الاقتباس بعض عندما يكون ذلك ممكنا. أخيرا, عمود يحدد ما إذا وجد في الورقة الرئيسية، فضلا.

ما لم تتم الإشارة إلى أن بعض إشارات عدة مرات في السياقات والأعراف المختلفة, مع قد تجعل الناس لا يدركون كيف وكثيرا ما تستخدم هذه. مثلا, ومن المفارقات, RepeatMasker تمت الإشارة مرات عديدة بدأت لوقف بمناسبة النتيجة عند نقطة واحدة.

جدول 1. أدوات البرمجيات, الأجسام, تنسيقات, ملفات, والموارد المستخرجة من مشروع تسلسل جينوم الثدييات نموذجي. رؤية إصدار الويب تكملة لهذا بلوق وظيفة: http://blog.openhelix.eu/?p=20002, أو الحصول على FigShare: http://dx.doi.org/10.6084/m9.figshare.1194867

أدوات المعلوماتية الحيوية المستخرجة من مشروع جينوم الثدييات نموذجي [تكملة]
أدوات المعلوماتية الحيوية المستخرجة من مشروع جينوم الثدييات نموذجي [تكملة]


ماذا يمكننا أن نتعلم عن المصدر أو استخدام هذه المواد?
البحث عن المعلومات حول رمز المصدر, مجموعات البيانات, أنواع الملفات, مستودعات, وما يرتبط بها من معلومات وصفية حول العناصر ينتج مجموعة متنوعة من الوصول. وترتبط بعض الكائنات مع المنشورات العلمية التقليدية ولهم صلات صحيحة والحالية لبرامج أو بيانات (ولكن أيضا في بعض الأحيان واستشهد بشكل غير صحيح). هذه قد تكون paywalled في منشورات معينة, أو الموضحة في أوراق اجتماع غير متوفرة. لم يكن لديك بعض المنشورات المرتبطة بها على الإطلاق, أو توصف بأنها المقدمة أو في إعداد. لا تزال بعض الأدوات غير منشورة في الأدب, بعد فترة طويلة أنهم ذهبوا إلى استخدام واسع, ونقلت وثائقها أو دليل بدلا. يقيم بعض أعضاء هيئة التدريس على صفحات البحث, بعضها أطروحات الطلبة. تم العثور على بعض الأدوات على صفحات خاصة بالمشروع. توجد بعض كود مستودعات في بعض الأحيان إهمال تلك التي قد تختفي. وقد انتقل عدد منهم من منشوراتها الأولية, دون عناوين إعادة التوجيه. بعضها إشارة إلى الإجراءات منشورات أخرى. بعض منهم مثل السفر عبر الزمن حق العودة إلى 1990s, مع الصفحات التي تظهر أن تكون أصلية للمرة. البعض قد يكون عرضة لخطر الاختفاء تماما في المرة القادمة تحديثا في موقع على شبكة الإنترنت الوصول إلى موقع الجامعة التغييرات.

وتشمل غيرها من الأدوات حزم التجارية التي قد يكون التفاصيل غير معروفة, إصدارات, أو مشكوك الاستدامة والوصول في المستقبل.

عندما يتم توفير تفاصيل معالجة البيانات أو برامج تطبيقات, ويختلف هذا المبلغ. في بعض الأحيان يتم تضمين المعلمات, البعض الآخر لا.

أداة المفقودين أردت أن يكون
كانت واحدة من بلدي المفضلة لتمثيل البيانات في نتائج المشروع شخصية 2 في الورقة الرئيسية, شبكات أكسفورد للمقارنات الأنواع المنتظمة في هيكل شجرة النشوء والتطور. هذا نقل كمية هائلة من المعلومات في مساحة صغيرة بشكل فعال جدا. تمنيت أن هذا هو أداة موجودة في مكان ما, ولكن عند كتابة للفريق لقد وجدت أنه من برنامج نصي R من قبل أحد المؤلفين, مع ترتيب شجرة لاحق في برنامج الرسومات "المصور" قبل متعاون آخر. أنا حقا أحب هذا, رغم أن, ونأمل أن تصبح متوفرة على نطاق أوسع.

بيض عيد الفصح
كان استشهاد أكثر متعة جئت عبر صفحة لPHYLIP, والتعليمات واعتمادات كان ملحوظا. على الرغم من حقيقة أنه لا يوجد النشر التقليدية المتاحة لي, تقدم "القروض" صفحة طويلة بعض الأفكار المثيرة للاهتمام حول المشروع. و "لا بفضل" كان الجزء الواقع نظرة رائعة في المحن من الحصول على التمويل لدعم تطوير البرمجيات والصيانة. الجزء حول "التوعية" كان مسلية خاصة لنا:

"هل كل هذا" يعني التواصل "الاشياء لدي لتكريس الوقت لإعطاء ورش عمل لطلاب دهشت فنون الطهي? هذه المنح هي لتطوير أساليب متقدمة, ومؤتمر "المربين العام أو غير الجامعي" عن تلك الأساليب ويبدو أن تكون مضيعة للوقت — على الرغم من أنني لا تنفق بعض الجهد على محاربة دعاة الخلق والتصميم الذكي, لكنني لا طرح هذه الأساليب في القيام بذلك ".

حتى فكرة "التواصل" ودعم استخدام الأدوات غير واضحة بالتأكيد لمقدمي أداة, كما يبدو. تدريب? نعم, لا بأي شكل من الأشكال رسمية.

نقاش حوار:

قدم المشروع تسلسل الجينوم جيبون مثالا هاما وموثقة جيدا لمشروع نموذجي في هذه الساحة. في تجربتي, كان هذا جمع أكثر تفصيلا ووصف من العديد من المشاريع الأخرى لقد استكشفت, وقدمت بعض الأدوات التي كانت جديدة ومثيرة للاهتمام بالنسبة لي. بوضوح عدد هائل ومجموعة من الأدوات المعلوماتية الحيوية, أدوات, مستودعات, ويطلب من المفاهيم لنطاق مشروع تسلسل الجينوم. تتبع مصدرها منهم, رغم أن, غير متفاوتة وتحديا, وهذه ليست فريدة من نوعها لهذا المشروع، انها مشكلة بين الميدان. الوصول إلى كائنات الحالي المعلوماتية الحيوية هو أيضا متفاوت, والوصول في المستقبل قد يكون أكثر من مجرد عقبة والشيخوخة صفحات المشروع قد تختفي أو تصبح غير صالحة للاستعمال. قدمت هذا المشروع لقطة مثيرة للاهتمام من الدولة من اللعب, ونظرة عامة جيدة من نطاق الوعي, المهارات, موارد, ومعرفة أن الباحثين, موظفي الدعم, أو الطلاب سوف تحتاج لإنجاز المشاريع ذات النطاق مماثل.

little_macكان عليه أن يكون أكثر بساطة. كنا استخدام عدد قليل من الأدوات على VAX, شاقة, في الثلج, في كلا الاتجاهين, بالطبع. عندما كنت طالب دراسات عليا, يوم واحد في الجزء الخلفي من المختبر في أوائل 1990s, زميلي تري وأنا كان بدس حول في شيء كنا سمعنا فقط حوالي الشبكة العالمية. كان لدينا واحدة من تلك بالاعمال مضحك قليلا مع شاشات صغير جدا, ووجدنا كان الناس جعل صفحات الويب texty مع الخطوط عادية وألوان غريبة, ويتحدث عن أبحاثهم.

على الرغم من أننا قد سواء كان باستخدام مجموعة متنوعة من البرامج المثبتة أو أسطر الأوامر لتسلسل القراءة والمحاذاة, التلاعب, خرائط البلازميد, البحث الأدب والتخزين, معالجة الصور, phylogenies, وهلم جرا، كنا نعرف أن هذا الشيء على شبكة الإنترنت كان على وشك كسر الموضوع مفتوحا على مصراعيه.

بعد فترة ليست طويلة, كنت تنفق المزيد والمزيد من الوقت في الغرفة الخلفية من المختبر, سحب متواليات من هذا المكان NCBI (رؤية واجهة منتصف 1990s هنا), وتبحث عن المتغيرات لصق جديدة. وجدت لها. فقط عن طريق كتابة رقم النشاط الإشعاعي والمواد الهلامية التي تتطلبها لي! كيف بارد هو أن? اعتمدنا على قائمة بيدرو لتحديد المزيد من الأدوات المفيدة (أرشيف البيولوجيا الجزيئية وتحليل أدوات البحث بيدرو.).

كلا منا ثم انفجرت في حملة الدكتوراه والوظائف التي كانت بشكل كبير في برامج البيولوجي و / أو تطوير قواعد البيانات. لقد كان لدينا المقعد الأمامي للتغيرات خلال هذه الفترة, وانها كانت مذهلة حقا لمشاهدة. وانها كانت كبيرة بالنسبة لنا، وضعنا مصالحنا في الشركة التي تساعد الناس على استخدام هذه الأدوات بشكل أكثر فعالية, وأنها كانت مجزية حقا.

في OpenHelix, نحن نحاول دائما لإبقاء العين على ما الناس أدوات تستخدم. نحن الجر بانتظام خلال فترة طويلة, طويل, المواد التكميلية طويلة من أنواع "البيانات الكبيرة" من المشاريع, باستخدام الشباك الخيشومية لاستخراج أدوات البرمجيات التي يتم استخدامها في المجتمع. ما قواعد البيانات والمواقع التي تعتمد على الناس? ما هي الأشياء التي يحتاج التأسيسي الجميع? ما هي الأشياء المتطورة للحفاظ على اطلاع? ما تنسيقات الملفات أو حيث يحتاج الناس للتواصل مع مورد?

ولكن كما بدأت تفعل ذلك, فكرت: ربما ينبغي لي أن استخدام هذا كنقطة انطلاق لمناقشة بعض القضايا من أدوات البرمجيات والبيانات في علم الجينوم. إذا كنت جديدا على هذا المجال وكان لمعرفة كيف يمكن لمثل هذا المشروع يذهب, أو ما المعرفة, المهارات, وكنت بحاجة إلى أدوات, يمكنك وضع بعض فكرة عن مكان لهدف? لذلك تستخدم هذه الورقة إلى نوع من تحليل حالة اللعب: ما المواقع / أدوات / الأشكال / الأشياء / البنود المعلوماتية الحيوية يتم تضمينها في عمل هذا النطاق? يمكنك العثور عليهم? أين هي العوائق أو المخاطر? يمكن أن تتعلم لاستخدامها وتكرار العمل, أو تدفع إلى الأمام من هنا?

كان إلقاء الضوء بالنسبة لي لتجميع فعلا كل شيء في مكان واحد. استغرق الأمر قدرا كبيرا من الوقت لتتبع الأدوات أسفل وتحديد المعلومات المتعلقة بها. ولكن يبدو أن يكون يستحق أخذ لقطة. وآمل أن يسلط الضوء على بعض الاحتياجات في مجال, قبل بعض القطع الرئيسية تصبح خاسرة لتقلبات الزمن والتكنولوجيا. وأيضا وآمل أن يشجع الوعي حسن السير والسلوك في المستقبل. تبدو الأمور أن الحصول على أفضل ضغط المجتمع لنشر مجموعات البيانات والتعليمات البرمجية في مستودعات بدعم زاد. يمكننا استخدام بعض الاستراتيجيات الاقتباس موحدة لأدوات, مصادر, والمعلمات. و الولايات المتحدة NIH الحصول على جدية حول إدارة "البيانات الكبيرة" والتأكد من أنها يمكن أن تستخدم بشكل صحيح وقد التقى بحماس كبير. لكن لا تزال هناك بعض التلال تركت لتسلق قبل نحن على رأس هذا.


L. كاربوني, R. آلان هاريس, سانتي Gnerre, كريشنا R. Veeramah, بيلين لورنتي-Galdos, جون هدلستون, توماس J. ماير, خافيير هيريرو, روس المسيحية, برونوين أكين & فابيو Anaclerio & إلى. (2014). جيبون الجينوم وتطور النمط النووي سريع القردة الصغيرة, طبيعة, 513 (7517) 195-201. دوى: http://dx.doi.org/10.1038/nature13679

نسخة FigShare هذا المنصب: http://dx.doi.org/10.6084/m9.figshare.1194879

VideoTip من الأسبوع: ترميز @ Ensembl

لدينا الكثير من الدروس (2 في الواقع, ترميز المؤسسات & ترميز @ UCSC), نصائح و معلومات حول ترميز. لدينا أيضا الكثير من الدروس (ثانية 2, Ensembl و Ensembl وراثي- على الإصدارات القديمة ), نصائح و معلومات حول Ensembl, قاعدة البيانات والمتصفح في بنك الإمارات الدولي.

الآن هنا هو غيض من الأسبوع على كلا Ensembl وترميز. هذا هو واحد من أكثر الإضافات الأخيرة إلى دروس الفيديو Ensembl لل. يبدو هذا الفيديو على كيفية تحديد متواليات التي يمكن أن تشارك في تنظيم الجينات. ويستند معظم هذه البيانات في Ensembl على ترميز البيانات. هذا يستخدم “مصفوفة,” طريقة لتحديد بيانات التنظيم بحاجة لكم يعتمد على أنواع الخلايا وللTF. في نهاية 8 فيديو دقيقة يناقشون أكثر قليلا حول كيفية الحصول على كل ترميز البيانات.

هكذا, الآن لديك ثروة من المعلومات هنا في OpenHelix من خلال الدروس لدينا وبلوق عن ترميز وEnsembl.

ترميز: http://encodeproject.org/ENCODE/
ترميز @ UCSC: http://genome.ucsc.edu/ENCODE/
Ensembl: http://www.ensembl.org
ترميز دروس: http://openhelix.com/encode
دروس Ensembl: http://openhelix.com/cgi/tutorialInfo.cgi?id=95

تلميح فيديو للأسبوع: تصفح الفراشات مع GBrowse وEnsembl

وقبل بضعة شهور عندما Heliconius (ساعي البريد) وأطلق سراح فراشة الجينوم ورقة, وصلنا لرؤية مثال آخر على كيفية الاستفادة من التكنولوجيا الجديدة والتسلسل مما يساعدنا على الوصول إلى بيانات الجينوم أكثر وأكثر–في الأنواع التي ليست من الكائنات نموذج الرئيسي. وكان تم الافراج عن العاهل فراشة بيانات الجينوم قبل ذلك أيضا. وربما لا تعرف أن هناك جهدا كبيرا للحصول على آلاف الجينوم الحشرات–وi5k مشروع. أعتقد أن هذا شيء مفضل لي عن ما نحن فيه اليوم: يمكننا فحص أكثر الأنواع بتفصيل أكبر مما لدينا من أي وقت مضى. ليس فقط لم نحصل على تفاصيل مثيرة للاهتمام من إطار تسلسل الجينوم, لكن معلومات مثيرة للاهتمام حول أنواع العلاقات التطورية, ويمكن استكشاف ملامح البيولوجيا فضول وكذلك رواية. أعني–الجينوم البشري والتغيرات التي هي كبيرة–لكن الفراشات لديها بوصلة أحد! كيف هو أن تبرد??

ومثل معظم الصحف الجينوم اليوم, سوى جزء ضئيل من البيانات التي تم الحصول عليها في الجزء الرئيسي من ورقة. و “أمثلة مقنعة” قد تكون هناك. ولكن من “12,699 وتوقع البروتين ترميز الجينات” من Heliconius الجينوم, وتعالج في الواقع سوى عدد قليل في النص. وحفنات قليلة في بعض الشخصيات. فراشة مونارك في وقت سابق ورقة سلمت “مجموعة من 16,866 البروتين ترميز الجينات” (و 10 ملاحق وراء ورقة!). لكن للوصول إلى البيانات نفسك وقارن بين الجينات الخاصة بك، والأنواع ذات الأهمية تحتاج إلى اللجوء إلى برامج التصفح التي تصاحب أوراق.

في هذه الحالة لديك خياران للأنماط المتصفح: و Heliconius الجينوم اتحاد (الكتاب من ورقة) الحفاظ على تركيب GBrowse في اجتماعهم Butterflygenome.org موقع. المجموعة العاهل له في GBrowse MonarchBase. وبالإضافة إلى ذلك, وأيضا بيانات عن كل من وشملت الآن في Ensembl وذلك اعتبارا من تموز 2012 إطلاق 15. [مذكرة: راجع التفاصيل الإدارية في هذه التعليقات - مم]

لقمة هذا الاسبوع نحن تحلق حولها من GBrowsers أنواع محددة للمجموعات التي تم جمعها في Ensembl. انه لشيء رائع أن يكون للمواقع أنواعا معينة من الحيوانات لعمق المعلومات حول المشاريع والموارد, لكنه أيضا من الجميل أن يكون لأدوات إضافية ويعرض من المتصفحات أكبر الجينوم. ويمكن تقديم برامج التصفح مجتمع البيانات الحالية للغاية والجديدة التي قد لا بعد أن تدرج في برامج التصفح الفائقة, ويجوز للمتصفحات فائقة توفير أدوات إضافية، والبنية التحتية التي لا يتوفر من المتصفحات المجتمع. أفضل رهان هو أن تكون على علم على حد سواء, وللحصول على راحة مع ميزات البرنامج الرئيسية ونقاط القوة والضعف.

البق قادمون–والآلاف منهم. يكون جاهزا. وإياك: ابحث عن حق خارقة

لاحظ: لقد كنت غير قادر على تحديد موقع الجينوم Mothra وهذا ما كان كل atwitter لاليومين الماضيين.

Heliconius GBrowse: http://butterflygenome.org/

MonarchBase: http://monarchbase.umassmed.edu/genome.html

Ensembl Metazoa: http://metazoa.ensembl.org/

i5k الحشرات وغيرها من المفصلية مبادرة تسلسل الجينوم http://arthropodgenomes.org/wiki/i5K

إذا جاء هل تبحث عن صور فراشة, جرب هذا: http://www.butterfliesandmoths.org/ هذا هو أيضا موقع العلم مواطن حيث يمكنك أن تقدم مشاهد الخاصة بك–لقد فعلت ذلك في الماضي.


Dasmahapatra, K.K., والترز, J.R., بريسكو, بعد الميلاد, ديفي, J.W., Whibley, أ., نادو, N.J., زيمين, A.V., هيوز, D.S.T., فيرغسون, L.C., مارتن, S.H. & (2012). فراشة الجينوم يكشف عن تبادل لاأخلاقي من التعديلات محاكاة بين الأنواع, طبيعة, دوى: 10.1038/nature11041

زان, س., ميرلين, C., Boore, J. & Reppert, S. (2011). المجين فراشة مونارك مدخلا لمعرفة طريقة لمسافات طويلة للهجرة, الخلية, 147 (5) 1185. دوى: 10.1016/j.cell.2011.09.052

Stensmyr, M. & هانسون, B. (2011). الجينوم وبما يليق العاهل, الخلية, 147 (5) 972. دوى: 10.1016/j.cell.2011.11.009

Kersey, P.J., ستينز, D.M., لوسون, د., Kulesha, E., Derwent, P., همفري, J.C., هيوز, D.S.T., كينان, س., Kerhornou, أ., Koscielny, G. & (2011). Ensembl خريطة جينوم: موردا تكاملية لالجينوم على نطاق البيانات من غير الأنواع الفقارية, أبحاث الأحماض النووية, 40 (D1) D97. دوى: 10.1093/nar/gkr895

نصائح فيديو للأسبوع: الاستعراض السنوي الرابع, 2الثانية half

كما قد تعلمون, لقد كنا نفعل هذه الفيديو نصائح من بين أيام الأسبوع ، إلى FOUR سنوات حتى الآن. أكملنا حول 200 مقدمات طعام شهي القليل من الموارد المختلفة من العام الماضي, 2011 (موافق, انها 2012 الآن). في نهاية السنة لقد أقمنا نوعا من التقليد عطلة: نحن نقوم بإعداد ملخص آخر لجمع كل منهم. إذا كان لديك أي غاب منهم انها طريقة رائعة لإلقاء نظرة سريعة على ما قد يكون من المفيد لعملك.

يمكنك ان ترى السنوات الماضية’ نصائح هنا: 2008 في, 2008 الثاني, 2009 في, 2009 الثاني, 2010 في, 2010 الثاني. و ملخص في النصف الأول من 2011 يتوفر من الاسبوع الماضي.

يوليو 2011

يوليو 6: أولويات الجينات باستخدام بوابة أولويات الجينات

يوليو 13: PolySearch, تبحث العديد من قواعد البيانات في وقت واحد

يوليو 20: الإنسان محور التصور Epigenomics

يوليو 27: وSIB جديدة من الموارد المعلوماتية الحيوية البوابة


آب / أغسطس 2011

آب / أغسطس 3: SNPexp, العلاقة بين تعدد الأشكال والتعبير الجيني

آب / أغسطس 10: CompaGB لمقارنة الجينوم برنامج المتصفح

آب / أغسطس 17: انتزاع, بمقارنة الجينومات النظر

آب / أغسطس 24: رسم المخططات نطاق لعزر سريعة

آب / أغسطس 31: من UniProt إلى SBKB المبادرة والعودة مرة أخرى


سبتمبر 2011

سبتمبر 7: علم الجينوم المقارن باستخدام محطة بلازا

سبتمبر 14: phiGENOME لجينوم البكتيريا الاستكشاف

سبتمبر 21: الحصول على تسلسل الجينوم المرافقة للمواقع

سبتمبر 28: مقدمة إلى R البرامج الإحصائية


أكتوبر 2011

أكتوبر 5: للحصول على معلومات الموارد VND الاختلاف الجيني والمخدرات

أكتوبر 12: موزع المسار في متصفح الجينوم UCSC

أكتوبر 19: الميتوكوندريا Transcriptome على GBrowser

أكتوبر 26: تباين البيانات من Ensembl


تشرين الثاني 2011

تشرين الثاني 2: MizBee تصاحب جيني المستعرض

تشرين الثاني 9: قاعدة بيانات جديدة من المتغيرات الجينومية: DGV2

تشرين الثاني 16: MapMi, آلية تعيين الموضع من microRNAأنا

تشرين الثاني 23: BioMart البوابة المركزية الجديدة

تشرين الثاني 30: Phosphida, قاعدة بيانات بعد تعديل متعدية

ديسمبر 2011

ديسمبر 7: VarSifter, لتحديد تسلسل الاختلافات الرئيسية

ديسمبر 14: تغييرات كبيرة على الموارد الوراثية وNCBI

ديسمبر 21: شراب البيض للعطلات (أو لاستكشاف الجينات orthologous)

ديسمبر 28: نصائح فيديو للأسبوع: الاستعراض السنوي الرابع (النصف الأول من 2011)

الاعلان عن المواد التعليمية حدثت: UniProt, نظرة عامة على برامج التصفح الجينوم, وجولة حول العالم للموارد

كما يعلم الكثيرون منكم, OpenHelix متخصصة في مساعدة الناس من الوصول والاستفادة من منجم للذهب العلوم الحيوية من البيانات العامة من أجل إجراء مزيد من البحوث. واحدة من السبل التي يمكننا القيام بذلك هو من خلال خلق المواد اللازمة لتدريب الناس – الباحثين, الأطباء, المكتبات, والمهتمين في مجال العلوم - حول مكان العثور على البيانات التي ترغب في, وكيفية الوصول إلى البيانات في قواعد البيانات العامة وخاصة مستودعات البيانات. لقد حصلنا على أكثر من 100 مثل هذه الدروس على كل شيء من مجلات إلى وظيفية عبارة غليكوميكس (المزيد عن هذا لاحقا).

بالإضافة إنشاء هذه الدروس, نحن أيضا تنفق الكثير من الوقت للحفاظ على دقة وتصل إلى تاريخ. هذا يمكن أن يكون تحديا, وخصوصا عندما الكثير من قواعد البيانات أو الموارد وجميع النشرات الرئيسية في نفس الوقت تقريبا. فريق العمل لدينا ويقيم باستمرار وتحديث المواد لدينا في هذا المنصب وانا سعيد بان يعلن التحديثات التي تم إصدارها مؤخرا لثلاثة من الدروس لدينا: UniProt, جولة حول العالم, ونظرة عامة على برامج التصفح الجينوم.

لنا استهلالي UniProt التعليمي ويبين كيفية المستخدمين: إجراء عمليات بحث النص على UniProt للحصول على معلومات البروتين ذات الصلة, بحث مع تسلسل كنقطة انطلاق, فهم أنواع مختلفة من UniProt السجلات, وخلق التحالفات متعددة تسلسل من السجلات باستخدام بروتين كلوستال.

لنا نظرة عامة على برامج التصفح الجينوم يقدم للمستخدمين إدخال Ensembl, خريطة عارض, UCSC متصفح الجينوم, و خريطة جينوم الميكروبية المتكاملة (IMG) المتصفح, و نظام GBrowse البرمجيات. نحن أيضا أتطرق إلى WebGBrowse, JBrowse, و علم الجينوم التكاملية عارض (IGV), و آرغو الجينوم المستعرض, و الجينوم المتكاملة المستعرض (مجلس الحبوب العراقي)نقنق, و التعميم الجينوم عارض, أو CGView.

لنا جولة في عالم الموارد جينوم مجاني ويمكن الوصول إليها من دون تسجيل. وهي تشمل جولة الموارد سبيل المثال, نظمتها فئات مثل خوارزميات وأدوات التحليل, التعبير الموارد, مستعرضات الجينوم (على حد سواء حقيقية النواة و بروكاريوتيك / الميكروبية) , الموارد الأدب والنصوص والتعدين, وركز على الموارد النيوكليوتيدات, البروتينات, مسارات, المرض والاختلاف. وسوف تؤدي هذه المناقشة الرئيسي ثم إلى مناقشة كيفية إيجاد موارد مع مجانا OpenHelix الموارد بوابة البحث, تليها تعلم استخدام الموارد مع الدروس OpenHelix, ومناقشة وسائل إضافية للتعلم حول الموارد.

OpenHelix تمهيدية UniProt جناح تعليمي: http://www.openhelix.com/cgi/tutorialInfo.cgi?id=77

نظرة عامة OpenHelix إلى جناح تعليمي الجينوم المتصفحات: http://www.openhelix.com/cgi/tutorialInfo.cgi?id=65

جولة حول العالم مجانا OpenHelix للجينوم جناح تعليمي الموارد: http://www.openhelix.com/cgi/tutorialInfo.cgi?id=119


حصلت على الجينوم + transcriptome. ماذا نفعل الآن?

كنت اللحاق على بعض القوائم البريدية القراءة الاسبوع الماضي عندما شاهدت عنصر غير عادية تأتي عبر UCSC قائمة مناقشة البريدية. سأل شخص في عملية الحصول على تسلسل الجينوم وtranscriptome لمشروع جديد لل UCSC مجموعة للتوجيه بشأن ما يجب فعله معها. انها فعلا مسألة كنا نسمع كثيرا في ورشات العمل–الناس تفكر في منح لهذا النوع من المشاريع, أو لديها خطط لالتسلسل العلامة التجارية الجديدة التي وصلت في مواقعهم. فكرت أشخاص آخرين قد تنظر في هذه المعلومات مفيدة جدا توصيات, لذا أنا أعيد نشرها هنا:


عزيزتي الجينوم UCSC المعلوماتية الحيوية,

اسمي بادريج Doolan وأنا زعيم التعبير عن البرنامج
ميكروأرس والمعلوماتية الحيوية في المعهد الوطني للالخليوي
التكنولوجيا الحيوية (NICB), ايرلندا (www.nicb.ie/). نحن الممولة من القطاع العام
معهد بحوث العلوم الأساسية.

لدينا مجموعة صغيرة المعلوماتية الحيوية هي مجرد بداية لعملية
analysisng الجينوم جديدة (وtranscriptome) لالهامستر الصيني
مبيض (لل) خط الخلية التي نشرت مؤخرا (شو وآخرون., و
تسلسل الجينوم للمبيض الهامستر الصيني (لل)-K1 خط خلوي. نات
Biotechnol. 2011 يوليو 31;29(8):735-41. دوى: 10.1038/nbt.1932.) من جانب آخر
مجموعة. علينا القيام بالكثير من العمل الوظيفي في هذا الحي ، ونحن كنت أبحث
بالنسبة لبعض المبادئ التوجيهية جيدة (نشرت ورقات, على الانترنت الموارد, إلخ)
والتي قد تساعدنا في رسم بعض الأهداف التي يمكن تحقيقها فيما يتعلق
في والسيليكو توصيف هذا الجينوم.

مثلا, بعد نشر التسلسل, ما هي الخطوة التالية(مع)
في توفير المعلومات ذات الصلة? قوائم النيوكلوتايد? تنبأ
بروتيوم / secretome / أرقام من أنواع البروتين وتوقع (مثل مصاريف.
كاينيسات / ز يقترن / النووية / غشاء المموضع), إلخ?

أنا أبحث عن طريق لائحة المنشورات مشروع الجينوم البشري
للإلهام, لكن هذا النوع من التحليل هو إخراج جديد نسبيا بالنسبة لل
مجموعتنا (وعادة ما تكون أكثر تركيزا ونحن على الطب متعدية). هو
هناك المبادئ التوجيهية الموصى بها المعهد الخاص يمكن ان توحي لل
يسير على خطى من المجين البشري في تحليل السيليكو في رواية
الجينوم / transcriptomes? تستطيع المؤسسة تشير بضع الرئيسية
أوراق أو ربما استراتيجية التحليل الجيد?

مع أطيب التحيات,
بادريج Doolan

UCSC يحاول عموما للحد من مناقشتهم لخصوصيات البيانات والبرمجيات في مواقعهم–لأن هذا هو مهمتهم, بالطبع, ولأن لا يمكن أن يكون كل شيء على الجميع الجينوميات–فإنهم لم يكن لديك الوقت لعملهم. ولكن هذا كان حالة خاصة, وتجميعها إجابة باردة جدا لفريقه وبادريج.

ورقة تشير بادريج شو كنت قد تذكرت رؤية في الوقت, ولكن لم أكن مواصلة التحقيق. حتى انني ذهبت تبحث لمعرفة ما إذا كان الفريق قد مستعرض إعداد, وكنت غير قادر على العثور على واحد. لم أجد التجمع في معاينة Ensembl. ولكن أستطيع أن أرى لماذا مجموعة محلية سيحتاج الى مزيد من التفاصيل في مجموعة خاصة بهم ، ولماذا كنت تريد أن تفعل بعض الأشياء نفسها أيضا. وربما وسيلة سهلة لتوسيع التسلسل المرجعي مع البيانات الخاصة بهم بدلا من الانتظار لفريق كبير في المتصفح للحصول عليها.


مرحبا بادريج,

وتساءل أنا مهندسينا وحصلت هذه القائمة من التوصيات بالنسبة لك:

1) التوفيق بين كل من بنك الجينات mRNAs الهامستر الصيني
2) التوفيق بين جميع بياناتهم الخاصة transcriptome
3) التوفيق بين جميع التكنولوجيات السليمة بيئيا من بنك الجينات الهامستر الصيني
4) تعيين بروتينات بشرية والمستمدة إما من مجموعة الجينات أو UCSC RefSeq
5) تعيين الماوس من البروتينات أو UCSC RefSeq
6) القيام الجينوم أنواع متعددة المواءمة مع الماوس, نصيحة, أرنب,
الكلب, فيل, الأ بوسوم حيوان أمريكي, بلانبوس منقار البطة, دجاج. لا البشرى وكذلك التحالفات.
7) منجم للالجينومية يقرأ ويقرأ عن transcriptomic النيوكلوتايد. كن حذرا
ليس من أجل الدعوة مناطق تتكرر في الآونة الأخيرة واختلفت قليلا فقط
اختلافات طفيفة وعلى الرغم من تعدد الأشكال.
\8) تشغيل العديد من تكرار المكتشفون.
9) تشغيل جهاز الكشف عن جزيرة CPG.
10) تشغيل برنامج التنبؤ الجينات الجيدة مثل أوغسطس.
11) في محاولة لايجاد فريق المختبر الرطب على استعداد للقيام بعض المقايسات الدناز….

آمل أن يكون هذا مفيد. حظا سعيدا في عملك!

بروك Rhead
الجينوم UCSC المعلوماتية الحيوية المجموعة


اعتقدت هذا كان الى حد كبير على قائمة من الاشياء كنت تريد أن ترى مع الجينوم الجديدة على متصفح جديد. والسبب وأعتقد أن هذا هو المفتاح خصوصا لأن هناك لن يؤدي الا الى أن تكون أكثر وأكثر من هذا. مع التكنولوجيات الجديدة التسلسل وطوفان البيانات, المزيد من المجموعات سوف تجد نفسها مع تسلسل البيانات الهامة للمختبرات أو الباحثين المحلية. ويمكن المرضى, يمكن أن يكون نموذج الكائنات, يمكن أن تكون الأنواع. كيفية التصرف مع هذه البيانات مهم.

ما الذي تفعله? هل لديك التوصيات الأخرى للجماعات التي تواجه هذا?

اليوم أيضا ، أنا مجرد حدث لاحظ أن جوناثان ايسن مرتبط إلى ورقة يمكن أن تقدم توجيهات للأشخاص الذين يعانون من الجينوم جديدة: المهم رقة حول معايير الشرح عن الجينوم البكتيري / archael — تستعد لل “طوفان البيانات”. وأعتقد أن هذا أمر عظيم, ومناقشة حاسمة والوعي لدينا الآن الحق. للأسباب ذاتها تماما–الناس الجديدة ستكون مواجهة تجميع ويحشي ملامح الجينوم جديدة بأسعار لا تصدق, ولقد تعلمنا بعض الأشياء حول أفضل الممارسات واحتياجات. بالطبع, وسوف تتطور الأمور–ولكن عدد قليل من نقطة انطلاق جيدة والتوجيه المفيد حقا.

EDIT: فقط حصلت على المذكرة المقدمة من الباحثين ورقة CHO, ويشيرون لي لهذا الموقع لبعض الأدوات: http://www.chogenome.org/


شو, عاشرا, Nagarajan, ه., رافعة الحجارة, ن., مقلاة, س., تساى, ز., ليو, عاشرا, تشن, دبليو., شيه, م., وانغ, دبليو., هاموند, س., أندرسن, م., نيف, ن., Passarelli, ب., كوه, دبليو., مروحة, ه., وانغ, ج., واجهة المستخدم الرسومية, Y., لي, ك., Betenbaugh, م., زلزال, س., عائلة, I., بالسون, ب., & وانغ, J. (2011). تسلسل الجينوم للمبيض الهامستر الصيني (لل)-K1 خط خلوي طبيعة التكنولوجيا الحيوية, 29 (8), 735-741 دوى: 10.1038/nbt.1932

Klimke, دبليو., أودونوفان, C., أبيض, O., القصور, ج., كلارك, ك., فيدوروف, ب., مزراحي, I., بروت, ك., & Tatusova, T. (2011). حل مشكلة: معايير الشرح الجينوم قبل الطوفان البيانات المعايير في علوم الجينوم, 5 (1), 168-193 دوى: 10.4056/sigs.2084864