الوسم المحفوظات: biomart

تلميح فيديو للأسبوع: TargetMine, Data Warehouse for Drug Discovery

Browsing around genomic regions, layering on lots of associated data, and beginning to explore new data types I might come across are things that really fire up my brain. بالنسبة لي, visualization is key to forming new ideas about the relationships between genomic features and patterns of data. But frequently I want to take this to the next step–asking where else these patterns appear, how many other instances of this situation are there in a data set, and maybe adding additional complexity to the problem and refine the quest. This is not always easy to do with primarily visual software tools. This is when I turn to tools like the UCSC الجدول المستعرض, BioMart, و الدولية لإزالة الألغام to handle some list of genes, or regions, or features.

We’ve touched on all of these before–sometimes with full tutorial suites (UCSC, BioMart), and sometimes as a نصيحة الأسبوع, الدولية لإزالة الألغام و InterMine لاستعلامات معقدة. Learning about the foundations of these tools will let you use various versions or flavors of them at other sites. I love to see tools that are re-used for different topics when that’s possible, rather than building a whole new system. There are ModENCODE, نصيحة, yeast mines, وأكثر. This week’s tip is about one of those others–TargetMine is built on the InterMine foundation, with a specific focus on prioritizing candidate genes for pharmaceutical interventions. من their site overview, I’ll add this description they use: TargetMine

TargetMine is an integrated data warehouse system which has been primarily developed for the purpose of target prioritisation and early stage drug discovery.

For more details about their framework and philosophy, you should see their papers (ترتبط أدناه). The earlier one sets out the rationale, the data types, and the data sources they are incorporating. They also establish their place in the ecosystem of other databases in this arena, which helps you to understand their role. But you should see the next paper for a really good grasp of how their candidate prioritization work with the “Integrated Pathway Clusters” concept they’ve added. They combined data from KEGG, ركتوم, و NCI’s PID collections to enhance the features of their data warehouse system.

This week’s Video Tip of the Week highlights one of the tutorial movies that the TargetMine team provides. There’s no spoken audio with it, but the captions that help you to understand what’s going on are in English. I followed along on a browser with their example–they have a sample list to simply click on, and you can see various enrichments of the sets–مسارات, أنتولوجيا الجينات, Disease Ontology, InterPro, CATH, and compounds. They call these the “biological themes” and I find them really useful. You can create new lists from these theme collections. They also illustrate the “template” option–pre-defined queries with typical features people may wish to search. The example shows how to go from the list of genes you had to pathways–but there are other templates as well.

Another section of the video has an example of a custom query with the Query Builder. They ask for structural information for proteins targeted by acetaminophen. It’s a nice example of how to go from a compound to protein structure–a question I’ve seen come up before in discussion threads.

In their more recent paper (also below), they have some case studies that illustrate the concepts of prioritizing targets for different disease situations with their system. They also expand on the functions with additional software to explore the pathways: http://targetmine.mizuguchilab.org/pathclust/ .

So have a look at the features of TargetMine for prioritization of candidate genes. I think the numerous “themes” are a really useful way to assess lists of genes (or whatever you are starting with).

روابط سريعة:

TargetMine: http://targetmine.mizuguchilab.org/ [مذكرة: their domain name has changed since the publications, this is the one that will persist.]

الدولية لإزالة الألغام: http://intermine.github.io/intermine.org/


تشن, Y., تريباثي, L., & Mizuguchi, K. (2011). TargetMine, an Integrated Data Warehouse for Candidate Gene Prioritisation and Target Discovery بلوس ONE, 6 (3) دوى: 10.1371/journal.pone.0017844

تشن, Y., تريباثي, L., Dessailly, ب., Nyström-Persson, ج., أ ت. الإعلانية, س., & Mizuguchi, K. (2014). Integrated Pathway Clusters with Coherent Biological Themes for Target Prioritisation بلوس ONE, 9 (6) دوى: 10.1371/journal.pone.0099030

Kalderimis A., R. لين, D. Butano, S. Contrino, M. لين, J. Heimbach, F. هو جين تاو, R. سميث, R. Stěpán, J. سوليفان & G. Micklem & (2014). الدولية لإزالة الألغام: extensive web services for modern biology, أبحاث الأحماض النووية, 42 (W1) W468-W472. دوى: http://dx.doi.org/10.1093/nar/gku301

تلميح فيديو للأسبوع: InterMine لاستعلامات معقدة

كنا المشجعين من InterMine لفترة طويلة. فعلنا غيض من بين أسبوع في منذ فترة أن أبرز الطرق أن هذا البرنامج يمكن استخدامه لإزالة الألغام من مشاريع بيانات كبيرة من العديد من أنواع. إطار عام من InterMine يمكن تخصيص لاستخدامها في مشاريع مختلفة–اليوم سوف تشمل أشرطة الفيديو من التثبيت FlyMine ونكهة YeastMine–ولكن قد تجد إصدارات هذه الأداة مفيد في العديد من الأماكن الأخرى كذلك.

أول فيديو لمحة أوسع من أنواع مختلفة من الأشياء التي يمكنك القيام به–وعلى الرغم من أن هذا هو FlyMine, ستجد سلوك مماثل في المناجم الأخرى أيضا.

هذا الفيديو التالي هو أكثر تحديدا حول مهمة التي يحتاجها الناس لتحقيق–تعمل مع قائمة من الجينات. تم إنتاج هذا المثال مؤخرا من قبل الناس YeastMine, ولكن مرة أخرى هذا يجب أن تعمل بطريقة مماثلة في أنحاء أخرى المناجم. يجب عليك أيضا قراءة SGD بلوق وظيفة على ذلك–خلق, تحليل, حفظ: قوة قوائم الجينات في YeastMine.

الشيء الآخر الذي لاحظته عن هذا الإطار هو جهد العديد من هذه المناجم النموذج الحي للتنسيق في هذا InterMOD هيكل. على الرغم من أنني في كثير من الأحيان بالقلق من “بحث واحد للحكم عليهم جميعا” أنواع الجهود, يمكن أن يكون هناك قيمة في هذا كمبدأ تنظيمي رئيسي ونحن الحفاظ على إضافة المزيد من الجينوم الأنواع التي قد لا يكون كما المجتمعات متطورة وبنية تحتية لدعمها.

أنا بالتأكيد استخدام الكثير من الأدوات الاستعلام التي تشبه هذه–مثل UCSC الجدول المستعرض, و BioMart. UniProt يوفر السبل لبناء الاستعلامات التي يختلف ولكن المفهوم مماثل. باستخدام هذه الواجهات يمكنك بناء بعض طرق ذكية ومعقدة لاستخراج المعلومات من مستودعات البيانات.

وصلات سريعة:

الدولية لإزالة الألغام: http://intermine.github.io/intermine.org/

FlyMine: http://www.flymine.org/

YeastMine: http://yeastmine.yeastgenome.org/

InterMOD: http://intermod.intermine.org


سميث ممرضة R.N., Aleksic، J., BUTANO D., كار A., Contrino S., هو جين تاو F., لين M., لين R., A Kalderimis. & روثرفورد K. & (2012). الدولية لإزالة الألغام: نظام مستودع البيانات مرنة لإدماج وتحليل البيانات البيولوجية غير المتجانسة., المعلوماتية الحيوية (أكسفورد, انكلترا), دوى:

لين R., سميث R., روثرفورد K., Wakeling M., فارلي A., Guillier F., يانسون، H., جي دبليو, مكلارن P. & شمال P. & (2012). FlyMine: قاعدة بيانات متكاملة لذبابة الفاكهة والأنوفيلة علم الجينوم., علم الأحياء الجينوم, PMID:

بالاكريشنان R., حديقة J., K. كره, انطلاقه قبل الميلاد., Binkley G., E.L. كونغ, J. سوليفان, Micklem G. & الكرز J.M. (2012). YeastMine–مستودع بيانات متكاملة للبيانات خميرة الخباز باعتبارها أداة متعددة الأغراض عدة., قاعدة بيانات : مجلة قواعد البيانات البيولوجية وcuration, PMID:

J. سوليفان, K. كره, MOXON S.A.T., Vallejos، A., Motenko H., وونغ جي دي, Aleksic، J., بالاكريشنان R., Binkley G. & هاريس T. & (2013). InterMOD: البيانات وأدوات متكاملة لتوحيد نموذج البحث الحي., تقارير علمية, 3 (1802) PMID:

تلميح فيديو للأسبوع: المدخل لعلم الجينوم ICGC السرطان

A المسألة في بيوستار حول السرطان “مجموعات الجينات” مؤخرا حصلت لي يبحث في واحدة من بلدي المفضلة مصادر البيانات مرة أخرى–و ICGC, الاتحاد الدولي لمكافحة السرطان الجينوم, وبوابة بياناتهم. سابق المشاركات فعلناه استندت على بوابة إرثهم (والتي لا تزال متاحة على موقعهم). غيروا الامور قليلا مع اطلاق سراح الخريف الماضي, وأنا لم تغط هذه التغييرات بعد.

مريح, ما قاموا به من شريط فيديو قصير يشرح كيفية الوصول إلى البيانات التي تقدمها. لقد استمروا في إضافة بيانات جديدة, وصقل البرنامج. يجب عليك التحقق من ذلك.

ICGC بيانات بوابة دروس من ICGC على فيميو.

في الماضي لقد وجدت بعض المعلومات المفيدة حقا للمقارنة مع خط خلية سرطان الرئة كنت قد تم دراسة. رأيت نفس التحور في عينات الورم الفعلية كما تم العثور في هذا الخط الخلية سنوات الى الوراء. ولكن كانت هناك أيضا المنشورات التي تتحدث مؤخرا في المزيد من التفاصيل حول المشروع وبعض النتائج المثيرة للاهتمام من البيانات التي تم العثور عليها هناك (ترتبط أدناه).

كنت حقا بحاجة الى أن هذه المشاريع التعدين للبيانات إذا كانت تغطي منطقة البحث الخاصة بك. هناك الكثير لنتعلمه التي لم تنشر بعد–من المؤكد أن مجرد قراءة ما يصل على هم سياسات الاستخدام قبل تقديم اكتشافات كبيرة لالمجلات!

ربط سريع:

بوابة بيانات: http://dcc.icgc.org/

موقع المشروع: http://icgc.org/


هدسون (رئيس) T.J., جورج أندرسون, Areta A., باركر م و, جرس C., Bernabé R.R., بهان M.K., كالفو F., أنا Eerola. & غيرهارد D.S. & العديد من الآخرين في كونسورتيوم كبير… (2010). شبكة دولية من المشاريع جينوم السرطان, طبيعة, 464 (7291) 993-998. دوى:

الكسندروف L.B., نيك-زينل S., إسفين العاصمة, أباريسيو S.A.J.R., Behjati S., إيه في Biankin, Bignell G.R., Bolli N., برج A. & Borresen دايل A.L. & العديد من الآخرين في كونسورتيوم كبير…; (2013). تواقيع العمليات طفرية في سرطان الإنسان, طبيعة, 500 (7463) 415-421. دوى:

غونزاليس بيريز A., موستونين، V., ريفا B., ريتشي G.R.S., كريكسل P., Karchin R., فاسكويز M., فينك J.L., Kassahn K.S. & بيرسون J.V. & العديد من الآخرين في كونسورتيوم كبير… (2013). النهج الحسابية لتحديد المتغيرات الجينية في الجينوم وظيفية السرطان, طبيعة أساليب, 10 (8) 723-729. دوى:

ما هو الرد? (الجين رقم التحويل)

BIOSTAR هو موقع لطرح, الإجابة على الأسئلة ومناقشة المعلوماتية الحيوية. نحن أعضاءالمجتمع وتجد أنه من المفيد جدا. غالبا ما تنشأ الأسئلة والأجوبة في BIOSTAR التي ثيق لقرائنا (المستخدمين النهائيين للموارد الجينوميات). كل يوم خميس سنكون تسليط الضوء على واحدة من تلك الأسئلة والأجوبة هنا في هذه الصفحات. يمكنك طرح الأسئلة في هذا الموضوع, أو يمكنك الانضمام دائما في BIOSTAR.

سؤال هذا الاسبوع أبرزت:

ما هو جيد “الجينات أداة تحويل معرف

هذا هو السؤال الأكبر سنا, من 2 منذ سنوات, لكن لا يزال ذات الصلة والأجوبة المفيدة لا يزال الى حد بعيد والكامل للموارد مثل DAVID, BioDBnet, BioMart وغيرها.

التحقق من ذلك. أيضا, قد ترغب في الإطلاع على ممارسة الثالثة من البرنامج التعليمي لدينا المتقدم UCSC . ممارسة:

“من قائمة الجينات UCSC, إضافة رموز الجينات وGO معرفات للحصول على معلومات إضافية حول مجموعة الجينات. مكافأة خطوة: إضافة ذهاب شروط.”

يمشي من خلال الطريقة التي قد تكون قادرة على القيام بذلك مع متصفح الجدول UCSC مع بعض التعديلات البسيطة.

نصائح فيديو للأسبوع: الاستعراض السنوي الرابع, 2الثانية half

كما قد تعلمون, لقد كنا نفعل هذه الفيديو نصائح من بين أيام الأسبوع ، إلى FOUR سنوات حتى الآن. أكملنا حول 200 مقدمات طعام شهي القليل من الموارد المختلفة من العام الماضي, 2011 (موافق, انها 2012 الآن). في نهاية السنة لقد أقمنا نوعا من التقليد عطلة: نحن نقوم بإعداد ملخص آخر لجمع كل منهم. إذا كان لديك أي غاب منهم انها طريقة رائعة لإلقاء نظرة سريعة على ما قد يكون من المفيد لعملك.

يمكنك ان ترى السنوات الماضية’ نصائح هنا: 2008 في, 2008 الثاني, 2009 في, 2009 الثاني, 2010 في, 2010 الثاني. و ملخص في النصف الأول من 2011 يتوفر من الاسبوع الماضي.

يوليو 2011

يوليو 6: أولويات الجينات باستخدام بوابة أولويات الجينات

يوليو 13: PolySearch, تبحث العديد من قواعد البيانات في وقت واحد

يوليو 20: الإنسان محور التصور Epigenomics

يوليو 27: وSIB جديدة من الموارد المعلوماتية الحيوية البوابة


آب / أغسطس 2011

آب / أغسطس 3: SNPexp, العلاقة بين تعدد الأشكال والتعبير الجيني

آب / أغسطس 10: CompaGB لمقارنة الجينوم برنامج المتصفح

آب / أغسطس 17: انتزاع, بمقارنة الجينومات النظر

آب / أغسطس 24: رسم المخططات نطاق لعزر سريعة

آب / أغسطس 31: من UniProt إلى SBKB المبادرة والعودة مرة أخرى


سبتمبر 2011

سبتمبر 7: علم الجينوم المقارن باستخدام محطة بلازا

سبتمبر 14: phiGENOME لجينوم البكتيريا الاستكشاف

سبتمبر 21: الحصول على تسلسل الجينوم المرافقة للمواقع

سبتمبر 28: مقدمة إلى R البرامج الإحصائية


أكتوبر 2011

أكتوبر 5: للحصول على معلومات الموارد VND الاختلاف الجيني والمخدرات

أكتوبر 12: موزع المسار في متصفح الجينوم UCSC

أكتوبر 19: الميتوكوندريا Transcriptome على GBrowser

أكتوبر 26: تباين البيانات من Ensembl


تشرين الثاني 2011

تشرين الثاني 2: MizBee تصاحب جيني المستعرض

تشرين الثاني 9: قاعدة بيانات جديدة من المتغيرات الجينومية: DGV2

تشرين الثاني 16: MapMi, آلية تعيين الموضع من microRNAأنا

تشرين الثاني 23: BioMart البوابة المركزية الجديدة

تشرين الثاني 30: Phosphida, قاعدة بيانات بعد تعديل متعدية

ديسمبر 2011

ديسمبر 7: VarSifter, لتحديد تسلسل الاختلافات الرئيسية

ديسمبر 14: تغييرات كبيرة على الموارد الوراثية وNCBI

ديسمبر 21: شراب البيض للعطلات (أو لاستكشاف الجينات orthologous)

ديسمبر 28: نصائح فيديو للأسبوع: الاستعراض السنوي الرابع (النصف الأول من 2011)

تلميح فيديو للأسبوع: BioMart البوابة المركزية الجديدة

BioMart وعلى نطاق واسع تستخدم لإدارة البيانات برمجيات المصدر المفتوح, مع واجهة التي تمكن المستخدمين النهائيين لتوليد الاستعلامات المعقدة وتفصيلها عبر أنواع عديدة ومصادر البيانات البيولوجية. انها جزء من GMOD أداة مجموعة, واختارت فرق المشاريع الكثيرة التي لدينا بيانات كبيرة لل BioMart برنامج لتنظيم وتقديم البيانات المتاحة لك.

لقد كنا من المشجعين لسنوات BioMart. انها واحدة من أقدم الأدوات البرمجيات وصفنا, كما تم دمجها في العديد من المواقع التي غطينا–مثل Ensembl. اندلعت في نهاية المطاف نحن من ذلك في مجموعتها الخاصة التعليمي, رغم أن, كما ان هناك الآن العشرات من الجماعات التي بنيت مارت خاصة بهم. على الرغم من أن الجلد قد تغير ومجموعات البيانات المتوفرة سوف تختلف في مواقع مختلفة, على ميزات البرنامج الأساسية هي نفسها. وسوف تعلم استخدام المدخل الرئيسي BioMart تساعدك على استخدام كل منهم. حتى وقت قريب كانت قائمة مزودي البيانات التي تستخدم BioMart على الصفحة الرئيسية, ولكن هنا طعم تلك القائمة من الشرائح بلدي:

في هذا غيض الفيديو سوف أعرض موقع BioMart حديثا إعادة تصميم الرئيسي, وتتطرق إلى بعض من إصدار آخر من BioMart أن تحصل على معرفة. سنكون التحديث جناح برنامجنا التعليمي مع نظرة جديدة قريبا, ولكن معظم وظائف البرنامج هو نفس ما ناقشناه خلاف ذلك (المتاحة عن طريق الاشتراك).

هناك نوعان من الإصدارات الرئيسية لتعميم BioMart الآن. الخامس 0.7 هو الذي من المحتمل أن يكون أكثر دراية للأشخاص الذين واجهت BioMart في أي من المواقع التي لديها منشآت الجينوميات الآن. ولكن هناك V الجديدة وإعادة تصميم - 0.8 الذي هو قيد الإعداد. انها القصة التي استخدمت في الكونسورتيوم الدولي لمكافحة السرطان الجينوم (ICGC.org) وهناك أيضا 0.8 BioMart البوابة المركزية المتاحة لمحاولة الخروج. في نهاية المطاف وهذا قد يحل محل العديد من 0.7 الاجهزة, ولكن هذا يعتمد على موقع. قد تستمر بعض مع 0.7 لفترة من الوقت بدلا من تحديث. لذا فإنه من الحكمة ربما لديك فكرة عن كيفية استخدام كل منها في هذا الوقت.

واحدة من ميزات واجهة BioMart الجديد الذي حصلت بالفعل الناس يتحدثون المعلوماتية الحيوية هو تحويل معرف. هذه هي مشكلة مشتركة في مجال, ويعتقد ستيفن تيرنر كان هذا الجانب من عملية شد وجه لطيف: BioMart جين معرف المحول.

وأردت أيضا أن نلاحظ أن BioMart هي واحدة من الأدوات التي يمكنك استخدامها في المجرة للوصول إلى مساحات كبيرة من البيانات لمزيد من التحليل. في المجرة, فتح “الحصول على البيانات” القائمة أن نرى أن BioMart هو واحد من الخيارات الخاصة بك.

كان هناك أيضا الكثير من اللغط يدور حول BioMart الاسبوع الماضي عندما “الظاهري العدد”قاعدة بيانات دورية وأطلق سراح أنه ليس مجرد نبذة عن المادة BioMart ككل, ولكن أيضا العديد من الموارد التي تستخدم BioMart لإدارتها والاستعلام وكذلك واجهات. بحيث يمكنك أن ترى كيف مفيدة على نطاق واسع هذا البرنامج, من بين العديد من أنواع مختلفة من مقدمي البيانات. يمكنك استخدام المنشآت المحلية BioMart في موقع مزود لل, أو يمكنك استخدام الموقع الرئيسي للاستعلام عن أي من هذه المصادر وكذلك–وأكثر من ذلك يمكنك بقوة عبر قاعدة بيانات الاستعلام جدا.

وصلات سريعة:

BioMart الموقع الرئيسي: http://www.biomart.org/

أسلوب جديد BioMart بيو البوابة الوسطى: http://central.biomart.org/

صفحات BioMart في GMOD: http://gmod.org/wiki/BioMart

الظاهري إصدار قاعدة بيانات عن BioMart: http://www.oxfordjournals.org/our_journals/databa/biomart_virtual_issue.html


كاسبرزيك, A. (2011). BioMart: قيادة التغيير في النموذج في إدارة البيانات البيولوجية قاعدة بيانات, 2011 دوى: 10.1093/database/bar049

تشانغ, ج., حيدر, س., باران, ج., كروس, أ., Guberman, ج., هسو, ج., ليانغ, Y., ياو, L., & كاسبرزيك, A. (2011). BioMart: إطار اتحاد بيانات لمشاريع تعاونية كبيرة قاعدة بيانات, 2011 دوى: 10.1093/database/bar038

Guberman, ج., إلى, ج., Arnaiz, O., باران, ج., بليك, أ., راني, ر., شلالا, C., حقل صغير مسور, د., كروس, أ., كاتس, ر., جنوة, أ., فوربس, س., فوجيساوا, ت., Gadaleta, E., Goodstein, د., Gundem, غ., Haggarty, ب., حيدر, س., قاعة, م., هاريس, ت., ثمر الزعرور البرى, ر., هو جين تاو, س., هوبارد, س., هسو, ج., آير, خامسا, جونز, P., كاتاياما, ت., كينسيلا, ر., كونغ, L., لوسون, د., ليانغ, Y., لوبيز Bigas, ن., لوه, ج., المورقة, م., ميسون, ج., Moreews, ف., نديغوا, ن., اوكلي, د., بيريز اماس, C., Primig, م., ريفكين, E., Rosanoff, س., الراعي, ر., سيمون, ر., Skarnes, ب., سميدلي, د., سبيرلنغ, L., سبونر, دبليو., ستيفنسون, P., حجر, ك., تيج, ج., وانغ, ج., وانغ, ج., يتى, ب., وونغ, د., وونغ ، ايراسموس, م., ياو, L., Youens كلارك, ك., أنا, C., تشانغ, ج., & كاسبرزيك, A. (2011). BioMart البوابة الوسطى: شبكة قاعدة بيانات مفتوحة للمجتمع البيولوجية قاعدة بيانات, 2011 دوى: 10.1093/database/bar041

حيدر, س., بالستر, ب., سميدلي, د., تشانغ, ج., الأرز, P., & كاسبرزيك, A. (2009). BioMart البوابة الوسطى–موحد الوصول إلى البيانات البيولوجية أبحاث الأحماض النووية, 37 (خادم الويب) دوى: 10.1093/nar/gkp265

جولة حول العالم من ورش العمل, وقف الأخيرة: مغربي, أفريقيا

المدربين & المنظمون

في العام الماضي أتيحت لي الفرصة لإعطاء ورشة عمل في المغرب إفران (UCSC الجينوم والجدول المتصفحات, المجرة) في جامعة الأخوين آل. هذا العام, عادت مريم وأنا في ورشة عمل أطول لمدة 3 أيام في جامعة الحسن الثاني في المحمدية. وكان OpenHelix من مقدمي ورشة العمل (التبرع عصرنا, المواد والخبرات). غطت ورشة العمل مجموعة كبيرة من المواضيع من جولة عالمية للموارد (البرنامج التعليمي-مجانا) واستهلالية UCSC متصفح الجينوم (البرنامج التعليمي-مجانا) و ترميز (البرنامج التعليمي-مجانا) لتحليل التباين في الجينوم dbSNP (البرنامج التعليمي-اكتتاب) وباستخدام تحليل المجرة (البرنامج التعليمي-اكتتاب). تستطيع أن ترى في الجدول الزمني الكامل من المواضيع ورشة عمل جدول المحمدية هنا (PDF).

في العام الماضي, أعجبنا مع الطلاب (كانت هناك 117 مجموع, حول 50/50 النسبة بين الجنسين). اللغة الإنجليزية هي لغتهم 3 أو 4 في معظم الحالات, العربية المغربية, اللغات الافريقية الفرنسية أو المختلفة التي بلغتها في الاختيار. حتى الآن, كانوا يقظ وطرح أسئلة مثيرة للغاية والادراك. كما كانوا متحمسين جدا

ورشة عمل للطلاب

المتعلمين. كانت فرحة لتعليمهم.

نود أن نشكر محمد Bourde في المعاهد الوطنية للصحة, الذي قضى على كميات كبيرة من الوقت وموارد مالية لتنظيم هذه (والعام الماضي) ورشة. نأمل في تكرار وتوسيع هذه للسنة المقبلة وربما السنوات القادمة. سنكون يبحث عن رعاة.

وطلب العديد من الأسئلة في ورشة العمل نود أن نكرر هنا الأجوبة وتسعى بعض الأجوبة من قرائنا:

*وطالب واحد يبحث عن موارد الجينوم القمح لتصميم الاشعال. جينوم القمح لم تكتمل بعد, ولكن هناك بعض الموارد لبدء:
القمح تسلسل الجينوم كونسورتيوم
موارد القمح وGramene
القمح مركز الموارد الوراثية والجينية @ ولاية كنساس
ربما أيضا CATCH حفظا للتسلسل
إضافة إلى تحرير:
CerealsDB و
جيمس’ آخر على تسلسل مشروع القمح قد يعطي بعض التبصر في أن الجينوم ضخمة.
*سأل طالب آخر حول أدوات dotplot:
المجرة تقدم مجموعة كبيرة من الأدوات بما في ذلك تحليل زخرف dotplot, كما يفعل EBI إنقش أداة

* سؤال آخر يتعلق العثور على البرمجة "الديناميكية’ (الحل الأمثل) أداة متعددة تسلسل المحاذاة في مقابل واحد ارشادي. المشكلة مع هذا هو تعقيد الفضاء بحثا عن حل البرمجة الديناميكية, وهذا قد يساعد مجموعة شرائح للتفاهم, ولا سيما الشرائح 1-5 و 17-22. فهو أيضا بشكل حسابي مكثفة. وقال ان, الطالب قد ترغب في التحقق من MSAProps و هذه القائمة في ويكيبيديا.

هل القراء لدينا أية توجيهات أخرى بشأن هذه?

التدريس لحظة

* سأل طالب آخر إذا عرفنا كيفية العثور على التدريب في منطقة العاصمة في العلوم البيولوجية. طالب آخر (رياضيات من مالي) كان يبحث عن شيء ما في الولايات المتحدة في المعلوماتية الحيوية. أي أفكار لبرامج لجلب طلاب البيولوجيا الأفريقية إلى الولايات المتحدة أو كندا?

إذا كان طلابنا المغربية (أو أي شخص آخر) لديك أي أسئلة إضافية, لا تتردد في نسألهم هنا!


والجانب علما. العام الماضي كان لي جميع 3 ساعة لجولة فاس. هذا العام أخذت تستفيد من رحلتي. قضى مريم وأنا بضعة أيام في فاس ومراكش. انضم إلينا عائلتي في مراكش في وقت لاحق ، وأنا وعائلتي للتجول 8 أيام بزيارة جبال الأطلس, الصحراء وفاس. وغني عن القول, كانت رحلة من العمر. المغرب هو المكان الرائع والجميل. وأتطلع إلى زيارة مرة أخرى.

بوابات وأبواب فاس هي جميلة

الجمل رحلة إلى الصحراء





الاتحاد الدولي لمكافحة السرطان الجينوم; مقابلة مع توم هدسون

لدينا تحدث عن المجين الاتحاد الدولي لمكافحة السرطان (ICGC) قبل عدة مرات, وكان لدينا نصيحة الأسبوع حول المشروع وقاعدة البيانات في العام الماضي. قد يكون الوقت قد حان لمعلومات جديدة بسبب موقعهم والبرمجيات تغيرت. أحد الجوانب بارد جدا من الوصول إلى البيانات هو أنها تستخدم BioMart الاستعلام أداة للواجهة–ولكن هذا هو v0.8 المتطورة نمط BioMart أن لديه بعض الميزات لطيفة الجديد.

على أي حال, رأيت سقسقة هذا الصباح حول مقابلة مع واحد من مديري وICGC, توم هدسون. انها لطيفة مقابلة ان المحادثات حول المشروع, التقدم, وأكثر. إذا كان لديك لم يتم بعد عمل ICGC قد تستخدم في هذه المقابلة كنقطة دخول لطيفة إلى أن. ومن ثم التحقق من البيانات–واجهة BioMart ما هو متاح في الموقع.

مقابلة (وغيض قبعة إلى مكبر الصوت الذي أشار لي هناك):

RT @ ResearchMedia: الدكتور توماس هدسون في الأمانة العامة ICGC الخطوط العريضة لمصلحة العمل كاتحاد في مكافحة السرطان # http://t.co/CqM1UQm

زيارة ICGC: http://www.icgc.org/ وانقر على بوابة بيانات لبدء النظر في البيانات التي تتدفق فيها الآن.


نصيحة الأسبوع: InterMine للتعدين “البيانات الكبيرة”

دمج مجموعات البيانات الكبيرة للاستعلامات داخل–وعبر–مجموعات مختلفة هي واحدة من الساحات التي كانت نشطة جدا في الآونة الأخيرة في مجال المعلوماتية البيولوجية. كما المزيد والمزيد “البيانات الكبيرة” مشاريع إنتاجية الأعداد الهائلة من نقاط البيانات وأنواع البيانات, هذا هو أن تصبح فقط أكثر ضرورة. أنا أحب لتصفح البيانات, ولكن هناك أوقات عندما استعلام واسعة النطاق مخصصة ما سترغب في إجراء بعض الاكتشافات أوسع.

الآن هناك عدد من الموارد والواجهات التي أنتقل إلى الاستعلامات المهيكلة ، ومخصصة لجمع البيانات. و UCSC الجدول المستعرض, BioMart, المجرة–هؤلاء هم عندي يدي على نحو مستمر تقريبا. ولكن هناك مستودع آخر ونظام الواجهة التي نراها أكثر وأكثر: الدولية لإزالة الألغام.

وكان لقائي الأول مع InterMine الحقيقي لل modENCODE البيانات. هناك بعض البيانات رائع حقا المتدفقة من هذا المشروع الآن (تحدثت قليلا عن ذلك هنا مؤخرا), واجهة ونظام التخزين التي تستخدمه InterMine.

وكان FlyMine الزخم الأولي لل “منجم” نظام. بعض السنوات الى الوراء كما تم إنشاء مستودع FlyMine ونظام الاستعلام عن كميات متزايدة من البيانات التي تطير كانت قادمة من مختلف المشاريع. كان الهدف أن يكون لها ما يكفي من نظام قوي للالمعلوماتية الحيوية + السوبر المستخدمين, ولكن أيضا واجهة ودية لكنها قوية لعلماء الأحياء لاستخدام مقاعد البدلاء.

ووصفت الصحيفة الأولي من المكونات الأساسية: واجهة المستخدم مع 3 المكونات الأساسية: بحث سريع هذا أمر عظيم لتصفح; مكتبة القالب الذي يتيح للمستخدمين الوصول إلى بعض أنواع محددة مسبقا الاستعلام القياسية أو من المحتمل أن يتمكنوا من قرص لاحتياجاتهم; ومنشئ للتخصيص بالكامل للوصول الأكثر تقدما. منذ ذلك الحين استمر هذا التطور ورقة, وهناك غيرها من الميزات الجديدة والحالية وكذلك باردة.

وكان آخر هدف كبير من الجهد FlyMine لتكون قادرة على التعامل مع القوائم. أحد الأسئلة الأكثر شيوعا نحصل تزال في حلقات العمل: “لدي قائمة من _____. ما هي أفضل طريقة للتعامل مع هذا?” FlyMine–وبصفة عامة InterMines–مساعدة الناس على إدارة الاستعلام واستكشافاتهم مع قوائم من الاشياء.

ميزة MyMine من InterMines هو أيضا عنصر لطيفة. يمكنك إنشاء تسجيل الدخول وتخزين أشياء كنت تريد أن يكون الوصول إلى تكرار: الاستعلامات, يسرد, الخ.

هناك أشخاص آخرين باستخدام InterMine نظمها جدا–ورقة الأخيرة على TargetMine, إلى “اكتشاف الجينات وتحديد الأولويات المستهدفة” متاح, وربما تبدو وكأنها تلميح المقبلة! لم جنيفر طرف على YeastMine من SGD مرة واحدة كذلك.

ولكن ما أثار لي أن أفعل هذا غيض هو أن الرسالة جاءت من RGD القائمة البريدية الاسبوع الماضي قال ان هذا:

فعالة الجمعة, قد 20ال, 2011 وسوف يتقاعد أداة BioMart MCW من قبل مركز البروتيوميات MCW RGD و. بالنسبة للبيانات الفئران التعدين, لقد وجدنا أن الأداة RatMIne أسهل في الاستخدام, أكثر مرونة، ويتضمن أكثر من أنواع البيانات من BioMart. وبالإضافة إلى ذلك, RatMine يتضمن أدوات التحليل التي لا توجد في BioMart, منح المستخدمين RatMine واحد, بديهية واجهة لكل من الحصول على البيانات وتحليلها.

لذلك فهي تتحرك تماما InterMine وتقاعد BioMart الجرذ, تستخدم حصرا RatMine في تركيبها. لذا فإن هذا غيض من الاسبوع استكشاف InterMine, RatMine, وبعض المناجم الأخرى. ان الكثير من الأرض لتغطية–لكن ربما يستحق وقتك لمعرفة InterMine كما أن تصبح متاحة على نطاق أوسع. من المهم أيضا أن نفهم كيفية الاستعلام مع الألغام إذا كنت ترغب في جلب البيانات إلى غالاكسي لمزيد من التحليل. إذا قمت بزيارة غالاكسي سترى أن لها “الحصول على البيانات” القسم تمكنك من الوصول إلى الأدوات المتعلقة بالألغام–ولكن ما زالت هناك حاجة لمعرفة كيفية القيام الاستعلامات الأساسية في موقع المضيف أولا.

على الرغم من أن هذا غيض أتطرق RatMine, التركيز هو أعم InterMine جناح. RGD وقال أيضا في هذا إشعار لهم:

لمحة عامة عن RatMine وكيفية استخدامه, انتقل إلى الفيديو التعليمي RGD, “مقدمة إلى قاعدة البيانات RatMine”, في http://rgd.mcw.edu/wg/home/rgd_rat_community_videos/an-introduction-to-the-ratmine-database2. بدلا من ذلك, يتبع “التوجيه الذاتي جولة” من RatMine بالضغط على “القيام بجولة” الرابط في أعلى أي صفحة RatMine.

لمحاولة الخروج RatMine لنفسك, انتقل إلى http://ratmine.mcw.edu/ مع بدء واستخراج البيانات وتحليل مبسط.

حتى إذا كنت ترغب في الحصول على معلومات أكثر تحديدا حول استخدام RatMine, تأكد من تحقق من دخولها.

روابط سريعة:

الدولية لإزالة الألغام: http://intermine.org/

RatMine: http://ratmine.mcw.edu/

modENCODE: http://www.modencode.org/

المجرة: http://usegalaxy.org/

لين, ر., سميث, ر., روثرفورد, ك., Wakeling, م., فارلي, أ., Guillier, ف., يانسنس, ه., لها, دبليو., ماكلارين, P., شمال, P., رنا, د., رايلي, ت., سوليفان, ج., واتكينز, عاشرا, ودبريدج, م., يللي, ك., راسيل, س., Ashburner, م., Mizuguchi, ك., & Micklem, G. (2007). FlyMine: قاعدة بيانات متكاملة عن علم الجينوم وذبابة الفاكهة الأنوفيلة الجينوم علم الأحياء, 8 (7) دوى: 10.1186/GB - 2007 - 8 - 7 - R129

التعدين “البيانات الكبيرة” هو…ساحر. وضروري.

عندما يكون لدينا ورش العمل القادمة, أقضي بعض الأدوات المرة في البيانات الكبيرة لمعرفة ما إذا كانت هناك تغييرات منذ آخر مرة تحدثت عن ذلك, تحديث الشرائح إذا لزم الأمر, وتشكل أحيانا فرضية واختباره. (PS: نحن في بايلور المقبل, إذا كان هناك من يبحث عن ورشة عمل هناك.) يوم الجمعة أنا نفسي مفقودة تماما في استعلام التي بدأت في UCSC في ترميز البيانات, وانتهى به المطاف في ICGC BioMart. ونجاح باهر. لا أتمنى له somedays المختبر….

كان واحدا من التعليقات في ورشة عمل لدينا الماضي ان ترميز البيانات على خطوط الخلية ليست هي نفسها كما يبحث في الأنسجة. وأنا أتفق تماما مع هذا–ولكن الفأر ترميز البيانات سوف تساعد في الحصول على هذا النوع من البيانات. ولكن كشخص أمضى الكثير من الوقت في زراعة الخلايا الماضي, أنا مهتم لمعرفة كيفية خطوط خلايا مختلفة من “مرجع” الجينوم تكمل. وهناك جزء محدد من المشروع ترميز الإنسان أن يبحث في هذا: خلية مشتركة CNV المسار.

هنا هو ما فعلته: استعلام الجدول متصفح للبحث عن أنواع من التغيرات الهيكلية التي تم الخروج في 3 خطوط الخلايا التي تم النظر: GM12878, HepG2, وK562. كنت أتساءل مع نفسي: كم من هذه التنوعات في عدد النسخ تداخل مع الجينات المعروفة? وماذا عن أنواع الاختلافات هناك? هنا عينة من كيف أن تنظيما الاستعلام عن واحدة من خطوط الخلايا:

هذا الاستعلام غلة المقاطع العادية, التكبير, الحذف–وبعض الحذف ومتماثل وبعضها متخالف. واحدة من النقاط التي تجعل في ورشة العمل ترميز هو أنه إذا كنت تستخدم خط الخلية سأكون غريبة لمعرفة هذه الامور حول هذا الموضوع–أتمنى شخص سيفعل هيلا وغيرها من خطوط الخلايا الكبيرة هناك أيضا. (ربما شخص ما, لكنني لا أعرف عن البيانات. اذا كان شخص ما قد كان, أعطني صاح.)

لذلك أنا العمل حول هذه الاختلافات, وحصلت غريبة عن منطقة واحدة ولا سيما في واحدة من خطوط الخلايا. وأحاطت بها المنطقة مع بعض الجينات وليس المهم المظهر. ذهبت إلى الأدب ليجد أن يعرف هذه المنطقة إلى وجود مشكلة في بعض أنواع السرطان.

ذهبت لإلقاء نظرة على البيانات ICGC لمعرفة ما إذا كان أي شيء للاهتمام مع تحول هذه الجينات. ونجاح باهر–تعرف يا whadda: تعيين ليس هناك من نصف طن من البيانات في ذلك بيانات حتى الآن, ولكن وجدت المراسلات كبيرة بين بعض البيانات بالفعل هناك من الأورام الحقيقية وماذا وجدت في خط الخلية. انه من المبكر جدا التوصل إلى استنتاجات حول ذلك. انه من الصعب ان نعرف في هذه المشاريع الكبيرة البيانات ما كنت * * لا يرى, كم هو بالفعل في وجود, كم هو لا, الخ. ولكن راجعت مجموعة من الجينات الأخرى ولم تظهر هذا النوع من نمط كنت أشاهده.

بسبب سياسة الاستخدام ICGC, أنا لا أعتقد أنني أستطيع التحدث تحديدا حول ما رأيت. ولكن كان من الغريب جدا. إذا كان لي أن وضعت مختبر كنت طالبا في هذا الصباح ;)

وجهة نظري هو هذا: البيانات ليست في الصحف بعد الآن. انها في قواعد البيانات. ويجب أن تكون عليه التعدين–هذه المشاريع الكبيرة هي تسليم البيانات لك البيك محاور وكنت مشيرا إلى المناجم.


ما عليك ان تفعل ما فعلت:

1. فهم لل وظائف UCSC و ترميز البيانات. تحقق من الدروس لدينا على تلك التي هي متاحة بحرية كما يتم برعاية من قبل UCSC وفريق ترميز في UCSC.

2. BioMart: لدينا برنامج تعليمي على هذا, ولكنها في حزمة الاشتراك لدينا.

ما لا تحتاج: الأدب الحالي. انها ليست في ورقات, ويمكن أن تكون أبدا. و “البيانات الكبيرة” الاشياء هي في قواعد البيانات, ويمكن فعلا كميات صغيرة فقط ينشر في الطريقة التقليدية.