الفريق في UCSC متصفح الجينوم continues to update their resources and offer new ways to find and visualize features of interest to researchers. One of the newer features is the “multi-region” option. When it was first launched, I did a tip on how to use that, with some of the things that I noticed while I was testing it pre-launch. But now the folks at UCSC have their own video on the exon-only display that you might also find useful.

One of the things that is illustrated here is how the exon-only mode is handy to enhance your exploration of RNA-Seq data. It also uses a great ترميز data set as an example, and if you haven’t been using that collection it’s a good reminder of the kinds of things you can find in that resource still. And this extensive data set shows how much easier it is to look at different isoforms in the data in this new exon-only mode.

So have a look at this display option if you haven’t before, especially how it can help you to see transcript differences. إذا كنت لم تكن مألوفة مع ترميز البيانات that’s being used, you can also see our training on that which will help you to understand how to use that data and the filtering features that are also used in this video.

ملاحظة خاصة: I have updated the UCSC Intro slides to include the new Gateway strategies as well. So download those slides for the latest look.


إفشاء: UCSC Genome Browser tutorials are freely available because UCSC مقدمي us to do training and outreach on the UCSC Genome Browser.

الجمعة SNPpets

This week’s SNPpets include a slew of new tools, including RNA secondary structure, الجينوم الشرح, and a new platform for mitochondrial diseases. It includes some updates to old favorites, مثل GeneCards and a new الدولية لإزالة الألغام for Xenopus. A call for help reviewing plugins at BioGPS. Two very interesting items on citations for software tools–one about software citations, and one way to publish and get properly cited. Cracking the walnut genome. And an irresistable look at cheetah genomics. وأكثر من ذلك.

SNPpets_2ترحيب لدينا ميزة جمع الجمعة الارتباط: SNPpets. خلال الأسبوع صادفنا الكثير من الروابط والقراءات التي نعتقد أنها مثيرة للاهتمام, ولكن لا تجعل من لبلوق وظيفة. ها هم لمتعتك…


UCSC Genome BioinformaticsAs noted in غيض الأسبوع الماضي about the ENCODE DCC at Stanford, there was a workshop recently for the ترميز مشروع. There were a lot of folks speaking and a big room full of attendees. You should check out the full agenda and the playlist at the NHGRI site for all the videos, الشرائح, and handouts: ترميز 2015: Research Applications and Users Meeting.

This week I’m highlighting another video from this event. In this one, Pauline Fujita from the UCSC متصفح الجينوم covers ways to work with ENCODE data in their browser.

Some of the talk includes intro stuff for brand new users, because there were certainly some in this workshop. If you are new to the tools, أيضا, you can also see our free tutorial suites (أقل من). Pauline also quickly highlights their Genome Browser in a Box virtual machine option for folks who have privacy sensitive or protected data, but only briefly. If you want some more info on that, راجع موقعنا Tip of the Week on GBIB.

But soon she covered more detail on features like track hubs and how to use those (if you wanted to jump to that part, it begins around 20min). That extra search for items in the Track Hub is really good to know about. file_formats_helpأيضا, there’s some guidance here on the types of file formats that you may want to use to structure your data. Also why you want BED vs Wiggle, مثلا. For the part that addresses these formats, jump to about 33min.

Towards the end there’s coverage of the Data Integrator. The idea with this feature is that maybe you’ve got some information on a region and you have this structured as a BED file–or a number of regions–and you want to find out what else is going on in those regions. The Data Integrator can help you with that by finding overlaps among different tracks of data (around 45min). The Variant Annotation Integrator does kind of a similar thing, but for VCF files with variation information (~48min). A smidge more guidance on track hubs comes in at 50min.

In our paper for Current Protocols (which is now in PubMedCentral), we talk a bit about the hubs structure too. So if it runs too quickly at the end, our paper shows some of that detail pretty much the same way. That might help you to think about how to structure them if the concept is new to you. But if you are ready to dive in, there’s a paper specifically about hubs. And there’s also more background on the browser’s tools and in the NAR database issue papers. There’s a lot of ENCODE data available to mine, and I really hope more folks can use the tools to find new insights into genomic regions they are interested in.

تلميح فيديو للأسبوع: ترميز البيانات مركز التنسيق, phase 3


Image via: ألف دليل المستخدم للموسوعة عناصر الحمض النووي (ترميز). دوى:10.1371/journal.pbio.1001046.g001

و ترميز project began many years ago, with a pilot phase, that examined just 1% من الجينوم البشري. But this initial exploration helped the consortium participants to iron out some of the directions for later stages–including focusing on specific cell lines, تقنيات, and technologies in Phase 2. There have been a number of publications that came out from consortium members, but in addition to the participant’s papers, a lot of other folks have mined this data for various investigations as well. There’s still plenty of opportunity for discovery. Some people may not realize that there’s an also ENCODE phase 3 جارية.

When we had a contract with the folks at UCSC متصفح الجينوم for outreach on ENCODE, we developed materials to help people explore the data. But we hadn’t delved into it much since phase 3 began. But the other day I got a note from my NHGRI YouTube subscription (GenomeTV) that a whole workshop of ENCODE phase 3 information had been made available. So I wanted to have a look.

There is a series of video segments that correspond to this agenda from the ENCODE workshop. I’ll be highlighting one of them here, the one that introduces the features of the Phase 3 Data Coordination Center at Stanford now. But there may be others that you want to examine for your research goals as well. Another way to work through the different segments is available from the NHGRI page here: http://www.genome.gov/27561910 That page offers the slides, الصدقات, and exercises too.

The video is longer than our typical tips, but it’s worth seeing for the context and framework details. There’s also a section on searching and filtering, which explains how to locate precisely the things you want to find. There’s a helpful and funny analogy to searching for shoes as you would at Zappos. I’ve used the Zappos tool exactly that way, and I also like it very much. If you want more details on how their ontology structure helps them to accomplish this, check out the paper linked below. Also in the video, there’s a piece about how the metadata is structured, وماذا يمكنك أن تتوقع أن تجد هناك.

There’s also a part about how to visualize the things you find. You end up loading them as a UCSC Genome Browser track hub, which is integrated with all they other data at UCSC. There’s another video with Pauline Fujita on the hubs which I’ll address separately later.

و playlist for the whole meeting is here. I won’t be highlighting all of them, but I may select more of them for future tips.

الجمعة SNPpets

This week’s SNPpets include definition confusion in “علم التخلق”, two HIPPIES, a new mouse ENCODE browser, الأرقام المعيشة (new ways to interact with published data), and new features at the Drug-Gene Interaction database (DGIdb). يا–and the woolly mammoth genome.

الجمعة SNPpets

تلميح فيديو للأسبوع: UCSC جديدة “مكدسة” تذبذب عرض المسار

غيض الفيديو هذا الأسبوع يظهر لك طريقة جديدة للنظر في البيانات المسار multiWig في متصفح الجينوم UCSC. A وقد تم مؤخرا الإفراج عن خيار جديد (انظر 06 قد 2014), a “مكدسة” رأي, وانها وسيلة سهلة لإلقاء نظرة على البيانات مع استراتيجية جديدة. ولكن أنا أعترف استغرق مني بعض الوقت للعمل معها لفهم التفاصيل. حتى في هذا غيض آمل سترى العروض ما التصور الجديد.

ولن أخوض في الخلفية على المسارات الشرح أنواع كثيرة متاحة–إذا كنت في حاجة للتعرف على فكرة وجهات النظر الأساسية المسار, تبدأ مع دينا مقدمة البرنامج التعليمي أن يتناول أنواع مختلفة من تمثيلات رسومية. وتطرق المسارات المخصصة في في المتقدمة التعليمي. للحصول على إرشادات على وجه التحديد كيفية إنشاء أنواع مختلفة المسار, راجع وثائق UCSC. نوع المسار انا يوضح في الفيديو اليوم, وتراك MultiWigك, لديها قسم خاص بها هناك أيضا. أساسا, إذا كنت جديدا تماما لهذا, و “تذبذب” الاسلوب هو وسيلة لإظهار عرض الرسم البياني عبر المنطقة. MultiWig يتيح لك تراكب العديد من هذه رسوم بيانية في مكان واحد. في المثال سوف تظهر هنا, نتائج النظر في 7 يتم عرض خطوط مختلفة من الخلايا لبعض الإشارات علامة هيستون (الطبقات H3K27Ac المسار).

Annotation track cell lines

خطوط الخلايا الشرح المسار

عندما رأيت إعلان, اعتقدت هذا وسيلة جيدة لإظهار كافة البيانات في وقت واحد. عندما نفعل ورش العمل الأساسية, ليس لدينا دائما الوقت للذهاب في تفاصيل هذا الرأي, على الرغم من أننا نفعل استكشاف ذلك في ترميز المواد, لأن المسار أنا باستخدام واحدة من مجموعات البيانات ترميز. سوف تستخدم نفس المسار في المنطقة نفس الاعلان, والذي يظهر هنا:

stack announcementولكن عندما كنت أول بدا في هذا, لم أكن متأكدا مما إذا كان الذروة–التركيز على ذروة الوردي الذي يمثل خط الخلية NHLF–كان من المفترض أن تغطي المنطقة كلها تحت أو لا. ما كنت في محاولة لمعرفة هذا هو أساسا (تمثيل رسومي من بلدي عملية التفكير يلي):


من خلال محاولة الخروج من الأساليب المختلفة وكنت متأكد من كان لي فكرة ما كان حقا التي تظهر, لكني أكدت أن مع واحدة من المطورين المسار. القيمة ليست سوى جزء الفرقة الوردي, لا المنطقة كلها تحته. وأشار ماثيو لي أيضا أنهم فرز المسارات بالترتيب الأبجدي العكسي (حتى NHLF هو أعلى في المكدس). كان ذلك جانبا لم أكن أدرك حتى الآن. لا الفرز تقوم على القيم في تلك البقعة. هذا الأمر يبدو معقولا تماما, بالطبع, لكنه لم يكن واضحا لي في البداية.

أنا أحب هذا الخيار كثيرا–لكنني أحسب إذا اضطررت إلى القيام ببعض نودلنج على ما في الواقع يعني الآخرين قد يكون نفس الأسئلة.

في الفيديو سوف تظهر لك كيف تبدو هذه الشريحة مع مختلف “طريقة تراكب” الإعدادات على هذه الصفحة المسار. سأكون تبحث في منطقة SOD1, مثل المثال إعلان. أنا أنب زوجين من الإعدادات الأخرى من التخلف لذلك سيكون من السهل أن نرى على الفيديو (انظر النصال لتغييراتي). ولكن آمل أن يكون هذا ينقل الخيارات المتاحة لديك الآن للنظر في هذا النوع من البيانات على نحو فعال المسار.

Track settings for videoحتى هنا هو الفيديو مع SOD1 5′ منطقة في وسط, باستخدام 4 الخيارات المختلفة من طريقة تراكب, توضح البيانات علامة هيستون في 7 خطوط خلية. أنا لن أدخل في تفاصيل البيانات هنا, ولكنني سوف أشير لكم إلى مرجع المرتبطة بهذا العمل لمعرفة المزيد عن كيف يتم ذلك–انظر ورقة مختبر بيرنشتاين أدناه. أردت أن مجرد إثبات هذا النوع الجديد من خيارات العرض التي ستكون متاحة على المسارات تذبذب. وبعض المسارات لديها بيانات كثيرة جدا لنوع واحد أو لآخر, أو سوف تكون أكثر وضوحا مع واحد أو نمط آخر. ولكن الآن لديك طريقة أخرى للنظر فيه.

نصائح فيديو للأسبوع, الاستعراض السنوي 2013 (جزء 1)

كما قد تعلمون, لقد كنا نفعل هذه الفيديو نصائح من بين أيام الأسبوع ، إلى ستة سنوات حتى الآن. أكملنا أو جمعها حول 300 مقدمات طعام شهي القليل من الموارد المختلفة من خلال هذا العام الماضي, 2013. في البداية كان علينا أن نفعل كل من مقدمات الفيديو الخاصة, ولكن كما أصبح الفيلم التكنولوجيا أكثر يسرا وجعلها أكثر فرق خاصة بهم, كنا قادرين على العثور على مزيد من الكثير الذي تم القيام به من قبل مقدمي الموارد أنفسهم. لذلك بدأنا في جمع تلك أيضا. في نهاية السنة لقد أقمنا نوعا من التقليد عطلة: نحن نقوم بإعداد ملخص آخر لجمع كل منهم. إذا كان لديك أي غاب منهم انها طريقة رائعة لإلقاء نظرة سريعة على ما قد يكون من المفيد لعملك.

تستطيع أن ترى نصائح السنوات الماضية 'هنا: 2008 في, 2008 الثاني, 2009 في, 2009 الثاني, 2010 في, 2010 الثاني, 2011 في, 2011 الثاني, 2012 في, 2012 الثاني, 2013 الثاني (الأسبوع المقبل).

استعراض السنوي السادس:

كانون الثاني / يناير 2013:
كانون الثاني / يناير 2: الاستعراض السنوي V من اثنين
كانون الثاني / يناير 9: جديدة ومحسنة OMIM ®
كانون الثاني / يناير 16: InSilico DB
كانون الثاني / يناير 23: ZooBank الأنواع والتسميات
كانون الثاني / يناير 30: ScienceGameCenter # EDTECH

شباط / فبراير 2013:
شباط / فبراير 6: MotifLab طاولة العمل لتحليل TFBS
شباط / فبراير 13: UCSC متصفح الجينوم تقييد انزيم العرض
شباط / فبراير 20: ترميز البيانات في UCSC (تذكير)
شباط / فبراير 27: NetGestalt

آذار / مارس 2013:
آذار / مارس 6: NCBI منضدة الجينوم
آذار / مارس 13: القاعدة الجوية
آذار / مارس 20: figshare + = GenoCAD التوعية
آذار / مارس 27: البوابة الانزيم والتي تركز على التصميم المستخدم

نيسان / أبريل 2013:
نيسان / أبريل 3: Phytozome والخوخ المجين
نيسان / أبريل 10: استهلالي Cheminformatics
نيسان / أبريل 17: تبادل البيانات H7N9 في GISAID.org مع EpiFlu ™
نيسان / أبريل 24: سرطان أطلس خارطة الطريق

قد 2013:
قد 1: بلدي جينوم السرطان
قد 8: Transfac (وHGMD, بروتيوم, الخ)
قد 15: قاعدة بيانات بحوث الأنفلونزا (IRD)
قد 22: قاعدة بيانات الكناري للالحراس من صحة الإنسان
قد 29: QIIME لرؤى الكمي في علم البيئة الميكروبية

حزيران / يونيو 2013:
حزيران / يونيو 5: Prezi وغيرها من وسائل العرض غير الخطية
حزيران / يونيو 12: TrioVis لمجموعات البيانات الجينوم الأسرة
حزيران / يونيو 19: ترميز أداة أهمية الشذرة تسلسل
حزيران / يونيو 26: InnateDB, بيولوجيا الأنظمة من الاستجابة المناعية الفطرية

VideoTip من الأسبوع: ترميز @ Ensembl

لدينا الكثير من الدروس (2 في الواقع, ترميز المؤسسات & ترميز @ UCSC), نصائح و معلومات حول ترميز. لدينا أيضا الكثير من الدروس (ثانية 2, Ensembl و Ensembl وراثي- على الإصدارات القديمة ), نصائح و معلومات حول Ensembl, قاعدة البيانات والمتصفح في بنك الإمارات الدولي.

الآن هنا هو غيض من الأسبوع على كلا Ensembl وترميز. هذا هو واحد من أكثر الإضافات الأخيرة إلى دروس الفيديو Ensembl لل. يبدو هذا الفيديو على كيفية تحديد متواليات التي يمكن أن تشارك في تنظيم الجينات. ويستند معظم هذه البيانات في Ensembl على ترميز البيانات. هذا يستخدم “مصفوفة,” طريقة لتحديد بيانات التنظيم بحاجة لكم يعتمد على أنواع الخلايا وللTF. في نهاية 8 فيديو دقيقة يناقشون أكثر قليلا حول كيفية الحصول على كل ترميز البيانات.

هكذا, الآن لديك ثروة من المعلومات هنا في OpenHelix من خلال الدروس لدينا وبلوق عن ترميز وEnsembl.

تلميح فيديو للأسبوع: ترميز أداة أهمية الشذرة تسلسل

كنا نقوم به التدريبية وورش العمل على UCSC متصفح الجينوم إلى 10 سنوات حتى الآن. انها أداة الهائلة التي يجب أن يكون عنصر التأسيسية في مجموعة الأدوات الخاصة بك في الجينوميات. لكن–قد تكون هناك أوقات عندما تريد فحص بعض البيانات التي يمكنك أن تجد هناك في طريقة أخرى, مع التركيز مختلفة أو التركيز. قد يكون من الممكن لصياغة بعض ذكية الجدول المستعرض الاستعلامات التي تحصل على ما تريد. أحيانا, رغم أن, شخص آخر قد خلق طريقة لالاستعلام عن البيانات الأساسية عن موضوع يمكن أن تكون مفيدة جدا. والإكراميات اليوم من الأسبوع هو بالضبط هذا النوع من أداة. واجهة ويب للاستعلام عن البيانات ترميز التي تتواجد في متصفح الجينوم UCSC, مع التركيز على إيجاد عوامل النسخ مع الربط التخصيب في المنطقة التي كنت قد تكون مهتمة باستكشاف. تلميح فيديو اليوم هو ل ترميز أداة أهمية الشذرة تسلسل.

هناك طن من البيانات الكبيرة التي تدفقت على متصفح الجينوم UCSC كجزء من ترميز مشروع. انها سوف توفر سنوات من التعدين لعلماء الأحياء. ما يمكن أن يكون العظيم هو للباحثين الطب الحيوي الذين لديهم مصلحة في جينات معينة–أو مجموعات من الجينات–لنلقي نظرة على البيانات ترميز لمعرفة ما اذا كان يمكن كشف بعض الأفكار المفيدة حول تنظيم هذه الجينات أو قوائم الجينات. يمكنك استخدام أداة أهمية الشذرة تسلسل للتدقيق من خلال البيانات.

شريط الفيديو أن فريق مختبر بوتي فعل هو لطيف جدا. توجيهات محددة للغاية حول كيفية استخدام أداة بهم–ماذا تختار لخيارات القائمة, ما هي الخيارات, وماذا نتوقع من نتائج. وهنا الفيديو الخاصة بهم:

بالطبع يجب عليك قراءة ورقتهم حول هذه الأداة للخلفية التي تحتاج إليها (ترتبط أدناه), والمراجع التي سوف تساعد أيضا على فهم ما تقدم هذه الأداة. يجب عليك أيضا أن تقرأ على البيانات ترميز المرتبطة. كما كتب الملحق مع ورقة لطيف في لغة واضحة لمساعدتك على فهم الميزات.

كان واحدا من الأشياء التي كانت غريبة عن ما إذا كان يمكن تمديد هذه لبيانات الماوس أيضا. شيء واحد أن الناس احتج لي عنه هو أن ترميز البيانات هو خط الخلية, والبيانات الأنسجة سيكون حقا كبيرة. لكنني رأيت مناقشة في بلوق ستيفن تيرنر (قراءة التعليقات) حول التركيز على الإنسان في الوقت الحالي. وكان هناك أيضا مناقشة أداة CScan, رغم أن, والتي لا تغطي البيانات الماوس. حتى إذا كان هذا هو أداة كنت مهتما في, قد ترغب في استكشاف CScan جدا.

غيض قبعة لستيفن تيرنر لوعي:

أورباخ, ر., تشن, ب., & بوتي, A. (2013). المتعلقة الجينات إلى وظيفة: تحديد عوامل النسخ المخصب باستخدام أداة أهمية الشذرة تسلسل ترميز المعلوماتية الحيوية دوى: 10.1093/bioinformatics/btt316