فئة المحفوظات: نصيحة الأسبوع

sneakPeekGateway

تلميح فيديو للأسبوع: New UCSC Genome Browser Gateway look

sneakPeekGateway

For years now we’ve been doing training and outreach on the UCSC متصفح الجينوم. And there’s been a lot of change over the years–so much more data, so many new tools, الأنواع الجديدة. All that ENCODE information and a portal لذلك. But the look of the main site was largely the same. Here’s a post we did that included the UCSC site traffic in 2000, and another time we took a look at the old style interface ~2004. And there was the switch to the new blue look in 2012.

ومع ذلك, the main gateway page was largely the familiar look. The gateway–where you begin to do most text-based or region-based queries for a species–was mostly altered only with some additional buttons and options. And an increasingly long list of species to choose from. ولكن الآن–it’s time to look again. The gateway is very different today. You’ll have faster and easier access to get started when you go to the site, and new ways to engage with the data that you want to begin to access.

There are additional details on the UCSC landing page in the News area, including credits to the development team involved. The other key pieces include some relocations of the previous button options:

Note that a few browser utilities that were previously accessed through links and buttons on the Gateway page have been moved to the top menu bar:

*Browser reset: الجينوم المستعرض > Reset All User Settings
*Track search: الجينوم المستعرض > Track Search
*Add custom tracks: My Data > عرف المسارات
*Track hubs: My Data > المسار موزع
*تكوين وعرض المسارات: الجينوم المستعرض > Configure

The UCSC team has created a short intro video to the new look. That is our Video Tip of the Week:

بالطبع, this means we’ll need to update our slides and exercises. We like things to stabilize a bit after a rollout to be sure things are solid. But soon we’ll include the new navigation in our materials.

The underlying ways to access the particular assembly features you need for a given genome, and the data for your tracks of interest, is unchanged. So those parts of our training materials will still help you to get the most out of your searches. We’ll let you know when we’ve made the changes to the materials as well.

 

وصلات سريعة:

UCSC Genome Browser main landing page: المتشعب://genome.ucsc.edu

Training materials:

مقدمة: http://openhelix.com/ucsc

متقدم: http://openhelix.com/ucscadv

مرجع:

مهماز, م., فرع, أ., Rosenbloom, ك., راني, ب., مقدمي, ب., Nejad, P., لي, ب., المستفادة, ك., Karolchik, د., Hinrichs, أ., Heitner, س., الثابت, ر., Haeussler, م., Guruvadoo, L., فوجيتا, P., Eisenhart, C., Diekhans, م., كلوسون, ه., كاسبر, ج., حلاق, غ., هاوسلر, د., كوهن, ر., & كينت, في. (2015). مستعرض قاعدة بيانات الجينوم UCSC: 2016 التحديث أبحاث الأحماض النووية دوى: 10.1093/nar/gkv1275

إفشاء: UCSC Genome Browser tutorials are freely available because UCSC مقدمي us to do training and outreach on the UCSC Genome Browser.

expVIP example

تلميح فيديو للأسبوع: expVIP, an Expression, تصور, and Integration Platform

كما ذكرت في الاسبوع الماضي, I am watching a lot of farmers on twitter talk about this year’s North American growing season. To get a taste of that yourself, إلقاء نظرة على #Plant16 + قمح as a search. This is where the rubber of tractor tires and plant genomics hits the…جيد…rows. And just coincidentally I saw a story about this new plant genomics research tool–actually in the farming media.

It’s kind of nice to see plant bioinformatics get some recognition beyond the bioinformatics nerd community. The piece “New online tool helps predict gene expression in food crops” did a pretty good job of talking about the features of the expVIP tool, and I was eager to have a look.

expVIP stands for expression فيوisualization فيNTEGRATING فlatform. expVIP exampleAlthough the emphasis here is plant data, it can be used for any species. A good summary of their project is taken from their paper (ترتبط أدناه):

expVIP takes an input of RNA-seq reads (from single or multiple studies), quantifies expression per gene using the fast pseudoaligner kallisto (Bray et al., 2015) and creates a database containing the expression and sample information.

And it can handle polyploid species–try that on some of the tools aimed at human genomics! They illustrate this with some wheat samples from a number of different studies. And then they use the metadata about the studies, such as tissues and treatment conditions, to show how it works with some great sorting and filtering options. They created a version of this for you to interact with on the web: Wheat Expression Browser. But you can create your own data collections with their tools, aimed at your species or topics of interest.

This week’s Video Tip of the Week is their sample of how this Wheat Expression Browser works. Although you see the wheat data here, it’s just an example of how it can work with any species you’d like to examine.

I followed along and tried what they were showing in the video, and I found it to be a really slick and impressive way to explore the data. The dynamic filtering and sorting was really nice. You can customise the filtering/sorting/etc for the visualizations with the metadata that’s useful to your research. So you could set the tissue types, or treatment conditions, or whatever you want–and filter around to look at the expression with those. They go on to show that their strategies to compare genes in different situations seemed to reflect known biology in disease and abiotic stress conditions.

So their pipeline for gene matching, as well as the tools to explore and visualize RNA-Seq data, offer a great way to look at data that you might generate yourself or you could mine from existing submitted data–but that might not be well organized and available in a handy database just yet.

وصلات سريعة:

Wheat expression browser: www.wheat-expression.com

expVIP at GitHub: https://github.com/homonecloco/expvip-web

مرجع:

Philippa Borrill, Ricardo Ramirez-Gonzalez, & Cristobal Uauy (2016). expVIP: a customisable RNA-seq data analysis and visualisation platform فسيولوجيا النبات, 170, 2172-2186 : 10.​1104/​pp.​15.​01667

SoyBase

تلميح فيديو للأسبوع: SoyBase CMap

SoyBaseOver the years I’ve started to follow a lot of farmers on twitter. It might sound odd to folks who are immersed in human genomics and disease. But I actually find the plant and animal genomics communities to be pushing tech faster and further to the hands of end-users than a lot of the clinical applications are at this point in time. And as #Plant16 rolls out to feed us, there was a lot of soybean chatter in my twittersphere.

So when SOYBAS tweeted a reminder about some of their videos, I thought the timing was great. لديهم قناة يوتيوب for some videos to help users access the SoyBase data. And one of the tools they illustrate is CMAP. Although we’ve touched on CMap a couple of times on the blog and in our training videos, we never featured it. It’s one of the GMOD family members that can offer you comparisions of different map coordinate data sets. But conceptually I think it’s a good idea for people to think about physical map vs sequence mapping data. And this video shows how you can examine these different representations at SoyBase.

Besides their software videos, رغم أن, SoyBase also links to a lot of other videos that help people to understand more about many aspects of soybean cultivation. Check out their wide range of topics on their دروس الفيديو الصفحة. You never see how to use a two row harvester at human genomics databases, do you?

ربط سريع:

SOYBAS: http://www.soybase.org/

قبعة غيض:

مرجع:

منح, د., نيلسون, ر., Cannon, س., & Shoemaker, R. (2009). SOYBAS, the USDA-ARS soybean genetics and genomics database أبحاث الأحماض النووية, 38 (قاعدة بيانات) دوى: 10.1093/nar/gkp798

Pathfinder_scap

تلميح فيديو للأسبوع: Pathfinder, for exploring paths through data sets

Pathfinder_scapI didn’t expect to do another tip on the paths through experiments or data this week. But there must be something in the water cooler lately, and all of these different tools converged on my part of the bioinformatics ecosphere. As I was perusing my tweetdeck columns, a new tool from the folks who do the Caleydo projects offered more paths through data: Pathfinder, Visual Analysis of Paths in Graphs.

For years I’ve been celebrating the great visualization options from the Caleydo tools. The first time we highlighted them was 2010. But I’ve been continuing to follow their work and kick the tires when they have new ones. My most recent favorite of theirs was مستاء–a better-than-Venn way to look at sets and subsets among your data.

This new tool offers another way to look across relationships in data sets. Finding paths through data is only getting harder with every new data set we get, but continues to become more important to pull in the characteristics of the alternate routes and yet still have the context of the overall picture. Scaling paths is hard. So the Calydo team aims at several key aspects of the problem with their new Pathfinder tool. The full details are in the paper (الواردة أدناه), but I’ll list the points for the features they deliver here:

1. Query for paths.
2. Visualize attributes.
3. Visualze group structures in paths.
4. Rank paths.
5. Visual topology context.
6. Compare paths.
7. Group paths.

In addition to clever visualization and query strategies, the team always offers an nice intro video to give you a sense of what the tool can do for you. So the new video on Pathfinder is our Video Tip of the Week.

The example used is the sets of authors on publications. But it’s easy to imagine signalling pathways, or some types of sequence variation pathways, or many other kinds of paths researchers need to represent. They have a use case example in the paper of KEGG مسارات. في الفيديو, there’s a quick look at a pathway that includes copy number variations and gene expression data as attributes that may be important for understanding the paths.

جربه. There’s a demo site available (ترتبط أدناه), and start to think about how you could use Pathfinder to analyze data that you are interested for your research directions.

Hat tip to Alexander Lex for the notice of the new tool:

وصلات سريعة:

Pathfinder demo: http://demo.caleydo.org/pathfinder/

Pathfinder overview site: http://www.caleydo.org/publications/2016_eurovis_pathfinder/

Source code: https://github.com/Caleydo/pathfinder/

مرجع:

كريستيان Partl, صموئيل Gratzl, مارك شترايت, Anne Mai Wassermann, هانز بيتر فيستر, ديتر Schmalstieg, & الكسندر ليكس (2016). Pathfinder: Visual Analysis of Paths in Graphs الكمبيوتر الرسومات المنتدى ((EuroVis ’16)) In press.

Branch

تلميح فيديو للأسبوع: Branch, a web-based tool offering decision trees for data analysis

أنا في الآونة الأخيرة highlighted a decision tree tool for experimental design. EDA, أو Experimental Design Assistant, helps you to plan your experiment, choose the approrpiate groups and numbers you’ll need. Set some variables, الخ. This week’s video also offers decision trees–but these help you to evaluate the data from your studies of interest instead. Branch is a web-based tool to help you test your hypotheses and develop models using data that’s available in a given data collection.

BranchThere’s a paper (ترتبط أدناه) with the backstory and information about how the tool works. But they’ve also done a nice series of videos to show you how to interact with the tools. The first one will be this week’s Video Tip of the Week. But be sure to check out the other ones for additional features as well. Each video tackles different aspects of the functionality that will help you to get the most from your explorations.

جربه. You can use existing examples, or include your own data. You can make your own data private, or make it available to share with others. Be sure to read their disclaimers and think carefully if you are using certain data sets that have privacy issues. But there are probably many publicly available data sets that could get you exploring some hypothesis around your topic of interest.

Hat tip to the author whose tweet sent me looking to investigate this:

ربط سريع:

Branch web site: http://biobranch.org/

مرجع:

Gangavarapu, ك., Babji, خامسا, Meißner, ت., لها, أ., & جيد, B. (2016). Branch: an interactive, web-based tool for testing hypotheses and developing predictive models المعلوماتية الحيوية دوى: 10.1093/bioinformatics/btw117

Lior_RatVenn_sm

تلميح فيديو للأسبوع: أداة OLGA RGD ل, كائن قائمة مولد ومحلل

Lior_RatVenn_smواحدة من القضايا المستمرة حقا في علم الجينوم هو كيفية إما أن تحصل على قائمة من الأشياء, أو التعامل مع قائمة من الأشياء. أو التداخل بين الأشياء. اعتقد ان هذا كان واحدا من المواضيع الأكثر شعبية تعاملنا مع في الأيام الأولى من OpenHelix, لكنه ما زال مسألة أن الناس بحاجة إلى معالجة بطرق مختلفة. وكانت بعض الحلول الأكثر إثارة للاهتمام مختلف الكائنات المخططات فين, والجرذ الجينوم واحد هو كلاسيكي, على غرار هنا ليئور باشتر. أنا على يقين من ضرورة لسرد وتنظيم ميزات الجينوم لن تذهب بعيدا. لذلك عندما رأيت أن RGD كان الناس أداة أخرى لتقديم طرق للقيام بذلك, أنا وضعت ذلك الحق في قائمتي من النصائح القادمة. ثم مشروع آخر حصلت مدفونة تحت قائمة من الأشياء الأخرى كان علي أن أفعل. ولكن أردت أن نعود إليها–حتى هنا هو على دليل خطوة بخطوة إلى أداة OLGA أنها توفر, لأن هذا الأسبوع فيديو نصيحة الأسبوع.

OLGA لتقف على: كائن قائمة مولد ومحلل أداة. ويصف الإعلان النشرة الخاصة بهم في مزيد من التفاصيل.

OLGA هي قائمة باني واضحة لالفئران, جينات الإنسان والفأر أو QTLs, أو سلالات الفئران, باستخدام أي (أو كل) مجموعة متنوعة من خيارات الاستعلام. والفيديو التعليمي الجديد المشي لكم من خلال عملية الاستعلام عن قاعدة بيانات باستخدام RGD OLGA, بما في ذلك

  • كيفية تنفيذ استعلام بسيط في OLGA
  • كيفية توسيع أو تصفية مجموعة النتائج باستخدام معايير إضافية
  • كيفية تغيير معلمات الاستعلام الخاص بك على الطاير لصقل مجموعة النتائج الخاصة بك
  • ما هي الخيارات يعطي OLGA لتحليل قائمتك مرة واحدة لديك.

يمكنك الحصول على قائمة من العناصر باستخدام تجميعات مختلفة–ربما كنت ترغب في نوع معين من مستقبلات, مثلا, يمكنك الحصول على قائمة من لهم. أو يمكنك بسرعة إنشاء قائمة من الجينات في فترة معينة الجيني. يمكنك الحصول على هذه البنود التي تقع في QTL. أو يمكنك البدء بقائمة والحصول على الشروح. يمكنك أيضا البحث عن التداخل بين مجموعات.

الفيديو هو لطيف المشي من خلال كيفية بناء استعلام وما يمكنك الوصول. واحدة سمة رئيسية هي أنه ليست مجرد بيانات الفئران كما قد تتوقع في RGD. الماوس والبيانات الإنسان وتتوفر أيضا.

يمكنك إنشاء استعلامات معقدة وذكية, وصلة لجميع أنواع البيانات ذات الصلة في خطوات سهلة جدا. إلقاء نظرة على مواردها, وعلى أشرطة الفيديو وغيرها لمزيد من المساعدة في جوانب مختلفة من مجموعاتها.

وصلات سريعة:

الموقع الرئيسي RGD: http://rgd.mcw.edu/

OLGA مباشرة: http://rgd.mcw.edu/rgdweb/generator/list.html

مرجع:

شيموياما, م., بونس, ج., هايمان, غ., Laulederkind, س., ليو, دبليو., نيجام, ر., بيتري, خامسا, سميث, ج., هنا, م., وانغ, س., Worthey, E., Dwinell, م., & يعقوب, H. (2014). قاعدة بيانات الجرذ الجينوم 2015: الجينومية, المظهرية والاختلافات البيئية والمرض أبحاث الأحماض النووية, 43 (D1) دوى: 10.1093/نار / gku1026

EDA_video

تلميح فيديو للأسبوع: EDA, Experimental Design Assistant

معظم أدوات المعلوماتية الحيوية ندرس هي الأشياء التي تأتي في اللعب المصب من تجربة. الناس يرغبون في تحليل بياناتها, ننظر إلى الجينات التي برزت (أو اسقط), تصور العلاقات, الخ. لذلك أداة فيديو نصيحة هذا الأسبوع غير عادية–انها البرمجيات التي تساعد الناس على تصميم قطع المنبع من تجاربهم.

Experimental Design Assistant يستهدف تصميم السليم للدراسات البحوث الحيوانية. استخدام الحيوانات بعناية ومسؤولية يشمل تجارب مصممة جيدا, لأن التجارب يضيع بسبب سوء التصميم شيء الباحثون أن تريد أن تتجنب. انها حيوان سيئة ممارسة الرعاية الاجتماعية, وكما انها مكلفة. و وصف جمعية الإمارات للغوص الناس هذا لطيف جدا على قطعة خلفية مرتبطة على موقعهم.

بسبب الطريقة التي لديها إعدادات فيميو بهم, لا أستطيع تضمين الفيديو الخاصة بهم هنا. سيكون لديك لانقر لمشاهدته على موقعهم: https://eda.nc3rs.org.uk/guide-tutorials

EDA_video

و 13 فيديو دقيقة لمحة جميلة عن كيفية سير العمل سوف توجه لكم. وأوصوا بأن عليك أن تبدأ مع بعض القوالب الخاصة التي قد تكون مشابهة لأهداف البحث الخاصة بك, وتحرير ذلك. فهي توضح لك كيف تبدأ مع قماش بيضاء أو قالب في الفيديو. وهي توضح كيف يمكنك إعداد مجموعات مختلفة من الحيوانات, دلالة على نوع من التدخل أو العلاج الصيدلاني–في حال تبين انها دورات مختلفة ضوء. يمكنك إنشاء جرعات أو غيرها من المتغيرات التي تتناسب. ثم يمكنك الانتقال إلى “قياس” العقدة. أن تثبت أنه ليس هناك سوى اتصالات الحق في الرسوم البيانية يمكن إجراء, أو يمكنك الحصول على تحذيرات. ثم عقدة نتائج يمكن أن تضاف. هناك طريقة لإضافة العديد من المتغيرات والتفاصيل التجريبية الأخرى التي تحتاج إلى أخذها في الاعتبار.

وتشمل الدروس أقصر غيرها من القطع الأخرى–مثل نقد تجربتك, حساب القدرة وتسلسل العشوائي, تصدير / استيراد وتقاسم الرسوم البيانية إنشاء.

هذا هو نوع مختلف ولكن من المفيد حقا البيولوجيا أداة برمجية. أعتقد أنه يمكن أن يكون كبيرا في حالات التدريس وكذلك. يجب عليك التحقق من ذلك.

وصلات سريعة:

Experimental Design Assistant: http://eda.nc3rs.org.uk/

صفحة الفيديو: https://eda.nc3rs.org.uk/guide-tutorials

المراجع:

Cressey, D. (2016). وتهدف شبكة الإنترنت أداة للحد من العيوب في الدراسات الحيوانية طبيعة, 531 (7592), 128-128 دوى: 10.1038/531128a

UCSC Genome Browser new feature

تلميح فيديو للأسبوع: Multi-region visualization in the UCSC Genome Browser

This week’s video tip demonstrates a new feature at the UCSC متصفح الجينوم. I think it’s kind of unusual, and conceptually took me a little while to get used to when I started testing it. So I wanted to go over the basics for you, and give you a couple of tips on things that I had to grok as I got used to this new visualization option.

و headline for the news item describes it as: “Combine Multiple Regions of the Genome Browser into a Single Visualization!” و

Have you ever wished you could remove all of the intronic or intergenic regions from the Genome Browser display? Have you ever dreamed of being able to visualize multiple far-flung regions of a genome? جيد, now you can with the new “multi-region” option in the Genome Browser!

I should probably start with the first thing that confused me–the name “multi-region”. I thought that I was going to be able to see maybe part of a region on chromosome 1, and something on chromosome 8, maybe at the same time. But that’s not how this works. في هذه الحالة, you look at multiple regions along the same chromosome, with some of the intervening sequences snipped out. This creates a sort of “virtual chromosome” for you to interact with.

في الفيديو هذا الأسبوع, I’ll show you how that looks using the BRCA1 gene. First I show how you can look at all the exons together–with introns clipped out. And then I show how you can see the genes in the neighborhood displayed together, with the non-coding regions clipped out. وهذه هي 2 of the separate options for viewing.

يمكنني استخدام “رأي” menu option to illustrate this feature. But there is another way to access it–you can use the “multi-region” button in the browser buttons area.

multiregion_button

To keep the video short, I didn’t go into every detail on this tool. You should check out the news announcement for it, and the link to the additional details in the User Guide documentation لمزيد من. The new feature is also mentioned briefly in the lastest NAR paper on the UCSC Genome Browser (ترتبط أدناه). And you should try it out, بالطبع! That’s the best way to really understand how it might help you to visualize regions of the genome that you might be interested in.

Also as in the news, thanks to the development team. I am always looking for new visualizations, and this fun to test!

Thank you to Galt Barber, ماثيو Speir, and the entire UCSC Genome Browser quality assurance team for all of their efforts in creating these exciting new display modes.

Follow UCSC on Twitter:

وصلات سريعة:

UCSC متصفح الجينوم: genome.ucsc.edu

News item on multi-region: http://genome.ucsc.edu/goldenPath/newsarch.html#030816

Training materials on the UCSC Genome Browser: http://openhelix.com/ucsc

مرجع:

مهماز, م., فرع, أ., Rosenbloom, ك., راني, ب., مقدمي, ب., Nejad, P., لي, ب., المستفادة, ك., Karolchik, د., Hinrichs, أ., Heitner, س., الثابت, ر., Haeussler, م., Guruvadoo, L., فوجيتا, P., Eisenhart, C., Diekhans, م., كلوسون, ه., كاسبر, ج., حلاق, غ., هاوسلر, د., كوهن, ر., & كينت, في. (2016). مستعرض قاعدة بيانات الجينوم UCSC: 2016 التحديث أبحاث الأحماض النووية, 44 (D1) دوى: 10.1093/nar/gkv1275

إفشاء: UCSC Genome Browser tutorials are freely available because UCSC مقدمي us to do training and outreach on the UCSC Genome Browser.

"Frictionless connection of bioinformatics tools"

تلميح فيديو للأسبوع: GenomeSpace التوجيه

"Frictionless connection of bioinformatics tools"

“اتصال الاحتكاك من أدوات المعلوماتية الحيوية”

وكان الموقع GenomeSpace أبرز من قبل في موقعنا “نصائح لهذا الأسبوع”. نحن نقدر هذا الموقع الذي صفوفه الكثير من أنواع مفيدة مختلفة من مصادر البيانات واستراتيجيات التحليل. على موقعهم يصفون روح على النحو “اتصال الاحتكاك من أدوات المعلوماتية الحيوية”. منذ ذلك الوقت (2012), انها استمرت في النمو وتوفير ميزات جديدة. لذلك أنا مسرور لرؤية أن هناك فيديو التوجه الجديد الذي عرضوا, وهذا هو هذا الأسبوع فيديو نصيحة الأسبوع.

حاليا هناك 20 أدوات connnected في GenomeSpace, أكثر من ذلك بكثير مما كانت عليه عندما بدا علينا أولا. وتشمل هذه التعدين, تصور, وأدوات العمل. يركز هذا الفيديو مقدمة على اثنين منهم, جين نمط لإثبات سير العمل, و Cytoscape التصور. ولكن يمكنك أن ترى كيف أن الآخرين سوف يساعد دعم العديد من أنواع علم الجينوم تحليلات.

هذه المحادثات نظرة عامة حول لهم “وصفات” مفهوم, مع بروتوكولات تحليل خطوة بخطوة, والتي يمكن العثور عليها هنا: المتشعب://recipes.genomespace.org . وهناك عرض للموارد وصفة. هناك بعض “رسمي” وصفات من فريقهم, لكنها بالتأكيد تريد أن يكون الناس تساهم بنفسها فضلا. نحو نهاية الفيديو يصفون كيف نفعل ذلك (~ 28min).

تلك المستخدمة لتوضيح ملامح وصفات يتضمن الوصف السردي, ولكن أيضا الخطوات المحددة التي من شأنها أن تستخدم. وهذا له GenePattern وCytoscape الخطوات الأمثلة التي يستخدمونها في التجريبي.

حوالي نصف الطريق من خلال, التجريبي التحليل يبدأ (~ 14min). انها مفيدة المشي من خلال كيفية استخدام وصفات فعالة لإعادة إنتاج تحليل. سارا Garamszegi, دليلنا هنا, اكتمال قطعة من العمل الذي يتعين القيام به مع GenePattern, وتبين بعد ذلك كيفية سحب الملف الذي تولد من GenomeSpace لCytoscape لاستخدام على سطح المكتب.

هناك أيضا فيديو منفصل من قسم السؤال / الجواب, حتى إذا كان لديك بعض القضايا العالقة قد تحقق مما إذا كانت غطيت, أو يمكن أن تسمع حول كيفية الآخرين قد تفكر في استخدام الأدوات. وكثيرا ما تعلم قدر من الأسئلة اعتبارا من القطع العرض الرسمي. لقد كتب القضايا في القسم على معلومات الفيديو وكذلك لذلك هل يمكن أن مجرد بسرعة مسح عليها.

متابعتها على تويتر لأكثر من هذا القبيل, ويمكنك أيضا متابعة قناته على YouTube:

ربط سريع:

GenomeSpace: http://www.genomespace.org/

المراجع:

أن, ك., Garamszegi, س., وو, ف., Þorvaldsdóttir, ه., Liefeld, ت., أوكانا, م., بورخيس-ريفيرا, د., Pochet, ن., روبنسون, ج., Demchak, ب., بدن, ت., بن ارتسي, غ., Blankenberg, د., حلاق, غ., لي, ب., كوهن, ر., Nekrutenko, أ., سيغال, E., يدعك, ت., الرايخ, م., ريجيف, أ., تشانغ, ه., & Mesirov, J. (2016). التحليل الجيني التكاملي من قبل التشغيل المتداخل من أدوات المعلوماتية الحيوية في GenomeSpace طبيعة أساليب, 13 (3), 245-247 دوى: 10.1038/nmeth.3732

intro_curation

تلميح فيديو للأسبوع: Introduction to Biocuration and the career path

ISB_biocuration

The ISB is a professional organization for biocurators

في OpenHelix, we’ve long sung the praises of curators. Some of us have been curators and worked with curation and database development teams. All of us have relied on quality information in the databases for research and teaching. But I think there are a lot of people who don’t understand the value of quality curation, how it’s done, and who curators are. They are widely taken for granted.

A recent talk by Claire O’Donovan of EBI-EMBL helps to explain the roles and the importance of biocurators. So although this talk isn’t a typical software talk, I think understanding this is crucial to everyone’s appreciation of how information you rely on gets into the databases you use. And if you find yourself in situations where you are guiding students, knowing about this career is also worthwhile.

Claire O’Donovan has had a front row seat to the development of this field, and has great enthusiasm for the future. And going forward, in your doctor’s office as precision medicine and treatments become a thing–how much do you want correct information in the databases? Mining data, standardizing language for descriptions of features, and sharing this information is crucial for all of us.

Here’s what’s covered in this video, from the agenda slide:

  • Introduction to the concept of biocuration.
  • The different kinds of biocurators, and the skill set needed.
  • Our community: Biocuration Society and conference.
  • The future of biocuration and career paths.

Specific examples of what curators do are illustrated (~6:30لي). A sample UniProt entry illustrates what kind of information is captured and where it appears. She also touches on their work with أنتولوجيا الجينات. And a bit about the ecosystem of curation, how teams at different resources help each other but don’t wish to duplicate work, به HGNC nomenclature as an example.

About 8min, the skill sets for biocuration are covered: data basics, curation skills, programming and database concepts, الانتولوجيا, and usability of the data collected. This also includes data access and management, as well as dissemination and outreach. This includes user training (ياي!) and the concepts of data analysis for users.

There’s no formal degree path for curation practitioners at this point, and different groups will have different needs. But the community is begining to think about this, and about professional qualifications. She also mentioned a recent report from the National Academy of Sciences press on the topic of the future workforce skills and needs (ترتبط أدناه). This is an alternative career route for people with science training, and it’s important to understand not only the science but computational pieces. And it should be taken seriously as a discipline. There is now a journal that reflects this (also linked below).

Claire also takes a look at the future of biocuration, باستخدام Center for Target Validation (CTTV) كمثال. And she talks about the importance of quality information in medical records as we increasingly have genomic details in diagnosis and treatment situations. If we want precision medicine to work, we have to have the precise and correct information in the databases. So respect and value the curators. They are worth it. And if you know anyone that deserves special recognition–nominate!

وصلات سريعة:

الجمعية الدولية للBiocuration: http://biocuration.org/

Preparing the Workforce for Digital Curation: المتشعب://www.nap.edu/catalog/18590/preparing-the-workforce-for-digital-curation

المراجع:

COMMITTEE ON FUTURE CAREER OPPORTUNITIES AND EDUCATIONAL REQUIREMENTS FOR, & DIGITAL CURATION (2015). PREPARING THE WORKFORCE FOR DIGITAL CURATION National Academies Press : 10.17226/18590

Holliday, غ., Bairoch, أ., Bagos, P., Chatonnet, أ., Craik, د., الفنلندي, ر., Henrissat, ب., الفلاح, د., مانينغ, غ., Nagano, ن., أودونوفان, C., بروت, ك., Rawlings, ن., Saier, م., Sowdhamini, ر., Spedding, م., سرينيفاسان, ن., Vriend, غ., بطن شئ ما, P., & BP.eman, A. (2015). Key challenges for the creation and maintenance of specialist protein resources البروتينات: هيكل, Function, and Bioinformatics, 83 (6), 1005-1013 دوى: 10.1002/prot.24803

Gaudet, P., مونوز توريس, م., Robinson-Rechavi, م., أتوود, ت., BP.eman, أ., الكرز ، J. ، فئة ج تمتد = "tr_" معرف = "tr_5 ت. البيانات رمزية =" Q2hpc2hvbG0 "مصدر البيانات =" "> تشيشولم , ج., Kania, ر., أودونوفان, C., & ياماساكي, C. (2013). DATABASE, مجلة قواعد البيانات البيولوجية وCuration, is now the official journal of the International Society for Biocuration قاعدة بيانات, 2013 دوى: 10.1093/database/bat077