标记档案: GWAS的

ZBrowse sample image

一周的视频提示: ZBrowse for GWAS viewing and exploration

Maybe you’ve heard of the others. ABrowse. BBrowse. CBrowse. [you get the idea] GBrowse has been widely adopted. JBrowse is picking up steam. Into the orderly arrangement we now throw ZBrowse: a new way to look at genome-wide association study data.

Sharing and chatter about ZBrowse for viewing GWAS was abundant when the paper was published recently.

I could see the appeal immediately. One of the first things I check when exploring new software is the species range. 见, I’m agnostic on species, and especially like to find tools that support a wide range of species. ZBrowse does this. Right in their paper they provide a chart comparing their features to other tools, and that tidbit jumped right out at me.

Although we usually like to highlight web-based tools, this one was really different and worth covering even though it requires you to do a bit more lifting on installing it. But they help with that, in their videos and instructions. And ultimately it runs in your browser, once you’ve got the right pieces in place. I was able to set it up and run it (after updating my R and RStudio).

I’m going to skip the installation and data loading videos for now, but you should go over and see them when you are ready to try it out. I’ll just give you a look at the features they show in their introductory video for the browser part. That will give you the best idea of why it’s worth trying it out.

It does require you to have ř 安装, 和 RStudio. We’ve talked about both of those before, but if they are new to you, check’em out in these other Video Tips of the Week: R统计软件简介, RStudio as an Interface for using R.

It comes loaded with some plant data, but you can use other data you have. It was very easy to look at the Manhattan plot view, and then focus on smaller chosen regions. I really liked how easy it was to see what’s in the neighborhood of a selected item when you turned to the annotation tab. ZBrowse sample image

It might also be worth trying this out as a software delivery strategy–I was just reading about other folks who are offering tools that sit on top of R and RStudio this way (come back tomorrow for another example). People who want to offer you the chance to look over large data sets they are providing are considering this.

快速链接:

ZBrowse at Baxter Laboratory: http://www.baxterlab.org/#!/cqi0

ř: http://www.r-project.org/

RStudio: http://www.rstudio.com/

参考文献:

准备, é. (2012) 在研发入门.

拉辛J.S. (2011). RStudio: 独立于平台的IDE的R和Sweave, 杂志应用计量经济学, 27 (1) 167-172. 分类号: http://dx.doi.org/10.1002/jae.1278

Ziegler, Greg R., Ryan H. Hartsock, and Ivan Baxter. “Zbrowse: an interactive GWAS results browser.” PeerJ Computer Science 1 (2015): e3. 分类号: 10.7717/peerj-cs.3

dna_cutting_with_scissors_hr-150x150

星期五SNPpets

This week’s SNPpets include finding hidden treasures in a “大的数据” repository, genomic epidemiology and malaria, cannabis strain phylogeny, hackathons and lessons learned, ClinGen for clinical genomics, 多….


欢迎来到我们的链接集合星期五功能: SNPpets. 一周之内,我们遇到了很多链接和读取,我们认为很有趣, 但不要到一个博客帖子. 在这里,他们是您的享受…


提示的周: 人类单核苷酸多态性,共表达协会, SNPxGE2


今天的尖端是从一个单一的有趣的论文的数据为基础的新的数据库, SNPxGE2. 随着大规模的关联研究从人类基因组单体型图数据 (269 个人, 4 人口, 超过50万个SNPs和15K基因表达谱), 的 研究 报道:

计算预测的人类SNP的共表达协会, 这是, 差之间的合作,表达 2 基因是与一个SNP的基因型.

这个数据被组织在一个易于搜索的数据库称为SNPxGE2. 由于纸张才出来 2 个月前, 这是一个有前途的数据库. 这是有趣和有用的, 但我可以看到随着时间的推移添加更多的数据.

相关链接:

SNPxGE2
HapMap项目
周提示上SNPexp (单核苷酸多态性和表达之间的相关性)
错误发现率文章

王, 华, 约瑟夫, 学, 刘, 十, 凯利, 米, & rekaya, ř. (2011). SNPxGE2: 人类SNP的共表达协会的数据库 生物信息学, 28 (3), 403-410 分类号: 10.1093/bioinformatics/btr663

你是邪恶的智能?

或, 因为它的发音在我的房子: 啊,你 wikked smaht? 有一个由招聘工作 BGI (北京基因组研究所–不仅限于北京,再) 获得邪恶的聪明人的收集和分析它们的DNA. 他们正在寻找智力基因.

我看了看自动标准, 我没有资格. 至少通过这一措施. 但是,也许你们有些人. 论 它说,该研究的第一页:

目前,我们正在招聘学科:

  1. 一个全基因组关联研究的情报. 如果你是认知天赋, 我们鼓励您 参与!

参与页:

如何限定

我们目前正在寻求具有高认知能力的参与者. 如果您已获得一个高的SAT / ACT / GRE成绩,你可以有资格的研究, 或表现良好,如数学学科竞赛, 物理, 或信息学奥林匹克, 威廉洛厄尔普特南数学竞赛, TopCoder公司, 等. 您也可以通过特殊的学历资格, 您将有机会在调查中指定.

自动合资格准则包括::

  • 一个SAT分数至少760V/800M后recentering或700V/780M前recentering; ACT分数的 35-36; 或GRE成绩至少700V/800M.
  • 一个物理学博士,从美国顶尖节目, 数学, EE, 或理论计算机科学.
  • 荣誉奖或更好的普特南竞争.

乌姆…甚至从来没有听说过的普特南. 我觉得我出….

无论如何–如果你想提前研究,你有资格, 你可能要检查出来. 请务必阅读和理解 隐私政策同意书 (PDF格式).

他们还打算做另一个面临失明 (面容失认症). 我知道有些人, 我认为它可能是有趣的,看看他们是否能找到该基因. 现在他们正在指挥人 faceblind.org 签约信息.

帽尖@ BGI_Events:

逆转录 @ BGI_Events: 现在在谷歌#@ hsu_steve推出我们聘请美国#认知#基因组项目HTTP参与者的驱动器://www.cog-genomics.org/

交叉张贴 在基因组是我们.

答案是什么? 打开主题 (GWAS的基因分型)

映泰 网站是一个要求, 生物信息学的问题,回答和讨论. 我们的社区成员和发现它非常有用. 通常 映泰出现的问题和答案,我们的读者都有密切关系 (基因组学的最终用户资源). 每星期四,我们将其中的一个突出问题和答案在这里在这个线程. 您可以询问一下该线程问题, 或者你可以随时参加在映泰.

本周问题:

有多少基因组的一个GWAS的俘虏?

这个问题的两个伟大的答案, 从第一个报价. 点击上面的链接.

人类基因组编码 1 SNP/100-300bp; 〜3GB的顺序〜1000万个SNPs. 分析这样一个大量的数据,由于一些限制因素,这是不可能的. 为了解决这个问题,我们可以使用连锁不平衡 (劳工处) 映射 (D“上的一节, 重组率), 单体型, 单倍型块单倍型标签SNP (tagSNPs). (阅读关于HapMap计划 这里). 相反,所有的10M单核苷酸多态性基因分型,我们可以基因型在一个单体型块tagSNPs. 这是一个代表在一个特定区域的基因组单核苷酸多态性与高劳工处. 这将使无需所有的10M单核苷酸多态性基因分型的遗传变异. 以前的研究表明,与0.5的M - 1M单核苷酸多态性基因分型芯片将是一个很好的GWAS的足够.

提示的周: 优先顺序的基因

今天,许多类型的实验返回基因的大名单, 关联研究, 表达阵列, 连锁分析和多. 研究者需要,以确定这些基因最感兴趣和有希望的,所以在分析的下一步是优先列表中,找到这样做的方法.

有很多的方法和工具的优先列表中的基因,并得到处理,对其中的工具来使用,可以是一项艰巨的任务位. 该 基因优先级门户网站 是一个很好的资源,找到合适的工具. 这是一个有点不仅仅是一个数据库的数据库或工具. 这是一个有关工具的详细信息,定期更新的列表 (有 25 此刻), 统计有关的工具的数据源是什么, 输出和引用. 还有一个很好的搜索工具来寻找最适合您需要的工具,.

今天的小费将介绍网站,并进行快速搜索. 未来的提示可能突出其中的一些工具.

更新: 由于技术上的困难,无论是在录制或上传/处理音频是没有工作. 我试图解决这个问题. 在此期间, 你可以得到一个基本概述观看, 但我会得到一个新的版本,只要我能解决这个问题.

“答案是什么” 主题

映泰 网站是一个要求, 生物信息学的问题,回答和讨论. 我们的社区成员和发现它非常有用. 经常出现的问题和答案在映泰是我们的读者有密切关系 (基因组学的最终用户资源). 每星期四*我们将突出这主题一这些问题和答案在这里. 您可以询问一下该线程问题, 或者你可以随时参加在映泰.

映泰问题的周:

之间有什么GWAS的全基因组连锁分析和差异?
我不明白的GWA之间的差异 (全基因组关联研究) 一个GWLS (全基因组连锁研究). 我是一个计算机科学家有刷生物学!

突出显示的答案:
在接受, 以及详细的回答是从大卫奎格利. 当然, 如果你深入到GWAS的和类似的研究答案是显而易见的的 :ð, 但对于那些谁是新的领域的或有趣…

…当你有相关individals和表型的家系进行连锁​​研究 (如乳腺癌) 目前在一些,但并非所有的家庭成员. 这些人可能对人类或动物; 使用现有的家庭,在人类的联动研究, 所以没有滋生参与. 对于每一个位点, 您制表情况下,家长和孩子谁或不显示的表型也有相同的等位基因. 连锁研究是最强大的方法,学习时高度渗透的表型, 这意味着,如果你有你的等位基因有强烈的参展表型的概率. 他们可以identiy小的数字家庭中的罕见等位基因, 通常是由于创始人突变. 联动是如何发现的BRCA1与乳腺癌相关的,如基因突变的等位基因.

协会的研究是用来当你没有血统; 这里的统计检验是趋势Logistic回归或相关测试. 他们的工作时,表型低外显率; 它们实际上是在这些情况下,比连锁分析更为强大, 只要你有足够信息的情况下和相匹配的对照. 协会的研究,你如何找到共同的, 如在FGFR2的变化,赋予小增加乳腺癌易感低外显率等位基因…

去这里其余的答案

提示的周: 挑战, miRNA的目标网站的数据库

小分子RNA 已成为研究的丰富来源,因为他们可能有一个对基因表达和疾病有着巨大的影响. 人类基因组可能编码了 1,000 这一目标的miRNA的基因的一半以上. 他们可能会牵连到很多常见疾病 (这还没有被挑出来GWAS研究?). 他们是生物,只有它迷人的面积来对在过去十年. 因此, 数的数据库目录的miRNA大. 今天的提示是一项新的, 挑战, 这是 在即将到来的全国房地产经纪人协会报告数据库问题. 生态位RepTar试图去填补,以获得在算法中,包括新的研究更加全面的miRNA的预测. 这一新的研究表明,有更多的可能比以前想象的目标网站. 文章中提到,

最近, miRNA的结合进一步扩大股权的'中心网站的识别, 功能性miRNA的目标网站,既缺少完善的种子配对和3'补偿性的配对,而是表现出与沿11-12连续对目标配对在miRNA的中心 (4). 虽然有些放松了进化算法保护标准 (5-11) 和/或提供3'补偿性的网站还预测 [克. (6,12,13)], 一些数据库提供了整个剧目的miRNA的预测目标模式. 此外迄今, 没有数据库列出了全基因组细胞的病毒miRNA的预测指标. 这些微RNA进化缺乏显着的保护和他们的目标不一定是进化上保守的预计. 此外, 少数病毒miRNA的目标已经确定的常规种子显示约束力和3'补偿性的约束力 [克. (3,14)].

在这里,我们提出一个全基因组的小鼠和人类基因的miRNA靶标预测数据库, 根据我们的新目标预测算法的预测, 挑战

当我离开的预测价值高达miRNA的研究, 但我以为我的网站介绍.

虽然我在这, 请允许我列举一些其他的实验室和研究机构就中国偏远的miRNA网站, 意大利, 以色列, 加拿大和美国. 也许有一天我会做一个比较.

CircuitsDB, 珍妮做了哪些 一周的大尖教程.

miRBase, 我们有一个 全长教程.
microRNA.org
HMDD
miRDB
tarBase
miRecords:
PicTar, 他们有一个注释跟踪 UCSC基因组浏览器
miRNA2Disease
PuTmiR (有关转录因子)
microRNAdb:

两个列表来捕捉一些人: http://mirnablog.com/microrna-target-prediction-tools/http://www.ncrna.org/KnowledgeBase/link-database/mirna_target_database

Elefant, 全, 伯杰, 答:, 幸, 阁下, Hofree, 米, 马伽利特, 阁下, & Altuvia, Ÿ. (2010). 挑战: 预测的数据库和病毒的宿主细胞miRNA的目标 核酸研究 分类号: 10.1093/nar/gkq1233

DNA的否认

世界卫生大会?

迈克尔Pollan:

世界卫生大会?

迈克尔Pollan和他的羊群成为所有加气的一天 迈克尔啾啾 这珍闻. 它链接到一个故事具有相当的标题:

伟大的DNA数据赤字: 幻影为疾病的基因?

Srsly. 这是它说什么.

我认为这是什么? 第二种情况下,我观​​察基因denialism. (首先是一组 争议自闭症的基因.)

我知道后基因组来到沿会有宇. 我知道,蛇油推销员将投球采购,将工作与你的皮肤基因. 我知道会有抗衰老化合物的工作与你的基因. 我知道已经有一个DNA的饮食, 和维生素卖给你基于你的DNA. 我见过的DNA约会. 但说实话, 我没想到的DNA否认.

也许我应该看到它的到来. 我已经遵循了几个不同的主题流与反科学的宇: 反vaxxers和反GMOsters. 有这些群体之间的重叠, 但它的不完整. 但他们的论点风格之间有显着的巧合. 两组大索赔, 大多Русский|한국어|日本语|简体中文|繁体中文|العربيةBookmark and Share–如果来源是樱桃采摘点,或完全被滥用. 而科学是不会, 他们否认科学, 然后,他们移动的目标职位.

本文–据称吹走基因与疾病之间的连接–令人吃惊误. 让我清楚: 基因可以影响疾病的风险. 期. 当然环境可能会影响生物. 饮食和运动可以影响健康, 当然. 接触到的自然或人为的致癌物质可引发癌症. 甚至最难的核心基因的乔克斯知道这. 但这个愿望断绝基因与糖尿病之间的连接–或前列腺癌, 或克罗恩病–因为他们还没有找到一个单冒烟的枪基因, 使用一种研究? 这只是怪异和扭曲. 有复杂的疾病,导致无数的例子是相当强的, 洞察疾病的途径和机制, 和我们真正刚刚开始. 和新技术,开辟新的路径,以及. 在此的一个不错的文章是在“自然”今年秋天: 基因组学: 协会搜索.

肯定, 我们希望更多的数据,从GWAS的和更强的信号 (全基因组关联研究). 但事实证明,人类是根深蒂固outbreeders,很难梳理出他们强烈的指针.

可能如果你是一个经常阅读本博客,我不需要说服你. 但对于谁比谁偶然跨越这让我提供一些资源:

我不能完全图就是为什么该职位的企图抹黑所有的工作,到目前为止已经取得的所有发现的作者–和那些我们去挖掘. 作为一个相对较新的战略, 以及我们完善的工具, 人口研究组, 并建立新知识, 我们要找到更多的. 已完成–检查出的概述GWAS的目录. 向下滚动. 并一直滚动. 因为它说,该网页上: “截至 12/09/10, 本表包括 725 出版物和 3606 单核苷酸多态性.

而且我也无法弄清楚,为什么Pollan的爪牙庆祝这一. 下面是这个样本的答复:



如果这是真的 (它肯定是不), 为什么会变成这样的理由,以轻笑? 为什么庆祝? 老实说,我不明白这一点. 实际的情感应该是尴尬轻信.

但确定, 你是不是与人类GWAS的数据降权–让我们来看看其他GWAS的,看看有什么,. 犬已经有一些真正令人惊叹的的例子,这些研究. 有一个谈了几年,我们看到: 复杂性状的基因在家犬. 你可以看,网上了解更多. 与狗工作的一个好处是,他们是高度近交系. 我在读研究生的教授一次snarked,我们不能这样做,与人类–虽然这是常春藤联盟的目的的一部分, 他声称–几个百多年的集约化养殖和良好的系谱记录,使狩猎犬基因组基因比较容易,比在杂乱的人群. 这里的另一个最近的一篇文章 在“自然”的狗特征. 如果您认为基因不会导致复杂的疾病, 你有纠纷,一些品种的狗容易出现焦虑,由于他们的基因. 而一些容易出现耳聋–显然它的达尔马提亚生活方式, 正确的? 或者说dobermans是使自己的嗜睡症莫名其妙. [重视 - 他们是发作性睡眠病? 谁知道....]

显然,作者有一个议程. 最终,他们使他们的情况:

不过, 大多数国家的政府合作更为, 例如, 他们比那些希望吃健康的饮食食品工业. 铺设遗传决定的其他疾病, 然而, 提供了一个机会,这个愤世嫉俗的政治演算转移. 它提出的事实,他们每一个机会,决策者面临前所未有的利害关系, 通过促进食品标签, 垃圾食品征税, 或资金不带偏见的研究, 以帮助他们的选民做出了巨大的积极的生活方式的选择.

作者莱瑟姆 更进一步在HuffPo (mucho许多条纹宇) 我的特别强调:

- 这意味着 环境必须是整个健康状况不佳的原因, 我. 垃圾食品, 污染, 缺乏运动, 等. 我们之所以写了一个关于人类遗传学的文章 (当我们的食物和agricultur - E网站) 是我们相信,如果人们生活的权利, 农业,因此,地球将或多或少地自我修复.

我不在乎如果你想抹黑食品行业,如果你恨大银,并希望自己的博客上说. 但是,滥用和诋毁科学和科学家的努力,什么都没有做,这是一个愚蠢的和有缺陷的战略. 而迈克尔Pollan: 以否认搭上你们的议程前,请使用更好的判断.

这一块牛肚各种sciency性的东西之一,麦克疯生物学家曾经有欢呼 瞎扯淡- T的非对称优势. 它具有多层次的废话. 并没有就可以了评论功能, 所以你可以不讨论它在其网站. 我将寻找其他的反应,这个项目,并收集他们在这里,如果我觉得他们, 或增加他们的意见,如果你有他们. 无论如何, 我敢肯定有人会在该职位的其他部分#失败–有很多机会. 我想解决的否定方面. 我同意 迪安娜–哇–我很想看到解压缩后的基因组的一个很好的Fisking–它可能是未来.

这种自上而下的鸣叫到目前为止去 @ emmecola:

但是,科学家们, 我呼吁你: 不要让DNA的否认得到一个关于这个主题的立足点. 我们已经看到了与抗- vaxxers发生了什么. 该组一样, 如果人们开始解雇结肠癌和后续放映真正的风险,这可能会影响公众健康, 或放弃治疗,因为有人告诉他们,为他们的精神失常,他们可以解决一个有机的胡萝卜. 有这个真正的后果.

参考文献:
面包师傅, M. (2010). 基因组学: 协会搜索 自然, 467 (7319), 1135-1138 分类号: 10.1038/4671135一

Cyranoski, ð. (2010). 遗传学: 宠物项目 自然, 466 (7310), 1036-1038 分类号: 10.1038/4661036一

UPDATE语句:
1. 这里有一个从解压缩后的基因组采取: 估算遗传使用双城

2. 下面是一个走在HuffPo–废话科学的源泉,: 有一个基因组中的精灵? 我尴尬地链接到, 但他认为此位是滑稽: “表明,基因组学是其中的一部分打了水漂, 建立军工业的阴谋。” Snorf.

3. 哦, 我的–看看什么Twitter的仙女只是我的办公桌上下降. 糖尿病的证据为基础的审查: 基因组学, 类型 2 糖尿病, 和Obesity和一定要看看,特别是在表 1.

4. 从迈克的另一个讨论在ScienceBlogs: GWAS的FIGHT! (嘶! 搞乱!): 似曾相识从头再来 丹尼尔·麦克阿瑟的意见,并检查了那边#FTW. (提示要帽子 GenomeWeb).

5. 哦, FFS: 马里昂雀巢 捕获愚蠢 太. 和马里昂–这不是一个 “研究”. 这是一个论战. 你应该知道比这更好的. 你有一个适当的程度. Pollan我可以八九不离十削减有些松懈–他有英语 艺术 学位. 6. 但以理带来碎纸机. 这是伟大的: 现代基因组学的生物科学资源项目的批判: 错过的机会

7. ROFL: 基思snarks这个称号: 大健康数据赤字: 环境疾病的幻影原因? 这是一个有趣的开始我的一天.

8. 我的GenomiX总结与conflama 生物的复杂性是事实. 这些 谷歌 告诉我这说 “众生的复杂性,是一个事实”. 是的. (顺便, 译者越来越好得多–我觉得. 我看起来很棒。)

9. 玛丽卡迈克尔 #FTW–她没有一个多媒体的SD节目 “环境决定论” 与 伟大的作文影随行.

10. 麦克疯生物学家重量与: 在遗传Denialism

星期五SNPpets

欢迎来到我们的链接集合星期五功能: SNPpets. 一周之内,我们遇到了很多链接和读取,我们认为很有趣, 但不要到一个博客帖子. 在这里,他们是您的享受…

  • 鲁棒 “已发展为根和根和灯泡基因组数据的综合分析灯泡植物群落的研究平台。” 凉. 我是一个大风扇的根源和灯泡–哦, 废话, 才意识到我忘了买胡萝卜PAV Bhaji. 明天会尽量让他们在农贸市场或法纳尔. [玛丽]
  • 盛宴 是一个敏感的局部比对与进化的多速率方案. 一个有趣的项目,作为一个博士的一部分. 论文 :). 我还没有尝试过, 但评注, 看起来不错. [三分球]
  • 由于三分球经常谈论的时钟基因, 我发现这个有趣的自然论文: 编辑总结 – 时钟上糖尿病 [詹妮弗]
  • 从BioMed Central的: CIG - DB: 人类或小鼠的免疫球蛋白和T细胞受体基因可用于癌症研究的数据库 加一个链接到实际站点 (免费, 无需注册): CIG - DB [詹妮弗]
  • 公告: 全球媒体点播欧洲 2010, 13-16 九月 2010, 英国剑桥 [詹妮弗]
  • 由于多数家长和任何人看到随着时间的推移孩子知道, 很大一部分是遗传了我们的性格. 但是,像身高和性, 他们是不会轻易降低单 (甚至多重) 基因的原因为 这最近的GWAS的研究显示. [三分球]
  • 有一个网站即派出下一代测序相关问题的类型主要疑问: http://i.seqanswers.com/ [玛丽]