标记档案: 基因组

一周的视频提示: NCBI的基因资源的大变化


NCBI的 创建于 1988 并一直保持着 GenBank中 多年的数据库. 他们还提供了多种类型的生物数据的计算资源和数据检索系统. 因此,他们都非常清楚的速度有多快,生物学家收集的数据已经改变,扩大. 由于各种数据类型的使用已开发, 它已成为明显的,新的信息类型 (如扩展元数据) 需要收集, 和数据处理的新方法.

NCBI的已经适应这种需要多年来,最近一直在调整它的基因组资源. 今天的提示将基于一些变化. 我的影片将重点放在 “完全重新设计的基因组网站”, 这是最近推出了在宣布 最近NCBI的通讯. 我还没有找到一个出版物描述的变化, 但进入一些细节和通讯 在基因组的现场顶部发现公布 (& 我想指出,在视频) 有关的变化非常有帮助的细节.

正如你将看到在公布, 的 基因资源 最近发生了变化不是唯一的相关资源, 包括基因组计划的资源的重新设计 BioProject 资源和创造 BioSample 资源. 我不会有时间细讲有关这两种资源,但在我后结束,我将链接到最近的两个NCBI的出版物,本月排在核酸研究 – 这些都是很好的资源,读上BioProject的更多信息, BioSample, NCBI的整个. 对于历史的角度看,我也链接到原来的基因组参考, 这是生物信息学和目前免费访问.

一些变化是非常有趣, 包括 “单基因组记录现在是一个有机体,不是一个基因组隔离。” NCBI的通讯状态 “主要改进包括更自然的组织为原核有机体的水平, 真核, 和病毒的基因组. 报告包括有关小学的核或原核基因组的可用性以及细胞器和质粒. ” 还有一张纸条, “由于自然分类系统的重组, 旧的基因组标识符不再有效. 这些基因组标识符通常不暴露在以前的系统,主要用于以编程方式访问. ” 这使我不知道什么样的变化,这将授权其他NCBI的资源, 以及外部资源. 我没有看到任何公告,尚未, 所以我就留下来调整 & 检查周围往往.

享受尖端 & 让我们, 或NCBI的, 知道你觉得他们的变化! :)

快速连结:

NCBI的主页: http://www.ncbi.nlm.nih.gov/

Entrez的基因资源首页: http://www.ncbi.nlm.nih.gov/genome

BioProject资源首页: http://www.ncbi.nlm.nih.gov/bioproject/

参考文献:

历史悠久的Entrez的基因组参考: Tatusova, 吨, 蝎,Mizrachi, 一, & Ostell, Ĵ. (1999). 在WWW Entrez的完整基因组: 数据的代表性和分析 生物信息学, 15 (7), 536-543 分类号: 10.1093/bioinformatics/15.7.536

巴雷特, 吨, 克拉克, 光, Gevorgyan, 河, Gorelenkov, V, Gribov, 大肠杆菌, 蝎,Mizrachi, 一, Kimelman, 米, 普鲁特, 光, Resenchu​​k, 学, Tatusova, 吨, Yaschenko, 大肠杆菌, & Ostell, Ĵ. (2011). BioProject和BioSample在NCBI数据库: 促进捕获和组织的元数据 核酸研究 分类号: 10.1093/nar/gkr1163

塞耶斯, 大肠杆菌, 巴雷特, 吨, 森, 四, 博尔顿, 大肠杆菌, 科比, 学, Canese, 光, Chetvernin, V, 教会, 四, DiCuccio, 米, Federhen, 学, Feolo, 米, Fingerman, 一, 格尔, 属, Helmberg, 瓦特, 卡普斯京, 华, 克拉斯诺夫, 学, 康特里曼, 四, 李普曼, 四, 阅读, z的, 马学恩, 吨, 马德伊, 吨, Maglott, 四, Marchler - 鲍尔, 答:, 磨坊主, V, 蝎,Mizrachi, 一, Ostell, j的, Panchenko, 答:, 潘, 属, 普鲁特, 光, 舒勒, 克, Sequeira, 大肠杆菌, 雪利酒, 学, 沙姆韦, 米, Sirotkin, 光, Slotta, 四, Souvorov, 答:, Starchenko, 克, Tatusova, 吨, 瓦格纳, 属, 王, 华, 威尔伯, 瓦特, Yaschenko, 大肠杆菌, & 叶, Ĵ. (2011). 国家生物技术信息中心的数据库资源 核酸研究 分类号: 10.1093/nar/gkr1184

一周的视频提示: 从Ensembl的变化数据

三分球把我介绍给这个 “体面收集的视频教程 ” 从Ensembl, 但他和玛丽目前在 摩洛哥教学进行为期3天的生物信息学研讨会 & 然后出席会议 (是的, 我很羡慕!). 因此,我创造三分球向我指出这一周的尖端基础教程. 在今天的小费,我要为两个平行教程Ensembl人类SNP信息: 1) 显示您山楂,您可以从Ensembl变化信息, 2) 比较做下列步骤使用 Ensembl 64 (在这个视频) 和使用 Ensembl 54 (存档) (在Ensembl视频).

往往是生命科学的资源不断被开发和改进 & 它可能很难保持视频和文档的最新. 这就是为什么在这里OpenHelix我们不断努力使我们的材料的最新, 每周的新功能和更新教程技巧更新的网站趋于稳定.

的ENSEMBL视频 (SNP和其他变化 – 1 的 2) 是相当不错的 & 提供更多的细节有关的实际Ensembl数据比我在我的短片, 但它是做了几年前的一个旧版本的Ensembl. 自那时以来,资源已更新, 经历了几个新版本的数据. 我要按照Ensembl的SNP教程的第一部分,是在做相同的步骤,使你可以看到有什么变化的例子 & 什么是漂亮的大同小异. 我建议你​​看两个视频,背回一个好主意,有什么变化, 什么类型的变化信息可从Ensembl. 从这个基础上,我敢肯定,你就可以观看Ensembl的第二个SNP的视频 & 它应用于使用当前版本没有太多的麻烦,Ensembl. 欲了解更多详细信息,你可以参考到的最近期ENSEMBL纸NAR数据库问题, 它描述了作为一个整体的不只是变化的信息,但Ensembl.

快速链接:

Ensembl浏览器: http://www.ensembl.org/index.html

传统Ensembl浏览器 (释放 54): http://may2009.archive.ensembl.org/index.html

Ensembl教程, 部分 1 的 2: http://useast.ensembl.org/Help/Movie?id=208

Ensembl教程, 部分 1 的 2: http://useast.ensembl.org/Help/Movie?id=211

OpenHelix Ensembl教程材料: http://www.openhelix.eu/cgi/tutorialInfo.cgi?id=95

Ensembl教程列表: http://useast.ensembl.org/common/Help/Movie?db=core

参考:
Flicek, 体育, 亚琛, 二, Ballester, 二, 比尔, 光, Bragin, 大肠杆菌, 黑雁, 学, 陈, 华, 惊魂, 体育, 科茨, 克, 费尔利, 学, 菲茨杰拉德, 学, 费尔南德斯 - Banet, j的, 戈登, 属, 计数, 学, 海德尔, 学, 哈蒙德, 米, 豪, 光, 詹金森, 答:, 约翰逊, 全, Kahari, 答:, 基夫, 四, 基南, 学, 金塞拉, 河, Kokocinski, 楼, Koscielny, 克, Kulesha, 大肠杆菌, 劳森, 四, Longden, 一, Massingham, 吨, 迈凯轮, 瓦特, 转到, 光, Overduin, 二, 普里查德, 二, 里奥斯, 四, Ruffier, 米, 舒斯特, 米, 斯莱特, 克, 史沫特莱, 四, Spudich, 克, 唐, 华, Trevanion, 学, Vilella, 答:, 禽流, j的, 白, 学, 怀尔德, 学, Zadissa, 答:, Birney, 大肠杆菌, 坎宁安, 楼, 邓纳姆, 一, 德宾, 河, 费尔南德斯 - 苏亚雷斯, 十, 锻造, j的, 哈伯德, 吨, 帕克, 答:, 普罗克特, 克, 史密斯, j的, & 塞尔, S. (2009). Ensembl的10年 核酸研究, 38 (数据库) 分类号: 10.1093/nar/gkp972

答案是什么? 打开主题 (GWAS的基因分型)

映泰 网站是一个要求, 生物信息学的问题,回答和讨论. 我们的社区成员和发现它非常有用. 通常 映泰出现的问题和答案,我们的读者都有密切关系 (基因组学的最终用户资源). 每星期四,我们将其中的一个突出问题和答案在这里在这个线程. 您可以询问一下该线程问题, 或者你可以随时参加在映泰.

本周问题:

有多少基因组的一个GWAS的俘虏?

这个问题的两个伟大的答案, 从第一个报价. 点击上面的链接.

人类基因组编码 1 SNP/100-300bp; 〜3GB的顺序〜1000万个SNPs. 分析这样一个大量的数据,由于一些限制因素,这是不可能的. 为了解决这个问题,我们可以使用连锁不平衡 (劳工处) 映射 (D“上的一节, 重组率), 单体型, 单倍型块单倍型标签SNP (tagSNPs). (阅读关于HapMap计划 这里). 相反,所有的10M单核苷酸多态性基因分型,我们可以基因型在一个单体型块tagSNPs. 这是一个代表在一个特定区域的基因组单核苷酸多态性与高劳工处. 这将使无需所有的10M单核苷酸多态性基因分型的遗传变异. 以前的研究表明,与0.5的M - 1M单核苷酸多态性基因分型芯片将是一个很好的GWAS的足够.

裸鼹鼠, 另一天, 另一个基因组

最新的基因组完成的裸鼹鼠 (Heterocephalus栎). 现在, 可能有一个冷却器 (如果丑陋) 星球上的哺乳动物? 它的只有两个真正的完全社会性在世界上的哺乳动物之一, 辜负 28 漫长的岁月里 (我女儿的大鼠, 没有关系, 只住 3 年) 很多疾病是惊人的耐.

因此,, 难怪没有的基因组测序. 也许我们可以了解一些事情的社会行为和长寿.

当然,它是一种资源 http://www.naked-mole-rat.org/ 虽然它基本上只是一个爆炸服务器和某些下载. 我倒计数的一天,它可在 UCSC的Ensembl :ð. 我有一些我比较感兴趣的基因.

提示的周: 基因组坐标转换

我这样做 两年前翻倒 今天和我重新用多一点的信息, 关于SciVee (所以它的可共享) 最多最新. 我一直在更新我们的 银河教程 而尖一直是最多一个啾啾, 共享,并参观了我们所做的秘诀 (不是最, 只是一个), 所以想到现在会是一个好时机,再重新考虑. 本技巧将通过 银河工具 到 “liftover” 基因组和基因组组件之间的协调. 您可能还希望访问其他一些工具和地方,你可以转换之间,如基因组组装基因组坐标 UCSC基因组浏览器Liftover 实用工具 (从访问链接 “公用事业” 菜单上头版, 它采用了 链转换文件), FlyBase (为 ð. 果蝇 基因组), 制造商 (从GMOD注释工具,其中包括一个装配转换工具), Ensembl大会器, 我敢肯定有其他人. 有任何报告? 至于下面的评论告诉我们, 也有 NCBI的新映射服务 该程序集之间的映射 (物种内) 之间的RefSeq序列和组件.

一个字有关的方法, 正如上文第一段, UCSC基因组浏览器的liftover工具使用链转换文件. 我在银河使用的方法不确定虽然我假设它的同类. 我有一个调查,并会在更新页面,当我知道答案.

事实上,这是. 我收到来自银河系支持小组寄来的漂亮的答案:

该liftOver程序和底层的映射文件来自加州大学圣克鲁兹分校,并在其基础 “连锁/净” 比较基因组算法.

这些数据代表了两个参考涉及基因区域的基因组同线. 基因具有类似注解, 密切相关的物种之间, 发现在这些同线地区有一个良好的可能性正在同源, 但基因的功能是不考虑的算法和将要独立评估,以确认orthology.

这在UCSC基因组浏览器项目的邮件列表的讨论将是一个好地方,了解详情:
https://lists.soe.ucsc.edu/pipermail/genome/2008-March/015810.html
直接联系球队 genome@ucsc.edu 也是一种选择,如果您有关于特定问题的算法.

希望这有助于!

戈布勒基因组

对于那些没有谁是美国的感恩节观察家, 土耳其是大多数美国人的首选主菜,丰收盛宴. 两年前 玛丽报道,土耳其基因组的方式. 嗯, 它的中肯 土耳其基因组已接近完成 (公共科学图书馆在9月的文件所载) 并准备为今年的感恩节大餐!

百胜, 百胜.

当前的BMC基因组学 文件显示,已有多个染色体内重组之间的土耳其基因组与鸡之一. 我想可以说,土耳其仅仅是一个经过重新配置的鸡? (hattip: 每日扫描)

有了这些出版物, 你已经有了一些超级古怪的饲料,以证明你的家人,你确实是一个生物学的书呆子.

说到鸡和火鸡… 当我住在韩国 1980 我的美国朋友,我很难找到一个土耳其 (韩国人认为他们是丑陋的). 我们终于找到了一个农场,他们提出的美国军人和侨民. 我们去那里,拿起他们的最大, 这是一个丑陋的头上面休息. 我们把它, 生活, 在一个箱子上 1 小时乘坐巴士回到市场,与韩国人在盯着我们的丑陋的头脑中想我们是疯了离家不远的 (也许我们?). 我们采取了一个不可思议的鸡屠夫,当我们回到我们派出和deheaded土耳其, 他怜悯我们,给了我们两个大鸡. 当我们看到可怜的火鸡, 我们明白了为什么屠夫坚持馈赠我们两只鸡: 火鸡, 大,因为它是, 没有它的肉.

嗯, 我们烤了两只鸡,感恩 (并提出了我们在市场上发现从南瓜的南瓜饼。. 其中的传播者认为我们疯了,吃南瓜, 他们为装饰!).

Anyhoo, 一个长期的轶事,只是展示一只鸡,也许确实不够,因为他们只是重新安排的鸟类 (虽然我不知道土耳其的头部,从鸡?)

星期五SNPpets

欢迎来到我们的星期五转储功能链接: SNPpets. 一周之内,我们遇到了很多链接和读取,我们认为很有趣, 但不要到一个博客帖子. 在这里,他们是您的享受…

提示的周: GeVo和基因组的比较

gevo_thumb今天的一周引入了一个新的提示 (给我们) 基因组比较工具. 我们遇到了这个阅读博客发表于工具 詹姆斯和巨玉米 (伟大的博客) 约 从他的研究建议图. 见, 有阅读博客的理由 :ð. 创建这个数字和分析工具,他使用的是 Gevo公司 其中有几个有用的工具,除了Gevo公司. 在今天的一周的一角, 我们将在詹姆斯的快速查找’ 在Gevo公司上市,并介绍抓斗. 检查出来, 他们看起来非常有用的工具. (当你在它, 退房詹姆斯’ 博客. 这样的小知识和 有趣的讨论 它值得。)

RetroDogs

nr_Bassett-Dachshund我有一个巴吉度成长. 他的名字是没有用的, 无用S. 地面. 嗯, 实际上它是正式 尤利西斯S. 津贴 因为美国养犬俱乐部将不会接受无用S. 作为名称咕噜他们觉得这是太贬低. 不知道他们认为这是贬低的狗或向总统, 但这既不是在这里也有?

因此,,你问, 是什么使我这个长期传递甜蜜的狗绊倒它太长耳朵与它的太觉得腿短? 这 原来,他们发现有什么遗传病因是那些腿短 巴吉度猎犬在 (和腊肠犬和其他品种).

由于NHGRI的新闻稿国:

在推进科学杂志网络版上发表的一项研究, 由NHGRI的伊莱恩领导的研究人员奥斯特兰德, 博士, 研究DNA样本 835 狗, 包括 95 腿短. 他们的调查多 40,000 发现的DNA变异的遗传标记签名独家短腿品种. 通过后续的DNA测序和计算分析, 研究人员确定了狗’ 不成比例四肢短小,可以追溯到一突变事件的犬基因组 – 一种DNA插入 – 在发生的早期演化的家犬.

插入原来是一retrogene, 这当然我也觉得有趣,我学retrotransposable元素. 逆转录有这样的RNA反转录成DNA的习惯,可以得到重新插入到基因组回 (因此 加工假 当然).

这项研究的原因有两个有趣的 (除了因为我有一个巴吉度,并研究了反转录因子的演化 ;), 它给我们一个大的变化,导致在形态和retrotranscription作用进一步进化事件的线索和它给我们一个可能的人类条件线索.

如需更多关于狗的基因组, 你可以阅读我们的S关于狗的基因组everal职位, 去 NCBI的家狗的基因组 网站 (或 UCSC的Ensembl 和其他浏览器) 和 读报纸 (当然需要一个订阅, 它在科学). 这是一个有趣的阅读至今 (我想找到一些时间来读它更充分, 也许没用不辜负他的名字。. 他并没有真正即使在当时 :ð).

冷基因组

coldvirus最近, 我们了解了很多的感冒病毒. 许多基因组 现在已经被测序 (这是一个订阅的要求科学报告, 你可以阅读有关报告更在这里).

你可以在这里找到更多的基因组信息 picornaviridae.com进入NCBI的基因组 和一些结构性信息 内存数据库. (只是一个侧面说明, 鼻病毒是现在列为肠).