标记档案: 文学

一周的视频提示: 出版物跟踪在UCSC基因组浏览器

有伟大的东西是在基因组数据库. 有伟大的东西,在文学. 两者之间有时也有明确的联系–真棒策展人 努力源质量信息, 有时自动化流程,可以帮助. 当然, 还有东西吨流入的数据库是 没有文学 还可能不会全额, 这是整个'诺特尔问题. 但是,如果有办法把它们放在一起…. [某一年龄段的美国人将严厉打击在此]


但是,很多人正在努力挖掘文学有用的信息,并使其更加以其他方式访问, 添加上下文以及基因组区域. 这正是我今天强调的项目,.

去年从爱思唯尔计划开始启用数据库和软件供应商和其他有访问他们的文本语料库, 并建立 “企业应用” 文献的附加价值. 我们谈到这里 在NCBI的应用程序的情况下. 使用这种机制, 你还可以添加链接到文献价值的基因组数据库直接. 这就是新 刊物追踪 在UCSC基因组浏览器.

你可以学到更多链接轨道的细节到 刊物着陆页. 但也有一个从轨道的领先开发商最大Haeussler公布, 过来一些功能的Biocurator邮件列表, 我在这里引述:

寻找它在该组 “映射和排序”, 名称 “出版物” UCSC的人力和主要模式生物基因组浏览器 (鼠标, 飞, 斑马鱼, 等). 目前,它包含了从各地开采的数据 3 万美元的研究文章, 约20万篇论文中的序列.

因此, 百万 爱思唯尔论文, 医学中央的文章, (多源来有可能) 已开采找到序列. 这些序列对基因组序列blatted. 比赛已上注明 UCSC基因组浏览器. 你可以得到有关策略的更多细节,从纸张,我联系以下, 和刊物轨道页.

对此有什么酷的是,你可以看看您感兴趣的基因组区域, 现在看看别人都在这一地区. 其中一些将是你知道的文件, 当然–但有可能是其他文件,你不知道,有关该地区带来新的见解.

也最大在Biocurator信提供了一个样本区域看–这里的链接. 点击它加载的例子,环顾四周:

这里是一个与轨道激活和放大的表皮生长因子基因的基因组浏览器的链接:
http://genome.ucsc.edu/cgi-bin/hgTracks?clade=mammal&org=Human&db=hg19&position=chr4%3A110%2C820%2C483-110%2C937%2C564&pubs=pack&Submit=submit

在我的视频小费,我将展示如何获得,以及曲目细节. 如果您需要了解更多关于UCSC基因组浏览器的基本功能,你可以看到,这里免费提供赞助的培训材料: http://openhelix.com/ucsc

其他的事情你可以做的就是添加 “应用程序” 在Elsevier的应用程序进行个性化设置,如果你有机会最近更新日期:. 而当你发现自己的一篇文章中有序列数据, 你就可以从点击到加州大学圣克鲁兹分校. 珍妮弗描述 如何为我们的应用程序, 但这一过程将是类似的,如果你想添加UCSC的应用程序以及. 你可以找到和 在这里添加UCSC的应用程序, 而你在它的时候,你可以添加 OpenHelix应用点击此处 ;) . 作者提到的数据库和软件,将挖掘文本, 将连接你的训练,所以你可以学习如何使用UCSC基因组浏览器等资源.

特别说明: 马克斯和他的团队的反馈渴望在这条新赛道–如果有什么东西不太对劲, 或者有其他方面的,你可能想看看. 他是伟大的错误报告 (我知道, 我给一些): 他们认真,他们连根拔起! 如果您有任何建设性的想法,我相信他会来看看. 他接触信息以及上刊物田径页. 和他可以纠正任何我有不完全在这里为我的错误狩猎回报 :)

编辑笔记的十月 25, 2013: 在这段视频的时间, 刊物轨道位于别处, 但它现在可以发现在其自己的 “文学” 跟踪组. 之间 “基因与预测” 和 “mRNA和EST序列”.

++++++++++++++++++++

快速链接:

出版物跟踪人类的详细信息页面 UCSC基因组浏览器: http://genome.ucsc.edu/cgi-bin/hgTrackUi?hgsid=278356441&c=chr4&g=pubs

UCSC基因组匹配SciVerse应用 –它添加到补充文献浏览: http://bit.ly/Netpka

UCSC基因组浏览器介绍培训: http://openhelix.com/ucsc

OpenHelix SciVerse应用说明: http://bit.ly/xtGcco

参考:

Haeussler, 米, 耶纳, 米, & 伯格曼, ç. (2011). 从生物医学的文章中提取的DNA序列的基因和基因组注释 生物信息学, 27 (7), 980-986 分类号: 10.1093/bioinformatics/btr043

一周的视频提示: eGIFT, 从文本中提取的基因信息


eGIFT, 作为标记线表示, 是从文本中提取的基因信息的工具. 这是一个工具,它允许你搜索和探索的条款与文件有关的基因或基因组. 有许多方法来搜索和探索eGIFT, 寻找特定任期的基因, 发现涉及到一组基因和更多的条款. 该工具如何做到这一点? 你可以 检查出的用户指南 了解更多, 但这里是一个网站的简要:

我们期待在PubMed参考 (标题和摘要), 收集这些引用在给定的基因集中, 自动识别和统计更有可能比一般的基因,这种基因有关的条款. 为了了解一个特定的关系 长期与特定基因, 我们可以让用户看到所有提的句子 术语, 以及从这些句子中提取摘要.

要了解更多有关这个工具如何被放在一起,并计算涉及, 你可以检查出关于它的BMC生物信息学出版 2010, eGIFT: 从文学的挖掘基因信息.

但, 今天, 采取参观的网站和一些事情可以做,在今天的周提示.

相关链接:
eGIFT
PubMed的 (教程)
XplorMed (教程)
文学 & 文本挖掘资源教程

帝舵, 三, 施密特, 三, & 维杰 - 军刀, ç. (2010). eGIFT: 从文学的挖掘基因信息 BMC的生物信息学, 11 (1) 分类号: 10.1186/1471-2105-11-418

一周的视频提示: OpenHelix上 - 应用程序扩展研究


我们都见过的讨论 – 在Twitter, 在期刊, 很多的地方 – 如何收集, 存储, 发现和使用,是会产生的所有数据. 在此间举行 OpenHelix 我们相信,有一个正在大大得到充分利用生物科学数据的金矿, 我们的目标是帮助使数据更易于访问的研究人员, 医生, 馆员, 学生和谁比谁对科学感兴趣.

我们走在我们的目标,在以各种方式, 包括: 这与它的博客 每周提示, 答案 其他职位; 与我们的 在线教程材料 超过 100 不同的生物数据库和资源; 与我们的 现场培训, 其中有许多是由资源提供赞助,如加州大学圣克鲁兹分校的基因组浏览器组.

在今天的小费,我会向你介绍另一个我们的努力之一 “扩展研究” 显示你看到一个OpenHelix应用程序,我们的设计 SciVerse平台, 爱思唯尔描述为一个 “生态系统提供的工作流程解决方案,以提高科学家的生产力,并帮助他们在他们的研究过程中”. 这个程序将扫描任何数据库名称或网​​址,我们培养一个ScienceDirect期刊文章, 然后显示一个这样的资源在应用程序的窗口列表. 一位研究人员可以使用该列表去如何使用资源的研究文章,我们的培训, 和资源本身. 我们相信,这种类型的集成将有助于延长,使得它更容易找到的研究, 访问和使用数据文件关联. 如果你已经获得通过ScienceDirect文章, 您尝试我们的应用程序, 请发表评论在这里 & 让我们知道您的想法, 或建议未来的增强功能. 你也可以考虑检讨它的应用程序库. 谢谢!

快速链接:

SciVerse集线器 http://www.hub.sciverse.com

SciVerse应用画廊 http://www.applications.sciverse.com

OpenHelix SciVerse应用说明 http://bit.ly/xtGcco

参考文献:
在提示参考 (需要订阅): 莫特森, 阁下, & Euling, S. (2011). 整合机械和多态性数据表征环境的化学品风险评估,在21世纪的人类遗传易感性 毒理学和应用药理学 分类号: 10.1016/j.taap.2011.01.015

OpenHelix参考 (免费从PMC 这里): 威廉姆斯, j的, 锰, 米, 佩罗- Micale, 三, 车床, 学, Sirohi, 全, & 车床, 在. (2010). OpenHelix: 生物信息学教育以外的一个不同的盒子 在生物信息学简报, 11 (6), 598-609 分类号: 10.1093/bib/bbq026

SciVerse参考 (需要订阅): Bengtson, Ĵ. (2011). ScienceDirect通过SciVerse: 一种新的方式方法爱思唯尔 医学参考服务季刊, 30 (1), 42-49 分类号: 10.1080/02763869.2011.541346

新功能, 研究文章, 网站上OpenHelix

如果你去到了 OpenHelix 首页, 你会开始注意到一些差异. 我们的目标网页教程有一个附加的新功能. 我们现在有一个在每个目标网页部分,显示了中央在生物医学期刊的最新研究. 例如, 这里的截图是我们的 GeneMANIA教程套房. 在左下角你会看到 5 最近的研究,已经使用的文章 GeneMANIA生物医学中心 研究期刊目录. 得到一个想法,什么样的数据资源和研究使用资源做到这一点,这将是对用户有用. 这也将有助于寻找其他资源,可能是使用 (往往是相关的资源会提到会同感兴趣的资源).

这是一个系列的新功能,我们希望添加到目标网页,这将提高科研人员的学习能力,他们可以开始所有有关数据和工具提供给他们. 我们将增加一个 “最近的视频提示” 部分多.

和, 如果你是一个出版商的研究文献,并希望获得“最近的研究表’ 像这样为您的杂志对我们的目标网页 (需要访问的文章全文), 请与我们联系 我们很乐意与你做你的期刊中受益,, 资源, 研究人员和肯定, OpenHelix :).

在我们继续努力保持和扩大我们的 搜索数据库和发动机, 我们的教程, 我们的博客 多, 你也会注意到我们增加了广告我们的网站. 该广告是一种顶部横幅广告, 边摩天大楼广告和目标网页的教程小广告. 请考虑浏览这些赞助商,​​如果他们感兴趣. 广告将不会在诸如赞助教程 UCSC基因组浏览器 临时区议会վ, 和 其他, 也不会为任何用户可见的教程目录.

如果你想赞助的教程,以便它是公开的, 不管你是该工具的开发者或公司, 请联系我们有机会 获得培训和推广了大量的研究人员.

还, 虽然我们有十几个是公开的赞助教程, 我们有一个 在大目录 90 可供认购的额外教程. 您可以subscribe访问这些作为个人, 部门或机构.

 

星期五SNPpets

欢迎来到我们的链接集合星期五功能: SNPpets. 在一周中,我们遇到的很多环节和读取,我们认为很有趣, 但不要到一个博客帖子. 在这里,他们是您的享受…

提示的周: Word加载在本体识别

在今天的小费,我要让你知道,我认为将有助于研究人员目前自己在一个准确的和普遍搜索的方式的数据和出版物的一个工具. 我学到的资源 (UCSDBioLit) 通过 文章 在我最近的一个 生物医学中心 文章提醒电子邮件. 这个资源,让作者与XML标记,以纪念自己的出版物,他们写自己的论文. 这将使他们的研究更快,更准确的语义搜索.

今天是一个巨大的问题在科学的能力,快速搜索大量文献的基础,准确,高效地找到你感兴趣的数据. 在这里,在OpenHelix我们专注于有效的方法,有效地获取信息的公共数据库和资源, 但在另一端的过程是科学知识的能力,将这些资源策划. 我们特色 biocurators 和惊人的工作,他们在多次 过去, 但它永远不会结束的工作,并可以非常劳动力密集型. 它常常涉及到一个领域的文献的初步分流, 一定程度自动收集信息, 然后细致的手工努力的科学家在部分资源收集和目前的信息,通过他们的网站. 我知道从个人的经验,阅读文件的过程中, 澄清与作者的研究细节, 然后这些信息来展示作者的满意,可以是一个很长 & 劳工密集的过程, 馆长和原始作者.

多年来已有 讨论 “专家策展’ 专家在外地作者审查或资源中的一个总结页面, 或社区打捞少年团体大会, 等. 也有过许多这些努力的成果, 但在一般参与低. 但是,谁是研究的专家发表自己以外的其他作者? 如果作者可​​以/将标志着在出版过程中,自己的论文, 他们不仅可以保证,这将是准确的,但他们将有助于使他们的研究普遍没有滞后的搜索需要通过特定的资源可搜索. 到目前为止文档标记已经没有一个简单的过程,已经在很大程度上被认为是不值得的努力’ 归属/承认其属下.

BioMed Central的文章概述和讨论这些问题的一个很好的工作. 它引用了许多其他的努力和资源, 解释他们的动机和实施他们的软件. 一个不错的功能的工具,有互操作性功能, 和真正的承诺与符合现有标准的做法. 文章还介绍了其他群体的资源地址的附录涉及语义搜索和文献出版. 我特别喜欢这个报价从纸张:

在这里介绍的Word加载项将协助作者努力在这个社会的标准,从而使文档的作者, 对内容的绝对专家, 在创作过程中这样做,并提供原始源文件信息.

您还可以找到在SciVee使用该工具的简要教程: Word加载本体识别教程 (1 的 4): 安装过程

作为一个说明, 文献标志和启用,目前活跃的领域 – 玛丽发现了另一个 文献处理资源 以及: 退房的小费, 的文章 & 工具. 告诉我你发现了什么/想. 谢谢! (俄亥俄州, 和快乐街. 帕蒂的来雅!)

UCSDBioLit参考:
ResearchBlogging.org
芬奇, j的, Fernicola, 体育, 德兰, 河, Parastatidis, 学, 趟, 答:, 纳伊姆, 澳, 奎恩, 克, & 畛域, P. (2010). Word加载本体承认: 科学文献的语义富集 BMC的生物信息学, 11 (1) 分类号: 10.1186/1471-2105-11-103

提示的周: 管理 & 与Mendeley分享引用

本周的头有点偏离主题 (在基因组学数据库), 但它是科学/生物相关的,我们都需要的东西. 外面有一个参考的管理软件的可能性很像尾注, 一些优秀的Web 2.0 社交网站一样 Connotea (自然出版) 和 CiteULike (斯普林格) 管理工具和一些PDF. Mendeley 希望成为所有三个. 我喜欢这个主意了很多. 而不用 2 或 3 单独的应用程序, 台式机和/或网页, 等, 你有一个统治他们所有. 当然有EndNote Web的尾注, 但它不是免费的 (Mendeley是免费的, 和他们所提供的功能现在将免费入住. 他们会为专业用户提供新功能,后来收费). 您可以导出Connotea你的推荐和CiteULIke, 但它是一个额外的恼人的步骤. 与Mendeley我的第一个经验是相当积极的, 所以我想我把他们介绍给你在这里.

影响因子

我记得考虑 “在mpact因子” 期刊提交的研究论文时,, 并想知道什么我发表的特殊纸张的影响因素可能是出于好奇. 不是特别严重, 我的领域足够窄,在我的博士. 研究,只是一些杂志甚至考虑, 所以它通常是非常简单的选择. 对于个别文章, 我敢肯定,我知道 4 我的实验室外,在我的研究感兴趣的人,在世界 (我开玩笑, 有点). 在我的博士后, 我的PI是不错的选择期刊的基础上的文章, 该杂志的观众… 及影响因素.

但影响因素测量 它的问题 (文章级指标和科学影响的演变, Neylon和吴. 公共科学图书馆生物学 7: e1000242), 总是有一个搜索来衡量期刊和更好的个别条款的影响, 或至少​​不同. 嗯, 一个我最喜欢的科学网站,我最喜欢的杂志出版商之一 ResearchBlogging.org和公共科学图书馆, 一起工作来衡量的期刊文章的影响. 公共科学图书馆 有很多指标 看看“影响’ 一篇文章可能, 现在他们已经 增加了一个度量 看到多少次的书面上使用博客聚合博客的约 后基因组, 博客线和 自然博客, 现在 ResearchBlogging.

我喜欢与ResearchBlogging伙伴关系,特别是因为其他博客聚合而不一定拿起文章讨论科学的文章 (后基因组) 或聚合出有科学博客的一个子集 (自然博客), ResearchBlogging是专门讨论研究的同行评审文章的博客文章.

当然,我不觉得这是特别有用的比较一文中对另一 (最好的文章并不总是写, 和那些可能不会在博客聚合), 但我认为这将是伟大的方式进行交谈,并深入深入的研究课题.

你可以在任何物品的公共科学图书馆的度量, 例如 我的链接上面, 点击 “公制” 亏损, 向下滚动,直到看到标题中的位 “博客覆盖。” 该文章, 你会看到两个ResearchBlogging职位 (作为这个写作), 本文有关指标数据 :).

提示的周: 寓言, 文本挖掘文学对人类基因

fable_thumb 几个星期前,我们给你带来了一个星期左右的提示 CHOP方案的CNV数据库. 谁给你带来该数据库相同的人也做 寓言 (快速自动提取生物医学文献), 文献挖掘工具. 该工具采用了先进的的算法,以寻找人类基因直接相关的关键字搜索,然后找到这些基因文学. 该工具有一些伟大的功能,是一个伟大的方式,快速找到一个感兴趣的基因的文献. 今天的小费会给你一个快速的工具简介.

(重)二,资助数据库

ResearchBlogging.org因此,, 我写的 defunding资源 并简要提到了纸 数据库 关于 资金 (或“re'funding) 数据库和资源. 我想进一步讨论这一点. 本文, 由 钱德拉和. 的, 讨论如何数据库和, 利用他们的任期, 生物资源中心 (BRCs) 要保持财政稳健.

让我先, 我完全同意他们的前提, 的数据库和资源已成为当务之急. 早先的模型 “公布实验结果和研究资料共享的reated” 需要扩大. 当他们状态:

不过,它已不再足够的数据共享模式,通过传统出版, 和, 特别是高通量 ('组学) 技术, 共享数据集,需要提交到公共数据库已久的情况下与核酸和蛋白质序列数据.

提交人, 事实, ,大部分生物资料库的财务模型 (我们谈论成千上万存在), 经常是 3-5 年发展资金, 一旦耗尽, 基础设施需要由另一个源支持. 事实上, 这导致了数据库defunding如 t空气VBRC (和许多其他), 与不可替代的数据和工具的优秀资源, 这则必须努力寻找资金以维持资金基础设施和不断发展的巨大代价.

科学研究的要求, 开放, 共享数据, 需要的资金模式,保持了这些数据库公开性质. 从而为他们的状态问题:

如果, 由于财政原因, BRCs无法执行的条件下,满足sceintfic研究行业的要求和任务的deamnds, 科学家们将看到任何有价值的信息丢失或者被转移到严格的商业环境与东两个后果: (在) 封锁访问这些信息和/或成本高 (二) 技术转让损失在可预见的未来数据和potentioal. 在这两种情况下,同时在科学和更广泛的社会影响将是不利.

再次, 我同意.

他们讨论了几种可能的解决方案,以维持一个公开的数据库,包括公私双级制度下的分红支付年费和学术研究人员可以免费使用的可行性. 他们提到Uniprot, 它经历了十多年资金危机, 作为一个例子. Uniprot (然后Swissprot) 回到完整的公共资助 2002. 还有几个正在试图通过这种模式,以资助自己的其他数据库. BioBase是一个在数个数据库已被折叠. TransFac是一. 有一 免费, 精简功能, 版本 这是提供给学者通过基因regulation.com和 更全面的版本为订阅BioBase. 这位前版本允许一些数据共享, 人们可以看到 查看UCSC的. 我无法得知的BioBase财务和其他同类车型, 我认为将一些工作, 但我同意作者的许多有用的数据库和资源将很难使这种方式维持.

其他可能性包括完全根据一个单一的公共机构的筹资机制,包括数据库. 许多数据库 NCBI的欧洲投资银行 这种模式适合. 事实上, 甚至有 最近一个资源案件被并入这个模型 在NCBI的. 再次, 这适用于一些, 但不是所有有用的资源.

大多数将不得不寻找资金的数据库变量方法. 考虑到这样做的重要性, 当务之急是找到可行模式. 笔者拒绝, 不可收拾, 广告. 当他们提, 大多数广告客户不会被吸引到网站的广告没有一个至少能见度 10,000 每月访客. 可能有一些是事实 (我需要阅读和参考他们举出使用备份,截至).

但是接下来的模型,他们建议在我看来,有同样的缺点. 在这个模型, 将有一个数据库或资源的合作伙伴关系的核心竞争力。’ 举一个例子,他们是 内存数据库 (不被混淆 内存数据库). 这个虚拟突变小鼠资源库提供直接的审判的关系 Invitrogen公司 从它的基因信息产品页. 他们提到,虽然 6 公司进行了接触, 只有一个回答. 看来,这种模式具有直接销售广告同样的问题.

他们还提到,, 至少维持其对小鼠功能基因组学研究界, “院校拨款” 似乎是长期的活力和开放接入的最佳解决方案. 不幸的, 直到像美国国立卫生研究院和EMBL机构愿意或能够支付这些数据库, 我不知道那是那是一个解决方案.

当他们提到的文件, 是的数额和数据正在生成的类型是指数增长率. 我不知道,政府或机构的财政拨款能跟上住房最多需要保持和进一步发展,使所有这些数据库产生的数据可以保持公开和自由获取的基础设施.

信息应该是免费的, 但不幸的是它并非没有成本. 这将是有趣的数据库和资源如何在这个快速增长的资金基因组学的世界在发展变化 (我们必须找出和解决方案).

聚苯乙烯: 就我个人而言, 作者运用丰富的资源, 爱玛 (欧洲小鼠突变体馆), 作为例子的文件. 我喜欢这个名字,因为它是我女儿的名字, 但它只是去 证明名称一波接一波. 我们命名我们的女儿很少人会思考自己的女儿一样的名字. 当甚至数据库的名称相同的名称, 你知道,情况并非如此.

Chandras, 三, 韦弗, 吨, Zouberakis, 米, 史沫特莱, 四, Schughart, 光, 罗森塔尔, 全, 汉考克, j的, Kollias, 克, 斯科菲尔德, 体育, & Aidinis, 在. (2009). 生物模型数据库和资源的财务可持续性 数据库, 2009 分类号: 10.1093/database/bap017