Archivo de la etiqueta: genómica

Herramientas bioinformáticas extraen de un proyecto típico genoma de los mamíferos [suplemento]

Esta es la tabla 1 que acompaña a la entrada en el blog completo: Herramientas bioinformáticas extraen de un proyecto típico genoma de los mamíferos. Mira el mensaje principal para los detalles y explicación. La mesa es demasiado largo para mantener en el cargo, pero yo quería que fuera búsquedas en la web. Una copia también reside en FigShare: http://dx.doi.org/10.6084/m9.figshare.1194867

Seguir leyendo

Consejo del la Semana: Géminis, exploración de la variación genética

You Tube:

El consejo de esta semana de la semana es de Géminis, que es el acrónimo de “Minería genoma.” A diferencia de la mayoría de los consejos que le damos a la semana, este es un paquete de software. Sin embargo,, se hace uso y se integran con muchas bases de datos de Internet, como dbSNP, CODIFICAR, UCSC, ClinVar y KEGG. Es también una libre disposición, herramienta de código abierto y un paquete de software muy útil que da el investigador la capacidad de crear consultas bastante complejos a partir de los genotipos, patrones de herencia, etc. Lo anterior 12 clip de minuto es una charla que dio en una conferencia que da una introducción de la ciencia detrás de la herramienta.

El resumen de la reciente trabajo de los desarrolladores da una buena introducción acerca de la funcionalidad de la herramienta:

Tecnologías de secuenciación de ADN modernos permiten a los genetistas para identificar rápidamente las variaciones genéticas entre muchos genomas humanos. Sin embargo, el aislamiento de la minoría de variantes enfermedad subyacente sigue siendo un importante, sin embargo reto formidable para la genética médica. Hemos desarrollado GEMINI (Genoma Minería), un paquete de software flexible para explorar todas las formas de la variación genética humana. A diferencia de las herramientas existentes, GEMINI integra la variación genética con un conjunto diverso y adaptable del genoma anotaciones (g, dbSNP, CODIFICAR, UCSC, ClinVar, KEGG) en una base de datos unificada para facilitar la interpretación y la exploración de datos. Mientras que otros métodos proporcionan un conjunto inflexible de filtros variante o métodos de priorización, GEMINI permite a los investigadores para componer consultas complejas sobre la base de genotipos de muestra, patrones de herencia, y ambos pre-instalado y anotaciones del genoma personalizados. GEMINI también proporciona métodos para consultas ad hoc y la exploración de datos, una interfaz de programación sencilla para análisis personalizados que aprovechan la base de datos subyacente, y tanto la línea de comandos y herramientas gráficas para análisis comunes. Se demuestra la utilidad de GEMINI para explorar la variación en los genomas personales y estudios genéticos basados ​​en la familia, e ilustrar su capacidad para escalar a estudios con miles de muestras humanas. GEMINI está diseñado para la reproducibilidad y la flexibilidad, y nuestro objetivo es proporcionar a los investigadores un marco estándar para la medicina genómica.

Si desea obtener más información, hay algunos bastante buena documentación del paquete de software aquí.

Mientras estoy en ello, y sin relación alguna, excepto que es la genómica humana, hay esta presentación slideshare de la "actual’ estado de la genómica personal. La corriente es entre comillas porque el slideshare es en realidad de 3 años, pero hay un montón de buena información allí. Alguien sabe de una puesta al día conjunto más diapositivas o extensa introducción a la situación actual de la ciencia genómica personal similares a este?

 

Relevante Links:

Paquete de software GEMINI
dbSNP
CODIFICAR
UCSC Genome Browser
ClinVar
KEGG

(tutoriales están vinculados por debajo de esas herramientas en negrita arriba)

Referencia Relevante:

Paila U, Chapman BA, Kirchner R, & Quinlan AR (2013). GEMINI: Exploración Integrativa de la variación y Genoma Anotaciones genéticos. PLoS Computational Biology, 9 (7) Palabras: 23874191

Vídeo Consejo de la semana: Grandes cambios al genoma NCBI Recursos


NCBI fue creado en 1988 y ha mantenido la GenBank base de datos para los años. También ofrecen muchos recursos computacionales y sistemas de recuperación de datos para muchos tipos de datos biológicos. Como tales, saben muy bien lo rápido que los datos que recogen los biólogos se ha modificado y ampliado. Como los usos de distintos tipos de datos se han desarrollado, se ha hecho evidente que los nuevos tipos de información (como los metadatos ampliado) deben ser recogidos, y nuevas formas de manejo de datos son necesarios.

NCBI se ha ido adaptando a las necesidades de estos a lo largo de los años y recientemente se ha ido adaptando sus recursos genoma. Punta de hoy se basa en algunos de esos cambios. Mi video se centrará en la “Genoma completamente rediseñado sitio”, que se extendió recientemente y publicada en el más reciente boletín NCBI. No he encontrado una publicación que describe los cambios, pero el boletín entra en algunos detalles y la El anuncio en la parte superior de la página del Genoma (& que señalo en el video) Tiene detalles muy útiles acerca de los cambios.

Como se verá en el anuncio, la Genoma de los recursos no es el único recurso que tienen relación con cambios que ha experimentado recientemente, incluyendo el rediseño de los recursos del Proyecto del Genoma en la BioProject de recursos y la creación de la Muestra biológica de recursos. No voy a tener tiempo para entrar en detalles sobre los dos recursos, pero al final de mi post que unirá a dos recientes publicaciones Revista que salió en Nucleic Acids Research este mes – estos son un buen recurso para leer más información sobre BioProject, Muestra biológica, y en la Revista como un todo. Para una perspectiva histórica que también enlazan con la referencia del genoma original de, que es en Bioinformática y en la actualidad libre acceso.

Algunos de los cambios son muy interesantes, incluyendo la “Registros individuales del genoma representan en la actualidad un organismo y no aislar el genoma de uno.” El NCBI boletín afirma que “Las mejoras más importantes son una organización más natural a nivel del organismo de procariotas, eucariotas, y genomas virales. Los informes incluyen información sobre la disponibilidad de los genomas nuclear primaria o procariotas, así como los organelos y plásmidos. ” También hay una nota que “Debido a la reorganización de un sistema de clasificación natural, mayores identificadores de genoma ya no son válidas. Normalmente, estos identificadores genoma no fueron expuestos en el sistema anterior y se utiliza principalmente para el acceso programático. ” Eso me hace preguntarme qué cambios que esto mandato de otros recursos del NCBI, así como los recursos externos. No he visto ningún anuncio de que aún, así que voy a tener que permanecer atentos & comprobar a menudo en torno a.

Disfrute de la punta & vamos a, o NCBI, saber lo que piensa de los cambios! :)

Enlaces rápidos:

Revista Página de Inicio: http://www.ncbi.nlm.nih.gov/

Entrez Genoma de Recursos Página de inicio: http://www.ncbi.nlm.nih.gov/genome

BioProject Página de recursos: http://www.ncbi.nlm.nih.gov/bioproject/

Referencias:

Histórico Entrez Genoma de referencia: Tatusova, T., Karsch-Mizrachi, I., & Ostell, J. (1999). Genomas completos en la WWW Entrez: de representación de datos y análisis Bioinformática, 15 (7), 536-543 DOI: 10.1093/bioinformatics/15.7.536

Barrett, T., Clark, K., GevorgyanGorelenkov, R., Gorelenkov, V, Gribov, E., Karsch-Mizrachi, I., Kimelman, M., Pruitt, K., Resenchuk, S., Tatusova, T., Yaschenko, E., & Ostell, J. (2011). BioProject muestra biológica y bases de datos en el NCBI: captura de la facilitación y organización de los metadatos Nucleic Acids Research DOI: 10.1093/nar/gkr1163

Sayers, E., Barrett, T., Benson, D., Bolton, E., Bryant, S., Canese, K., Chetvernin, V, Iglesia, D., DiCuccio, M., Federhen, S., Feolo, M., Fingerman, I., Geer, L., Helmberg, W., Kapustin, Y., Krasnov, S., Landsman, D., Lipman, D., Lu, Z., Enloquecer, T., Madej, T., Maglott, D., Marchler-Bauer, A., Molinero, V, Karsch-Mizrachi, I., Ostell, J., Panchenko, A., Phan, L., Pruitt, K., Schuler, G., Sequeira, E., Jerez, S., Shumway, M., Sirotkin, K., Slotta, D., Suvorov, A., Starchenko, G., Tatusova, T., Wagner, L., B.ng, Y., Wilbur, W., Yaschenko, E., & Os, J. (2011). Los recursos de base de datos del Centro Nacional de Información Biotecnológica Nucleic Acids Research DOI: 10.1093/nar/gkr1184

Consejo del la Semana: CoGe (La comparación de genomas) revisado

Hice un Coge la punta de la herramienta de, Gevo hace unos dos años y hemos tenido una invitado post sobre COGE de Eric Lyons, el desarrollador principal de CoGe poco más de un año atrás. En nuestra búsqueda constante y ocasionalmente para mantener frescos nuestros consejos (y pasar a SciVee), He decidido volver a COGE y una de sus herramientas. COGE ha cambiado un poco desde la última vez que visitó (ver algunos de los cambios aquí). Hay una nueva interfaz, más documentación y tutoriales muchos más, nuevas herramientas y las interconexiones y genomas mucho más. Me voy a dar una breve introducción a SynMap y va a usar para hacer un análisis de reordenación del genoma (un objeto de una tutorial de texto en el sitio).ResearchBlogging.org

El algoritmo seleccionado en el ejemplo es CUOTA-ALIGN que es objeto de un reciente trabajo, “Detección synteny bloques de comparaciones por pares a través del genoma entero de programación” en BMC Bioinformatics. Como la conclusión de papel los estados:

La CUOTA-ALIGN pantallas algoritmo de un conjunto de bloques de synteny retener sólo aquellos compatibles con un usuario determinado la relación entre dos genomas ploidía. Estos bloques, a su vez, puede ser utilizado para otros análisis posteriores, tales como la identificación de cierto orthologous regiones en las comparaciones interespecíficas.

Y como se mencionó, y verás en este consejo, “CUOTA-ALIGN programa también se integra como un componente importante en SynMap http://genomevolution.com/CoGe/SynMap.pl WebCite, ofrecer un acceso más fácil a miles de genomas para los no programadores.
Espiga, H., Lyons, E., Pedersen, B., Schnable, J., Paterson, A., & Freeling, AbT.l. (2011). Detección bloques de synteny en las comparaciones por pares a través del genoma entero de programación BMC Bioinformatics, 12 (1) DOI: 10.1186/1471-2105-12-102

Hay una base de datos para todo, incluso uber-operones

Yo estaba jugando con Característica nueva citación Google Scholar que me permitió recoger mis papeles en un lugar de fácil (funcionó muy bien, IVA, salvar a algunos problemas técnicos, ver más abajo) cuando me di cuenta de que perdió un trabajo mío de 2000: “Conservación genética contexto de un orden superior a operones.” El resumen:

Operones, conjuntos contiguos co-transcritos y co-regulación de los genes, no están bien conservados en cortos períodos de tiempo evolutivo. El orden de los genes, contenido de genes y los mecanismos de regulación de operones pueden ser muy diferentes, incluso en especies estrechamente relacionadas. Aquí, se presentan varias líneas de evidencia que sugieren que, a pesar de un operón y sus genes individuales y las estructuras regulatorias se reorganizan cuando se comparan los genomas de diferentes especies, Este reordenamiento es un proceso conservador. Reordenamientos genómicos siempre mantener los genes individuales en contextos funcionales y reglamentarias muy específicas. Llamamos a este contexto conserva una uber-operón.

El uber-operón. Fue término sugerido mi PI. Vivir y trabajar en Alemania en el momento, Pensé que era un poco raro. De todos modos, Realmente nunca se expandió más que otro papel más o menos en que la investigación y el tipo de pista si pierde ese papel como resultado en gran parte. He escrito en 'uber-operón’ en google hoy y encuentra que ha sido citado varias veces (88) y, Me pareció interesante: ha habido algunas bases de datos construida de “uber-operones.”

Un grupo de investigadores chinos creó el Uber-Operon base de datos. El papel se ve interesante, pero desafortunadamente el servidor no funciona (si esto es temporal o permanente, No sé), la ODB (Operón base de datos) utiliza uber-operones (que ellos llaman operones de referencia) para predecir operones en la base de datos , Nebulón es otro, HUGO es otro. Lea el capítulo sobre los métodos de cálculo para predecir la uber-operones :)

Sólo es para demostrarles, hay una base de datos para todo.

Oh, y de nuevo a Google Scholar cita. Se encontraron casi todos los periódicos que he publicado, a pesar de que perdió dos (incluyendo el de arriba) y tenía dos falsos positivos. Además, muchas citas que faltan (como el 88 para este trabajo, y muchos otros de otros documentos). Eso no quiere decir que no es útil, Me parece una buena herramienta, pero no es perfecto. Usted puede fmás información sobre Google citación erudito ind aquí, y sobre la Característica similar de Microsoft aquí.

Oh, y que este post me puso en el HumbleBrag Salón de la Fama? Si eso es reservado para Twitter, que tal vez debería twitter esta para que pueda llegar :). (aunque no estoy seguro de señalar las bases de datos relativamente pequeñas un papel relativamente menor constituye presumir, humildad o no LOL).

Consejo del la Semana: SNPTips y visualización de datos del genoma personal

Punta de hoy en día de la semana es el SNPTips. Tuvimos una invitado mensaje sobre esto antes. Por lo general, hacer sugerencias sobre las bases de datos y herramientas de análisis, pero después de recibir los datos de 23andMe, que hemos estado utilizando con frecuencia SNPTips y pensé que podría ser de utilidad para algunos de nuestros lectores. SNPTips fue creado por 5Soluciones am de 23andme* los clientes ver fácilmente sus datos genómicos mientras navega por la web. La punta rápidamente le mostrará cómo instalar la extensión para el navegador y lo que hace. Al final de la punta, Muestro brevemente seguimiento de anotación personalizadas He creado de mis datos con 23andme UCSC Genome Browsers ** Personal SNP del genoma formato. El formato no es perfecto para los datos 23andme (no permite el campo rsid, tiene campos de uso poco con los datos de 23andMe, etc), pero ayuda enormemente si quieres navegar por sus datos con el navegador del genoma. Es, básicamente, tomar los datos de 23andMe que tiene este aspecto:

y reorganizar las columnas, añadir unos cuantos para que se vea así:

Usted puede hacer esto en un programa de hoja de cálculo como lo hice yo, es una mano de obra intensiva poco. Si me decido a hacerlo por mi hija y marido de datos del genoma (que es una posibilidad), Que había creado un script en perl para cambiar el formato (o tal vez hay algo que ya está ahí?).

Básicamente, implica:
*la eliminación de la columna rsid
*reordenar las columnas en el orden correcto
*la adición de “Comisión de Derechos Humanos” que el número de cromosomas
*la adición de cuatro columnas, 1 con el número de alelos, 2 con 0′con (datos de frecuencia de los datos de 23andMe no tiene)
*cambio de los genotipos del xx de x y xy de x / y.

Recuerde también que los datos de posición de 23andMe es crear 36 (2006, HG18) y los genotipos se muestra en los datos de 23andMe están orientados con respecto a la cadena positiva en el conjunto de referencia.

No es la solución más elegante, pero funciona y muy bien con SNPTips. Ha sido bastante adictivo para mí :). Estoy seguro de que hay otras más elegante que se puede hacer.

*OpenHelix y empleados que no tienen ninguna relación comercial o interés económico con 5amsolutions o 23andMe.
**UCSC patrocina tutoriales y divulgación con OpenHelix a través de un sub-beneficiario.

Viernes SNPets

Bienvenido a nuestra colección de enlaces Viernes función: SNPpets. Durante la semana nos encontramos con un montón de enlaces y lecturas que nos parecen interesantes, pero no llegar a una entrada de blog. Aquí están para su disfrute…

Consejo del la Semana: Páginas Galaxy

El consejo de esta semana es una breve introducción a las páginas de Galaxy. Estas son las páginas especiales que los usuarios pueden crear dentro de la Galaxia sistema para anotar, análisis describen y explican diversos realiza utilizando Galaxy. El usuario tiene muchas habilidades para vincular e integrar a la historia, flujos de trabajo y bases de datos, junto con el uso de texto e imágenes y mucho más para anotar completamente los análisis. Como se ha descrito la semana pasada, esta es una de la Galaxia adiciones muchos ha añadido para aumentar la reproducibilidad y la transparencia de la investigación genómica.

Galaxia, un paso hacia la investigación computacional reproducible

ResearchBlogging.org

Galaxy comenzó como una herramienta muy útil para hacer la investigación genómica que era reproducible y compartibles. Una de mis manías en la lectura de trabajos de investigación que utilizan el análisis genómico o de recursos en línea de la genómica es el material y las secciones de métodos. A menudo, los métodos y parámetros utilizados se mencionan sólo de una manera muy superficial, en todo caso. Yo no sería capaz de reproducir la investigación. Este, junto con la capacidad de hacer y compartir fácilmente el análisis, es uno de los Galaxy propósito fundamental ha sido desarrollado y es un muy buen trabajo de ella (Yo soy un poco parcial *).

Los desarrolladores Galaxy han publicado recientemente un documento: “Galaxia: un enfoque integral para apoyar accesible, investigación computacional reproducible y transparente en las ciencias de la vida” en Genome Biology.

Ha habido un par de preguntas o de las funciones que he sentido que Galaxy necesarios para el mejor cumplimiento de la meta de la investigación computacional reproducible y transparente. Una de las cosas que nos han preguntado en talleres sobre el Galaxy ha sido ¿Cuánto tiempo durará "historias’ y los "flujos de trabajo’ persistir. Los desarrolladores Galaxy insistió en que estos persistir indefinidamente (tan indefinido como un mundo en línea puede ser). En este artículo, los desarrolladores de responder a esa pregunta con lo que me parece una muy buena, enfoque amplio de la persistencia:

Estamos llevando a cabo tres estrategias para asegurarse de que cualquier análisis Galaxy y los objetos asociados se puede hacer fácilmente accesible y persistentemente. Primero, estamos desarrollando la exportación y apoyo a las importaciones a fin de que los análisis de Galaxy se pueden guardar como archivos y transferidos entre los servidores Galaxy diferentes. Segundo, estamos construyendo un espacio comunitario donde los usuarios pueden subir y compartir objetos Galaxy. Tercera, tenemos la intención de permitir la exportación directa de páginas Galaxy y los análisis relacionados con las publicaciones que a largo plazo, buscar los datos de archivo, como Dryad.

Otra característica que, aunque sabía que esto iba a suceder, es bueno ver en forma impresa y en el sitio beta, una comunidad de usuarios y herramientas de. Es mencionado en la cita anterior, pero es más que eso. Es una extensión de la capacidad de compartir las historias y los flujos de trabajo:

Para ayudar a los usuarios a tomar decisiones mejores y más rápidas dentro de la galaxia, estamos ampliando el modelo Galaxy de compartir para ayudar a la comunidad de usuarios Galaxy encontrar y resaltar los elementos útiles. Idealmente, la comunidad se identifique historias, flujos de trabajo, y otros elementos que representan las mejores prácticas; mejores elementos de la práctica se puede utilizar para ayudar a los usuarios en sus propios análisis.

El sitio beta le da un vistazo a lo que viene en el “Herramienta Galaxy Cobertizo,” un lugar para subir, herramientas de descargar y compartir para importar en las instalaciones Galaxy. Esperemos que este tiempo se incluyen también la capacidad para votar y discutir las herramientas. Otro aspecto que voy a estar esperando es la posibilidad de compartir flujos de trabajo para una comunidad abierta y más amplia. En este momento no es la capacidad excelente para compartir historias y flujos de trabajo con otros usuarios dentro de su red de colegas, pero me gustaría ver a una comunidad abierta para compartir flujos de trabajo y la tasa. Desde el comentario anterior, parece que está llegando. Será una adición muy bienvenida.

Una última característica añadida que me gustaría mencionar es las páginas:

Páginas Galaxy (Figura 4) son el principal medio de comunicación accesible, reproducible, y la investigación transparente de cálculo a través de Galaxy. Las páginas son documentos personalizados basados ​​en la web que permiten a los usuarios comunicarse sobre todo una experiencia de cómputo, Páginas y representan un paso hacia la próxima generación de la publicación en línea o complementar la publicación. Una página, como una publicación o un suplemento, incluye una mezcla de texto y gráficos que describen además del experimento analyses.In al contenido estándar, una página también incluye elementos Galaxy incrustados del experimento: conjuntos de datos, historias, y flujos de trabajo. Estos elementos integrados proporcionan una capa adicional de la interactividad, con todos los detalles y enlaces adicionales para utilizar los elementos, así.

Probé las páginas (clic “usuario” en la parte superior derecha de la página, haga clic en “páginas” para acceder a páginas). Me gusta la capacidad de escribir lo que básicamente es un métodos y materiales para la biología computacional. Puede describir lo que hizo, historias de integrar, conjuntos de datos y similares. Desafortunadamente, en el momento de escribir este artículo me fue capaz de construir una página, pero no puede ver (error del servidor, Yo últimas versiones de Safari y Firefox en Mac 10.5). Estoy seguro que este es un problema temporal.

Galaxy ha hacer grandes progresos en los últimos dos años y parece destinado a convertirse en una herramienta de go-to para el análisis computacional para los biólogos experimentales. En ese sentido, es posible que desee comprobar fuera de sus tutorial introductorio o screencasts para familiarizarse con la herramienta!

*Renuncia: Los contratos de grupo Galaxy con OpenHelix para proporcionar una clase introductoria sobre el Galaxy (gratuita y abierta a todos los usuarios).

Goecks, J., Nekrutenko, A., Taylor, J., & Team Galaxy, T. (2010). Galaxia: un enfoque integral para apoyar accesible, reproducible, y la investigación transparente de cómputo en las ciencias de la vida Genome Biology, 11 (8) DOI: 10.1186/GB-2010-11-8-R86

Galaxia http://www.galaxyproject.org

Consejo del la Semana: Patología del ratón Genómica

Ok, así que esto no es lo mismo que nuestros consejos habituales. Sin embargo, recientemente he participado en un proyecto de modelos animales que me llevó a este recurso en genómica patología. Cuanto más profunda es que me metí en este proyecto un modelo animal, más claro se veía que una enorme cantidad de datos genómicos que viene va a ser grande–pero sí deben estar vinculados con las correspondientes histología y patología para una comprensión más completa de la biología genómica.

Todos estos proyectos modelo de organismo–ratones knock-out o ratas, ratones mutantes para estudios de cáncer, por ejemplo,, las líneas puras con características específicas y regiones genómicas como la Cruz de colaboración, los animales tratados–necesidad de la calidad de las evaluaciones de la patología. Hay proyectos como el fenotipo Europhenome se hace en grandes conjuntos de animales, y que requieren no sólo de las descripciones normalizadas y ontologías, pero también muestras de la imagen y evaluaciones. En una época en la que todos escanear en torno a todo este software mirando genes y regiones genómicas, tenemos que tener los datos de la patología, así. Y que los datos también deberán ser estandarizados y almacenados en la base de datos de recursos apropiados para los investigadores a encontrar y examinar. Recientemente he escuchado el Dr.. Robert Cardiff hablar de su trabajo en Patobiología del ratón y lo importante que es para capturar la información de una forma estandarizada y se pueden buscar. Él es uno de los impulsores de este proyecto, y entiende perfectamente las necesidades en este campo.

Más personas deberían ser entrenados en la patología a estudiar estos animales. Así que durante este proyecto me impresionó saber acerca de un proyecto de aprendizaje en línea que podría ser útil para las personas que necesitan entender los fundamentos de la investigación con animales y se presentó a importantes aspectos de la patología. Este proyecto ha ganado el premio a la Mejor Educación a Distancia (De mayo 25). Así como un servicio público en genómica Te señalo a este proyecto UC Davis.

Puede echar un vistazo a los antecedentes y objetivos de este de la Centro de Genómica Patología sitio. Desde allí se puede hacer clic en la barra de navegación para UCD sesión informativa para darte una idea de su curso, o haga clic en mi imagen de arriba. Es un buen esfuerzo.

No tenemos relaciones con la Universidad de California Davis o el proyecto de aprendizaje en línea–nos pareció que era un componente valioso e importante para la genómica y quería hablar de ello.