Tag Archives: génome

Astuce Vidéo de la semaine: Grands changements à Ressources NCBI génome


NCBI a été créée en 1988 et a maintenu le GenBank base de données pendant des années. Ils fournissent également de nombreuses ressources informatiques et des systèmes de récupération de données pour de nombreux types de données biologiques. Comme tels, ils savent trop bien à quelle vitesse les données que les biologistes de recueillir a changé et élargi. Comme utilise pour différents types de données ont été développés, il est devenu évident que de nouveaux types d'informations (telles que les métadonnées élargi) doivent être collectées, et de nouvelles façons de manipulation de données sont nécessaires.

NCBI a été adaptée à ces besoins tout au long des années et a récemment été l'adaptation de ses ressources génomiques. La pointe d'aujourd'hui seront basés sur certains de ces changements. Ma vidéo se concentrera sur les “site de Génome complètement redessiné”, qui a été récemment mis en place et annoncé dans le le plus récent bulletin de NCBI. Je n'ai pas trouvé une publication décrivant les changements, mais le bulletin va dans le détail et le L'annonce se trouve en haut du site Génome (& que je signale dans la vidéo) a des détails très utiles sur les changements.

Comme vous pourrez le voir dans l'annonce, l' Génome ressources n'est pas la seule ressource liée à des changements ont subi récemment, incluant le réaménagement de la ressource dans le projet du génome BioProject ressources et la création de la Échantillon biologique des ressources. Je n'aurai pas le temps d'aller dans les détails au sujet de ces deux ressources, mais à la fin de mon post, je vais lien vers deux récentes publications NCBI qui est sorti dans Nucleic Acids Research ce mois-ci – Ce sont de bonnes ressources à lire pour plus d'informations sur BioProject, Échantillon biologique, et sur le NCBI dans son ensemble. Pour une perspective historique J'ai aussi un lien vers la référence du génome d'origine, qui est actuellement en bioinformatique et libre d'accès.

Certains de ces changements sont très intéressants, y compris celle “Enregistrements seul génome représentent désormais un organisme et non un génome pour un isolat.” Les Etats NCBI bulletin “D'importantes améliorations comprennent une organisation plus naturelle au niveau de l'organisme pour procaryotes, eucaryotes, et de génomes viraux. Les rapports incluent des informations sur la disponibilité de l'énergie nucléaire ou procaryotes génomes primaire ainsi que les organelles et les plasmides. ” Il ya aussi une note qui “En raison de la réorganisation d'un système de classification naturelle, identificateurs génome âgées ne sont plus valides. Généralement, ces identifiants génome n'ont pas été exposés dans le système précédent et ont été utilisés principalement pour l'accès programmatique. ” Cela me fait me demander quels changements cela va le mandat à d'autres ressources NCBI, ainsi que des ressources externes. Je n'ai pas vu des annonces sur ce encore, donc je vais devoir rester à l'écoute & vérifier autour souvent.

Profitez de la pointe & nous laisser, ou de NCBI, ce que vous pensez de leurs changements! :)

Liens rapides:

Page d'accueil du NCBI: http://www.ncbi.nlm.nih.gov/

Page d'accueil Entrez Genome Resource: http://www.ncbi.nlm.nih.gov/genome

Page d'accueil Ressources BioProject: http://www.ncbi.nlm.nih.gov/bioproject/

Références:

Historique de référence Entrez Genome: Tatusova, T., Karsch-Mizrachi, I., & Ostell, J. (1999). Génomes complets dans WWW Entrez: représentation des données et l'analyse Bio-informatique, 15 (7), 536-543 DOI: 10.1093/bioinformatics/15.7.536

Barrett, T., Clark, K., Gevorgyan, R., Gorelenkov, V., Gribov, E., Karsch-Mizrachi, I., Kimelman, M., Pruitt, K., Resenchuk, S., Tatusova, T., Yaschenko, E., & Ostell, J. (2011). Bases de données et de BioProject échantillon biologique au NCBI: la capture et de faciliter l'organisation des métadonnées Nucleic Acids Research DOI: 10.1093/nar/gkr1163

Sayers, E., Barrett, T., Benson, D., Bolton, E., Bryant, S., Canese, K., ChT.vernin, V., Eglise, D., DiCuccio, M., Federhen, S., V.olo, M., Fingerman, I., Geer, L., Helmberg, W., Kapustin, Y., Krasnov, S., Landsman, D., Lipman, D., Lu, Z., Rendre fou, T., Madej, T., Maglott, D., Marchler-Bauer, A., Miller, V., Karsch-Mizrachi, I., Ostell, J., Panchenko, A., Phan, L., Pruitt, K., Schuler, G., Sequeira, E., Sherry, S., Shumway, M., Sirotkin, K., Slotta, D., Souvorov, A., Starchenko, G., Tatusova, T., Wagner, L., Wang, Y., Wilbur, W., Yaschenko, E., & Vous, J. (2011). Base de données des ressources du Centre national d'information sur la biotechnologie Nucleic Acids Research DOI: 10.1093/nar/gkr1184

Astuce Vidéo de la semaine: Variation de données Ensembl

Trey m'a présenté à cette “collection de tutoriels vidéo décente de ” d'Ensembl, mais lui et Marie sont actuellement en Maroc enseignement d'un atelier de 3 jours bioinformatique & puis assister à la conférence (oui, Je suis jaloux!). Je suis donc en train de créer la pointe de cette semaine sur la base des tutoriels qui Trey me fait. Dans la pointe d'aujourd'hui, je vais mettre en parallèle un tutoriel disponible à partir de Ensembl sur des informations SNP dans le but à la fois: 1) vous montrer Haw vous pouvez accéder à l'information et de la variation du Ensembl 2) comparez faisant ces étapes en utilisant Ensembl 64 (ici, dans cette vidéo) et en utilisant Ensembl 54 (archivés) (dans la vidéo Ensembl).

Les ressources Bioscience souvent sont continuellement développés et améliorés & il peut être difficile de garder les vidéos et la documentation mise à jour. C'est pourquoi ici nous travaillons en permanence OpenHelix au maintien de nos matériaux mis à jour, avec des conseils hebdomadaires sur les nouvelles fonctionnalités et des tutoriels mis à jour en tant que sites mis à jour deviennent stables.

La vidéo Ensembl (SNP et d'autres variations – 1 des 2) est assez agréable & fournit plus de détails sur les données réelles Ensembl que je peux dans mon court-métrage, mais il a été fait il ya quelques années sur une ancienne version d'Ensembl. Depuis lors, la ressource a été mis à jour, et passé par plusieurs nouvelles versions des données. Je vais suivre les mêmes étapes qui sont faites dans la première partie du tutoriel Ensembl SNP afin que vous puissiez voir des exemples de ce qui a changé & ce qui est pratiquement la même chose. Je vous suggère de regarder les deux vidéos en arrière-arrière pour obtenir une bonne idée de ce qui a changé, et quels types d'informations sont disponibles auprès de la variation Ensembl. De cette base, je suis sûr que vous serez en mesure de regarder la deuxième vidéo Ensembl SNP & l'appliquer à l'aide de la version actuelle de Ensembl sans trop de difficulté. Pour plus de détails vous pouvez vous référer au document Ensembl la plus récente dans l'édition de base de données NAR, qui décrit la variation n'est pas l'information juste, mais comme un tout Ensembl.

Liens rapides:

Navigateur Ensembl: http://www.ensembl.org/index.html

Héritage Ensembl navigateur (communiqué 54): http://may2009.archive.ensembl.org/index.html

Ensembl tutoriel, une partie 1 des 2: http://useast.ensembl.org/Help/Movie?id=208

Ensembl tutoriel, une partie 1 des 2: http://useast.ensembl.org/Help/Movie?id=211

Matériaux OpenHelix tutoriel Ensembl: http://www.openhelix.eu/cgi/tutorialInfo.cgi?id=95

Liste Tutoriel Ensembl: http://useast.ensembl.org/common/Help/Movie?db=core

Référence:
Flicek, P., AkenBallester, B., Ballester, B., Beal, K., Bragin, E., Brent, S., Chen, Y., Clapham, P., Coates, G., Fairley, S., Fitzgerald, S., Fernandez-Banet, J., Gordon, L., Comte, S., Haider, S., Hammond, M., Howe, K., Jenkinson, A., Johnson, N., M.hari, A., Keefe, D., Keenan, S., Kinsella, R., Kokocinski, F., Koscielny, G., Kulesha, E., Lawson, D., Longden, I., Massingham, T., McLaren, W., MegF. / Span>, K., OverdG.n, R., Pritchard , K., Overduin, B., Pritchard, B., Rios, D., Ruffier, M., Schuster, M., Slater, G., Smedley, D., Spudich, G., Tang, Y., Trevanion, S., Vilella, A., Oiseaux, J., Blanc, S., Wilder, S., Zadissa, A., Birney, E., Cunningham, F., Dunham, I., Durbin, R., Fernandez-Suarez, X., Forgeron, J., Hubbard, T., Parker, A., Procureur, G., Smith, J., & Searle, S. (2009). 10e année de Ensembl Nucleic Acids Research, 38 (Base de données) DOI: 10.1093/nar/gkp972

Quelle est la réponse? Open Thread (GWAS génotypage)

Biostar est un site pour poser des, répondre et discuter de questions bioinformatique. Nous sommes membres de la communauté et trouve cela très utile. Souvent questions et réponses se posent à BioStar qui se rapportent à nos lecteurs (les utilisateurs finaux des ressources en génomique). Chaque jeudi, nous mettrons l'accent sur l'une de ces questions et de réponses ici, à ce fil. Vous pouvez poser des questions sur ce sujet, ou vous pouvez toujours participer à au BioStar.

Question de la semaine:

Combien de le génome est capturé par un GWAS?

Deux grandes réponses à cette question, une citation de la première. Cliquez sur le lien ci-dessus pour plus de.

Génome humain code 1 SNP/100-300bp; ~ ~ 3Go séquences SNPs 10millions. Il est impossible d'analyser un nombre important de données en raison de plusieurs facteurs limitants. Pour faire face à ce problème, nous pouvons utiliser déséquilibre de liaison (LD) cartographie (Voir la section sur D ', taux de recombinaison), Haplotype, Blocs d'haplotypes et Haplotype SNP Tag (tagSNPs). (Lisez à propos du projet HapMap ici). Au lieu de génotypage SNP tous les 10M, nous pouvons le génotype tagSNPs dans un bloc d'haplotypes. C'est un représentant du SNP dans une région donnée du génome à haute LD. Cela permettra de trouver la variation génétique, sans génotypage SNP tous les 10M. Des études antérieures ont indiqué que le génotypage jetons avec 0,5 M-1M SNP sera suffisant pour une bonne GWAS.

Mole Rat nu, un autre jour, un autre génome

L' dernière génome être achevé est le rat taupe nu (Glaber Heterocephalus). Maintenant, pourrait-il y avoir une glacière (si laids) mammifères sur la planète? C'est l'un des deux seuls mammifères réellement eusociaux dans le monde, il vit jusqu'à 28 de longues années (ma fille chez le rat, aucune relation, n'a vécu que 3 ans) et est étonnamment résistante à beaucoup de maladies.

Alors, pas étonnant que le génome a été séquencé. Peut-être que nous pouvons apprendre certaines choses sur le comportement social et la longévité.

Bien sûr, il est une ressource pour elle à http://www.naked-mole-rat.org/ si elle est fondamentalement juste un serveur de souffle et quelques téléchargements. Je compte jusqu'à nos jours il est disponible à UCSC ou Ensembl :D. J'ai quelques gènes, je suis intéressé à comparer.

Astuce de la semaine: Génome Conversion Coordonnées

Je l'ai fait pointe de plus de deux ans et je suis le relisant aujourd'hui, avec des informations un peu plus, le SciVee (il est donc partageable) et mises à jour. J'ai été mise à jour de notre Galaxy tutoriel et que la pointe a été l'un des plus twitté, Conseils partagé et visité que nous avons fait (pas le plus, que l'un des), donc pensé maintenant serait un bon moment pour y revenir. Cette astuce va passer par la L'outil Galaxy à “seuil de chargement” génome coordonnées entre les assemblées et les génomes. Vous pourriez également visiter quelques outils et d'autres endroits où vous pouvez convertir les coordonnées du génome entre les assemblées du génome comme le UCSC Genome Browser du seuil de chargement d'utilité (l'accès qui pointent du “utilitaires” menu sur la page d'accueil, il utilise un chaîne de conversion de fichiers), FlyBase (pour D. melanogaster génome), Maker (un outil d'annotation du gmod qui inclut un outil de conversion de l'Assemblée), Ensembl Assemblée convertisseur, et je suis sûr qu'il ya d'autres. At-à signaler? Comme le commentaire ci-dessous nous informe, il ya aussi NCBI nouveaux services remappage dont des cartes entre les assemblées (au sein des espèces) et entre les séquences et les assemblages RefSeq.

Un mot sur la méthodologie, comme mentionné au premier alinéa, Outil de seuil de chargement UCSC Genome Browser utilise des fichiers de conversion de la chaîne. Je suis pas sûr de la méthodologie utilisée au Galaxy mais je suppose que c'est similaire. J'ai une question à l'intérieur et mettra à jour cette page lorsque je connais la réponse.

En effet, il est. J'ai reçu une belle réponse de l'équipe de soutien Galaxy:

Le programme du seuil de chargement et le fichier de mapping sous-jacente provient de UCSC et est basé sur leur “Chaîne / Net” algorithmes comparative du génome.

Les données représentent les régions du génome synténiques pour les deux génomes de référence impliqués. Les gènes similaires avec annotation, entre les espèces étroitement apparentées, trouve dans ces régions synténiques ont de bonnes chances d'être orthologues, mais la fonction du gène n'est pas considéré par l'algorithme et devrait être évalué de manière indépendante pour confirmer orthologie.

Cette discussion liste de diffusion sur le projet Génome UCSC navigateur serait un bon endroit pour en apprendre davantage sur les détails:
https://lists.soe.ucsc.edu/pipermail/genome/2008-March/015810.html
Contacter l'équipe directement à genome@ucsc.edu est également une option si vous avez une question précise sur l'algorithme.

Espérons que cela aide!

Gobbler génome

Pour ceux d'entre vous qui ne sont pas américains observateurs Thanksgiving, La Turquie est le plat principal de choix pour la plupart des Américains pour cette fête de la moisson. Il ya deux ans Mary rapporté le génome Turquie était sur son chemin. Eh bien, c'est à propos que le Turquie génome est presque complète (Sur du papier de PLoS en Septembre) et prêt pour la fête de Thanksgiving de cette année!

Yum, miam.

Une actuelle BMC Genomics document révèle qu'il ya eu de multiples réarrangements intrachromosomique entre le génome de dinde et le poulet une. Je suppose qu'on peut dire que la dinde est juste un poulet qui a été reconfiguré? (hattip: Daily numérisation)

Avec ces publications, vous avez quelques uber-geek du fourrage pour prouver à votre famille que vous êtes bien une biologie ballot.

Parlant de poulets et de dindes… quand je vivais en Corée, en 1980 mes amis américains et j'ai eu du mal à trouver une dinde (Coréens pensaient qu'ils étaient laids). Nous avons finalement trouvé une ferme qui les ont élevés pour les militaires américains et des expatriés. Nous sommes allés là-bas et ramassé le plus grand qu'ils avaient, il était une tête hideuse au-dessus du reste de. Nous avons pris, direct, dans une boîte sur un 1 heures de bus trajet de retour sur le marché près de notre maison avec les Coréens à regarder nos horribles têtes boîte comme nous étions fous (peut-être nous ont été?). Nous l'avons pris à un boucher de poulet incrédules et quand nous sommes revenus pour notre dinde expédiées et deheaded, Il a eu pitié de nous et nous a donné deux gros poulets. Quand nous avons vu la dinde pathétiques, nous avons compris pourquoi le boucher a insisté sur gifting nous deux poules: la dinde, aussi grande qu'elle a été, avait pas de viande sur elle.

Eh bien, Nous deux poulets rôtis Thanksgiving (et a fait une tarte à la citrouille d'une citrouille, nous avons trouvé au marché.. le pourvoyeur de la pensée que nous étions fous de manger une citrouille, ils étaient pour la décoration!).

Anyhoo, une anecdote longtemps que va juste pour montrer que peut-être un poulet en effet suffire, car ils sont des oiseaux juste réarrangé (mais je me demande où la tête de la Turquie venaient de la volaille?)

SNPpets vendredi

Bienvenue à notre décharge vendredi lien fonction: SNPpets. Au cours de la semaine, nous avons rencontré beaucoup de liens et de lectures qui nous paraissent intéressants, mais ne pas se rendre à un billet de blog. Ici, ils sont pour votre plaisir…

Astuce de la semaine: Comparaison Gevo et Génome

gevo_thumbLa pointe du jour de la semaine présente un nouveau (de nous) outil pour les comparaisons génomiques. Nous sommes tombés sur cet outil de lecture sur un blog à James et du maïs Géant (excellent blog) autour d'un comprendre à partir de sa proposition de recherche. Voir, il ya des raisons de lire les blogs :D. L'outil qu'il utilise pour créer ce chiffre et d'analyse est Gevo à Prenez qui dispose de plusieurs outils utiles, en plus de Gevo. Dans la pointe du jour de la semaine, nous allons jeter un coup d'œil à James’ chiffre à Gevo et introduire Coge. Check them out, ils ressemblent à des outils bien utiles. (et pendant que vous y êtes, consultez James’ blog. Tidbits comme celui-ci et des discussions intéressantes faire en vaut la peine.)

RetroDogs

nr_Bassett-DachshundJ'ai eu un Basset Hound grandir. Son nom était inutile, Inutile S. Grognement. Eh bien, En fait, il a été officiellement Ulysses S. Grant parce que le Kennel Club américain n'accepterait pas S Useless. Grunt comme un nom comme ils estimaient qu'il était trop humiliant. Pas sûr, si ils estiment qu'il est humiliant pour le chien ou le président, mais ce n'est ni ici ni là est-il?

Alors,vous demandez, ce qui m'a fait penser à ce chien long passé sucré qui a trébuché sur son oreille trop longtemps avec ses jambes trop courtes? Il s'avère qu'ils ont découvert ce qui cause génétique il y avait pour ces jambes courtes dans les bassets (et teckels et autres races).

Comme l'affirme le communiqué de presse du NHGRI:

Dans une étude publiée dans l'édition en ligne avant de la revue Science, les chercheurs dirigé par le NHGRI Elaine Ostrander, Ph.D., Les échantillons d'ADN à partir examinés 835 chiens, y compris les 95 avec des jambes courtes. Leur étude de plus de 40,000 marqueurs de la variation de l'ADN découvert une signature génétique exclusif à pattes courtes races. Grâce à un séquençage d'ADN de suivi et les analyses computationnelles, les chercheurs ont déterminé les chiens’ membres disproportionnée courts peuvent être attribués à un seul événement mutationnel dans le génome canin – une insertion d'ADN – qui a eu lieu tôt dans l'évolution des chiens domestiques.

L'insertion se révèle être une retrogene, ce qui bien sûr je trouve également intéressant que j'ai étudié les éléments retrotransposable. La transcriptase inverse est cette habitude de renverser l'ARN transcrit en ADN, qui peuvent obtenir réinséré retour dans le génome (donc pseudogènes traitées bien sûr).

L'étude est intéressante pour deux raisons (autres que parce que j'ai eu un Basset Hound et a étudié l'évolution de la rétroéléments ;), il nous donne un indice supplémentaire sur les événements évolutifs qui conduisent à de grands changements dans la morphologie et le rôle de la rétrotranscription et il nous donne un indice sur d'éventuelles conditions humaines.

Pour plus au sujet du génome de chien, vous pouvez lire notre slusieurs messages sur le génome canin, aller à NCBI chez le chien génome site (ou UCSC ou Ensembl et d'autres navigateurs) et lire l'article (a besoin d'un abonnement de parcours, c'est dans Science). C'est une lecture intéressante à ce jour (Je veux trouver un peu de temps pour le lire plus en détail, Inutile sans doute pas à la hauteur de son nom.. il n'a pas vraiment, même alors, :D).

Cold génomes

coldvirusRécemment,, nous apprenons beaucoup de choses sur le virus du rhume. Les génomes de plusieurs ont maintenant été séquencé (qui est un rapport scientifique sur abonnement requis, vous pouvez lire plus sur le rapport ici).

Vous pouvez trouver plus d'information génomique à la picornaviridae.com à la NCBI Entrez génomes de et quelques informations structurelles au MMDB. (juste une remarque, rhinovirus est maintenant classé comme entérovirus).