태그 아카이브: 데이터베이스

무슨 대답이야? 데이터베이스 예외

Biostar 질문에 대한 사이트입니다, 응답 및 생물 정보학 질문에 대해 논의. 우리의 회원 커뮤니티는 매우 유용한 찾아. 자주 질문 및 답변은​​ 우리의 독자들에게 밀접한 관계가있는 것을 BioStar에서 발생하는 (게놈 자원의 최종 사용자). 매주 목요일은 우리가이 스레드 여기에 그 질문 중 하나이며, 답변을 강조합니다. 당신이이 스레드에 질문을 할 수, 또는 당신은 항상 BioStar에 참가할 수.

주간 질문:

주요 데이터베이스에 특이한 / 잘못된 항목 (GenBank, UniProt, GDP)? 피에르 Poulain은 묻습니다 ” 에… 이러한 데이터베이스에 그들이 찾을 수있는 데이터와 함께 신중을 기해야 내 학생들에게 조언. 이것을 설명하기 위해, 나는 GenBank에 아주 독특한 항목을 찾을 수:..” 그리고 그 다음 좋은 것들을 나열.

몇 가지 흥미가 있었다, 재미있는, 우리의 메리에서 하나를 포함하여 답변,

내가 제일 좋아하는 기괴한 데이터베이스 항목은 PubMed 하나. 그 NCBI ROLF 블로그가 생성되기 전에이 오래되었습니다. 나는 회색 머리로의 전환에서 확인된 유전자를 찾고 있었어요. 이것은 유용하지되었습니다….

http://www.ncbi.nlm.nih.gov/pubmed/12079806

이다 제목 (참고, 추상 없습니다):

저는 64 세의 남자입니다, 그리고 난 항상 완벽한 의료 기록 자랑 스러웠다. 또 머리카락 내 전체 머리 자랑 스러웠다, 회색에서 기어 오르나 시작 이후에도. 넉 달 전에 폐렴에 걸려 병원에 8 시간을 쏟았다 (집중 치료 세). 그것은 좀 걸렸어요, 하지만 정상으로 돌아 마침내 – 내 머리 밖으로 떨어지는 것을 제외하고. 언제 샴푸 또는 빗을 그것은 대단히 짧은 시간에 밖으로 나오는 사람, 그리고 온통 눈에 띄게 얇은 할거야. 당신의 뉴스 레터에 Propecia에 대해 읽고 기억하지만 오래된 문제가 없습니다. 나는 약물을 시도해야?

연구자는 항상 데이터를 다시 확인해해야하는 이유에 대해서 좋은 예제에 대한 다른 답변을 확인.

모든 데이터베이스가, 심지어 uber - operons

나는 주변에 놀고 있었는데 Google 학술 검색의 새로운 인용 기능 그게 날 쉽게 한 장소에 서류를 수집 금지 (꽤 잘 작동, 부가 가치세, 몇 가지 결함을 저장, 아래 참조) 제가 발견했을 때부터 내 논문을 놓친 2000: “operons보다 높은 순서의 유전자 컨텍스트 보존.” 추상:

Operons, 유전자의 공동 베꼈는데 및 공동 규제 연속 세트, 좋지 진화 시간 짧은 기간 동안 보존 아르. 유전자 순서, 유전자 내용과 operons의 규제 메커니즘은 매우 다를 수 있습니다, 도 밀접한 관련이 종에. 여기에, 우리가 그 제안 증거 여러 라인을 제시, 여러 종의 genomes을 비교하면 오스 오 페론과 그 개인의 유전자 및 규제 구조 뜯어 있지만, 이 다시 정리하기는 보수 과정. 게놈 rearrangements는 결국에 매우 구체적인 기능 및 규제 상황에서 개별 유전자를 유지. 우리는이 보존되어 문맥 uber 오스 오 페론 전화.

uber - 오스 오 페론. 그건 내 PI의 제안 임기되었습니다. 생활 당시 독일에서 근무, 나는 장난 이겠지 생각 했었는데. 어쨌든, 정말 종이 훨씬 결과 여부를 분실 추적의 연구와 종류의 다른 종이 정도 이상으로 확대 적이. I는 '위버 - 오페론 입력’ Google에서 오늘과 그것이 몇 번 언급되어 있다고 발견 (88) 및, 이 재밌는 걸 발견: 지어진 몇 가지 데이터베이스를이되었습니다 “uber - operons.”

중국 연구 그룹을 만들어 Uber 오스 오 페론 데이터베이스. 신문은 재밌, 하지만 불행히도 서버가 다운 (이것은 일시적 또는 영구 여부, 나도 몰라), the ODB (오스 오 페론 데이터베이스) uber - operons를 사용 (그들은 참조 operons를 호출하는) 데이터베이스에 오페론을 예측하기 , Nebulon 또 다른입니다, 휴고 또 다른입니다. 을 읽고 광고계산 방법에 hapter uber - operons을 예측하는 :)

그냥 보여갑니다, 모든 데이터베이스가.

오, 다시 Google 학술 검색 인용하기. 내가 발행하신 거의 모든 종이를 찾았어요, 그것은 두보고 싶었지만 (위에도 포함) 두 잘못된 반응을했다. 또한, 많은 인용이 누락되었습니다 (같은 88 이 문서에 대한, 다른 신문에서 및 다른 많은). 그것이 유용하지의 말씀 아니에요, 정말 좋은 도구를 찾을 수 있지만 그것은 완벽 하진. 당신은 F 수여기에 Google 학술 검색 인용에 대해 더 많은 공업, 약 여기에 마이크로 소프트의 이와 유사한 기능.

오, 이 게시물에 나를 넣어 않습니다 명예의 HumbleBrag 홀? 트위터용으로 예약되어 있다고한다면, 아마 제가 트위터해야보다 너무 거기 얻을 수 :). (확신을 기반으로 비교적 적은 데이터베이스를 지적 아니에요하지만 비교적 작은 종이 자랑을 구성, 겸손 여부 LOL).

“무슨 대답이야”

Biostar 질문에 대한 사이트입니다, 응답 및 토론 생물 정보학 의문

와. 우리는 지역 사회의 구성원이며 아주 유용한 찾아. 자주 질문 및 답변은​​ 우리의 독자들에게 밀접한 관계가있는 것을 BioStar에서 발생하는 (게놈 자원의 최종 사용자). 매주 목요일은 우리가이 스레드 여기에 그 질문 중 하나이며, 답변을 강조합니다. 당신이이 스레드에 질문을 할 수, 또는 당신은 항상 BioStar에 참가할 수.

오늘의 질문 및 답변입니다:

추천 쉬운 소프트웨어를 클러스터링 microarray를 사용하여

가장 높은 투표 대답 (추천 스레드를 게시 저자였습니다):

내 즐겨 찾기 중 하나는 MEV 마이크로 어레이 데이터 분석 도구. 그것은 사용하기 간단하고 기능이 매우 큰 숫자를 가지고.

작품 잘 데이터의 모든 유형을위한. 당신은 또한 단순한 텍스트 형식에있는 파일에서 그것에 데이터를 로드할 수 있습니다:

GENE1, 값, value2 GENE2, 값, value2

좋아하는 클러스터링 도구를 올려주십시오.

다른 여러 가지 훌륭한 도구가 제안되었습니다, 당신이 그들을 여기에서 확인할 수 있습니다.

진짜 bioinformaticians는 코드를 작성, 진짜 과학자…

바로 일주일 전에 끝났어, 닐 손더스가 내가 동의 게시물을 썼습니다: 진짜 bioinformaticians는 코드를 작성. 게시물이 시작되는 짹짹 대화에 대한 응답으로되었다:

# 많은 biostar 질문에 "나는 리소스를 찾고 있어요 ..."시작. 대답은 당신이 가지고있는 데이터를 사용하여 솔루션을 코드를 필요가 종종.

그 말이 맞아, 그 누구 그가 말하고에게 bioinformaticists 매우 사실이야. 내 관심사는 생물 학적 연구의 나머지 부분입니다. 그는 포스트에서 미국:

다른 말로하면: 데이터 원본을 알고, 올바른 도구를 알고 그리고 당신은 항상 자신의 상황에 대한 해결책을 조각 수 있습니다.

이것은 매우 사실 난 전체 동의 heartedly. 너무도 많은 솔루션은 데이터베이스와 분석 도구의 수천에 이미 존재. 우리가 OpenHelix에서 일을하는 거였구나, 실험 생물학 도움, 게놈 연구와 bioinformaticists이 바로 데이터 소스와 도구를 찾은 다음 이동 “자신의 상황에 대한 해결책을 조각.”

제 댓글의 마지막 부분에서,

BioMart, UCSC 게놈 브라우저, 은하, 등등, 비록 훌륭한 도구와 데이터 소스 아르 아마 대답 수 80% 대부분의 포즈 질문 :). 하지만 내 주의해야 할 점은 데이터 소스 및 오른쪽 도구를 아는 발굴 작업 약간의 수있을 것이다.

그리고 그것은, 다소 거절 반응에도 불구하고 :). 우리는 모든 그래프를 봤어요, 기하 급수적으로 시간에 따른 데이터 양의 증가. 그것으로 문제가있어 크로니클 고등 교육 문서 제목 상태:

데이터를하여 채였어: 과학자들은 홍수 물에 연구라고 말해

저널 과학은 또한 전체 있었 10 기사 섹션 문제에. 그것은 사라질거야 문제가 아니에요.

데이터의 홍수와 함께, 데이터베이스 및 데이터 분석 도구의 홍수가왔다 (bioinformaticists에 의해 대부분 생성!), 많은 중 _alone_ 꽤 이내 오른쪽 데이터 및 도구를 찾는 발굴 아르. 수천 같은 데이터베이스 및 도구가 있습니다. 난 잊었어요.

닐 손더스가가 정확한지. 이 솔루션은 거기서, 올바른 도구와 데이터를 찾을 수, 해결책을 조각. 그는 내 코멘트에 응답 “학습 당신은 확실히 발굴 수있는 생물 정보학에 알고 싶습니다. 그런데, 과학 용되지 쉽게 daunted :-).” 다른 말로하면, “당신이 daunted있다면, 당신은 과학자 aren'ta?”

하버드 등 다양한 우리는 모로코에 미국에 싱가포르에서 세계의 연구자 워크숍을 제공하고 기관에서, 스탠포드, 미주리 대학교, 후지산. 시나, Stowers과 허드슨 - 알파. 우리는 워크샵을 주었어과 대답도 다양했다으로부터 질문을 연구자, 발달 생물학, 진화적인, 의학 연구자, bioinformaticists, 연구자들은 꽤 잘 게놈에 정통한 이들 없습니다.

우선 주제는 찾는하고 데이터를 알면서하고있는 도구는 발굴되지 않습니다, 하지만 때로는 불가. 그들은 존재하지 않기 때문에, 하지만 찾는 그들을 알고 있기 때문에 찾아 아는 것들 분야를 성장 전단을 고려하여 개인과 연구소 자원의 배수이다. 전 크로니클 기사에게 인계할… 데이터 익사..

그들은 쉽게 daunted 아니 진짜 과학자 아르, 하지만 그냥 같은 daunted, 그들 앞에서 뭐야으로. 그리고 예, 구체적인 연구의 요구에 그 구체적인 질문의 대부분은 기존의 도구가 될 수 응답. 우리는 잘 만들어진 데이터베이스 검색 또는 분석 단계는 답변 것이라는 Biostar에 대한 많은 질문 건너 온 아름답게, 더 많은 코드로기구를 reinventing 필요없이 (그리고 그 해답이 코드가 종종).

스스로 'bioinformaticists 거기 전화 누군지 알아 내가 그 과학자의 대부분은 의심” 도구의 이해를해야하고 그들에게 가능한 데이터베이스 (하지만 내가 말할 수, 심지어 그들의 똑똑한하지 가끔). 그래서, 조언 및 링크된 블로그 게시물 상기의 최종 단어…

다른 말로하면: 데이터 원본을 알고, 올바른 도구를 알고 그리고 당신은 항상 자신의 상황에 대한 해결책을 조각 수 있습니다…. 진짜 bioinformaticists는 코드를 작성

예, 진짜 bioinformaticists는 코드를 작성, 하지만이 조언은 다른 부족 90% 안의 실제 과학자. 아마도 Biostar는 해결책이 아냐 (내가 그 질문을 많이 그가 밖에만있는 건 아닌 bioinformaticists에 의해 그 아르 포인트 요청을 받고 용의자 기본, 어떤 경우에는, 누구 할 사람들에게 코딩이나 액세스 지식). 아마도, 맘에이나 뭐, 수.

금주의 팁: PhylomeDB

진이 phylogenies (같은 종의 phylogenies 반대) 매우 결정 유전자 기능에 유용할 수 있습니다, 역사, orthology 및 paralogy 예측. PhylomeDB (링크 추가!) 유전자 계통의 데이터베이스입니다 (또는 그들을 호출로, Phylomes.. 'omes에 끝이 없다? :). 현재 인간과 효모 같은 종 같은 phylomes가 12 명이 넘는 없습니다. 데이터베이스는 유전자 ID 또는 폭발을 기반으로 유전자의 phylogenies를 얻을 수 있습니다, 당신은 또한 orthology 예측과 정렬 및 자세한 내용을 얻을 수. 오늘의 팁 데이터베이스에 당신을 소개합니다.

새로운 NCBI 이미지 데이터베이스

메리 최근 논문을 올렸어 에 대해 우리가 놓친 어떤 때 데이터 마이닝 서류: 인물과 피겨 전설.

입력 NCBI 이미지 데이터베이스. 바로이 새로운 데이터베이스가 이상 포함 3 전체 텍스트 리소스에서 발견되는 만 이미지 (나. PubMed 중앙) NCBI에서. 그래서, 내가 검색을 했어 “drosophila의 phylogeny” 그리고 좋은 이미지와 인물을 발견. 그 결과는 그림을 당겨하지 않습니다, 뿐만 아니라 그림의 전설. 내가 잊어 버렸다고 200 검색 결과. 검색 결과 피겨 제목에 링크가 그림에 직접 데려다. 아래는 전설이 전체 텍스트에 대한 링크를 볼 수 있습니다. 그것은 위대한 시작 검색 인물과 피겨 전설에.

이와 함께, PubMed 검색 결과 지금은 개선됩니다 이 데이터베이스에서 이미지와 (면, 기억, 문서 전체 텍스트 리소스에 있습니다.. 하지만 시간의 경과에 연구가 많이와 출판

NIH의 자금이 그들이되지 않습니다 간다?). 예를 들어, 이 신문에 추상로 이동 “비교 toxicogenomics 데이터베이스에 대한 화학 유전자 - 질병 네트워크의 텍스트 마이닝 및 수동 curation.” 아래로 스크롤 조금, 이 논문의 수치를 나타납니다, 어느되었습니다 가지고 NCBI 이미지 데이터베이스에 입금. 당신은 모든 숫자 또는 서류에 대한 링크로 바로 이동할 수 있습니다.

물론 이죠, 명시된 바와 같이, 모든 기사는 데이터베이스에서 이미지를 가지고되지 않습니다, 단지 그 PubMed 중앙에 입금. 저널하지 않기 때문에 당신은 당신의 검색 많이 본 이미지 스트립이되지 않습니다 찾을 수 없습니다 예치 . 하지만 함께 3 매일 PMC 갈 만 이미지와 더 많은 저널 기사, 이 데이터베이스 및 PubMed의 기능은 매우 유용하다는 것을 증명 수도.

Hattip: APD에 CTD :)

우리는 위젯이 있어요

난 이해가 안가 언급된 기타’ 위젯 전에. 그들은 콘텐츠와 유용한 대화형 검색을 추가하는 웹사이트와 블로그에 매우 편리한 도구가 될 수 있습니다, 등등.

음, 우리는 이제 우리 자신을 가지고. 저희 독자의 대부분은 알고, 우리는이 연구자들이 가장 자신의 필요에 맞게 데이터베이스 또는 분석 도구를 찾을 수 유전체학 및 생물 정보학 검색 엔진. 용어를 입력하고 당신은 관련성 순위에 대기 아르 게놈 자원의 목록을. 또한, you are shown where i또한pan> (리소스 웹 사이트, 또는 자습서 또는 블로그에있는 경우가) 용어를 찾을 어디. Additionally, you’ll find tutorials we’ve … (리소스 웹 사이트, 또는 자습서 또는 블로그에있는 경우가) 용어를 찾을 어디. 또한, 당신은 우리가 거​​의에서 만든 자습서를 찾을 수 100 그들의, 사용자에게 무료로 다스에 대해 PDB와 같은, SGKB, UCSC 게놈 브라우저, 및 다른 80 정도 가입하여.

어쨌든, 지금 검색을 넣을 수 (물론 어떤 공개 가능) 블로 그나 우리가 방금 만든 했어 하나 위젯을 사용하여 웹 사이트에 (에 의해 같은 사람 누가 데이터베이스 검색을 만드는 데 도움). 우리는 세 크기를 가지고 있으며이 페이지에서 그들과 그들에 대한 코드를 찾을 수 있습니다.

당신은 또한 제가 블로그에 여기 오른쪽 열에에있는 작은 위젯을 넣었습니다 나타납니다. 거기에 검색어를 넣고 그것을 테스트할 수 있습니다. 이것은 Google 검색 결과와 함께 다른 페이지가 열립니다. 한번 사용해보세요!

금주의 팁: 전파, Variome의 웹 분석

주의 오늘의 팁에 짧은 소개 전파, 또는 Variome의 웹 분석. 이 도구는 최근 우리에게 도입되었다, 그리고 난 인간의 변화를 분석하는 그것 도구 연구자에게 제공하는 환영 소개 찾았다. 이것은 때마침 우리가 개인 게놈의 임상 평가에 대한 논의했던 최근 신문을 고려하고있다 (여기에, 여기에여기에) 및 맞춤 의학을위한 서류를 의미 및 온라인 유사 자원의 사용. 파도가 또한 나도 인식되지 않은 것 몇 가지 추가 도구 날을 도입하였습니다, 또는이 사용되지 않습니다, 어느과 같은 사용이 될 수도: LOVD (라이덴 열기 유사 데이터베이스), QuExT (검색어 확장 도구, 같은 개발자도 전파로부터), 외. 물론 또한 Ensembl에서 가져온 데이터베이스 정보가 없습니다, Reactome, KEGG, InterPro, GDP는, UniProt, NCBI 등 다수. 그것을 체크 아웃 시간을 가져봐.

손님 포스트: 잘라의 새로운 도구, CNV 워크숍 – 소녀 Xiaowu

우리의 지속적인 세미 정기적인 게스트 포스트 시리즈에있는이 다음 게시물 Xiaowu 소녀부터, the 잘라에서 생물 정보학 코어 감독 . 당신은 무료로 제공하는 경우, 공개 게놈 도구를 사용할 수, 데이터베이스 또는 리소스와 손님 게시 기능을 사용자에게 뭔가를 전달하고 싶습니다, wlathe는 AT의 openhelix에 않아서 co.kr로 문의 주시기 바랍니다.

를 실행하기위한 메리에게 감사 주의 팁 - "잘라 CNV 데이터베이스" 다시 몇 달. 잘라 CNV 데이터베이스는 많은 수의 사본 번호 유사 고해상도의 게놈 전체 설문 조사입니다 (2,026) 분명히 건강한 개인의. 그것은 공개적으로 액세스할 수 있습니다 널리 연구 그룹의 다수에 의해 사용되었습니다 전세계. 난 이제 뒤에 우리의 소프트웨어 시스템의 공개를 발표 기쁘게: CNV 워크숍. CNV 워크숍은 우리가 몇 년 지난 동안 개발한 소프트웨어 도구의 모음입니다. 그것은 분석을위한 포괄적인 작업 흐름을 제공합니다, 관리, 그리고 게놈 복사 번호 편차를 떠올리 (CNV) 데이터.

그것은 모두 개인의 샘플과 일대 연구에 대해 다음 기능을 제공함으로써 거의 모든 CNV 연구 또는 임상 프로젝트에 사용될 수 있습니다:

CNV 식별
구현 잘못된 반응을 감소 바뀌었 원형 이진 분할 알고리즘을
감도 / 특이성 관리를위한 완전 구성 가능한 매개 변수
주석
위치와 같은 개별 현장 특정 주석, 변화의 종류, 통화 통계, 및 기타 데이터의 CNVs과 중복이 세트, 게놈 변종의 데이터베이스를 포함.
영향을받는 유전자와 같은 기능성 유전자 주석과 알려진 질환 협회
수용 사용자가 제공하는 주석
프레 젠 테이션
GBrowse 단추 질의에 대한 영상을 활성화, 검색, 통역, 그리고 CNVs보고
Excel로 결과 내보내기, XML을, CSV로, 침대 파일
UCSC 게놈 브라우저 같은 공공 자원에 대한 직접 링크, NCBI Entrez, Entrez 진, 그리고 우화
프로젝트 및 계정 관리
인증 및 특히 임상 진단 설정하는 데 유용합니다 허가 제도
내의와 프로젝트 사이에 분석 결과 공유
간단한 웹 기반 관리 인터페이스
원격 액세스 및 관리 활성화

CNV 워크숍은 현재 Illumina의 550k의 배열 데이터를 genotyping 허용, 610- 및 660 - 쿼드, 그리고 옴니 배열, 함께 Affymetrix의와 5.0 및 6.0 배열, 쉽게 다른 플랫폼에서 데이터를 허용하도록 구성할 수 있습니다. 패키지는 이상에서 공개된 레퍼런스 데이터와 탑재 온다 2,000 건강한 제어 과목 (이 CNV 데이터베이스를 잘라). CNV 워크샵은 또한 사용자가 주석과 프레 젠 테이션에 이미 처리 CNV 호출을 업로드하실 수 있습니다.

소프트웨어 패키지는 자유롭게보실 수 있습니다 HTTP를:/// cnv sourceforge.net / 프로젝트 /. 또한 좀더 상세한에 설명되어 있습니다 BMC는 생물 정보학에 대한 최근 신문.

-소녀 Xiaowu

앞에, 손님 게시물

인사! OpenHelix 블로그는 새로운 반 주간 기능을 instituting입니다. 우리가 매주 수요일 우리의 “금주의 팁,” 목요일에 우리가 우리의 “너의 문제는 무엇입니까,” 지금은 가끔 화요일은 우리가 가진거야에 대한 “공급자 손님 게시할 수 있습니다.” 이들은 게놈 도구와 데이터베이스의 제공자의 게시물 것입 의견 것입니다, 업데이트 및 리소스의 기능을 곧, 어떤 리소스의 공급자가 사용자에게 전달하고 싶습니다. 우리가 앞으로 몇 주에 출전한 여러, 그래서 다시 검사 계속.

또한, 당신은 개발자 또는 무료로 제공하는 경우, 공개 게놈 또는 생물 자원, 데이터베이스 또는 분석 도구는 우리의 손님 기능에 게시하고 싶습니다, 그것은 당신의 도구로 소개되고, 곧 업데이트 또는 기능이나 게놈 연구와 데이터의 현재 상태에 대해서도 의견, wlathe는 AT의 openhelix에 않아서 co.kr로 이메일을 보내주십시오. 우리는 다음 게스트 게시물에 대한 대기열에 당신을 데려가고 싶지만.

다음주 화요일 첫 번째 손님 게시물에서있을 것입니다 인나 Dubchak , LBNL / JGI 그룹의 수석 수사관, 개발자 비스타 비교 유전체학 자원 (누구 스폰서 튜토리얼, 사용자에게 무료로). 그녀는 비스타에 몇 가지 새로운 도구를 논의하고 몇 가지 새로운 곧 기능을 간략히 미리보기를 제공.