kw3c 2.1 다운로드

PLOS 및 PubMed 중앙 페이지 보기 및 다운로드의 합계. DNA 결합 단백질을 예측하는 제안된 DBPPred 모델의 프로그램. 이 ZIP 파일에는 파이썬 스크립트와 함께 실행하는 방법에 대한 지침이 포함되어 있습니다. 이에 대한 설명은 다음과 같습니다. 접수: 2013년 9월 29일; 접수일: 2013년 12월 10일; 게시: 2014년 1월 24일 PDB186 데이터 셋에 제안된 DBPPred, iDNA-Prot, DNA-Prot, DNAbinder, DNABIND 및 DBD-Threader의 예측 결과. 파일은 PDB186 데이터 집합의 각 시퀀스에 대한 기존 메서드의 실제 대상 값과 예측값을 나열합니다. DBPPred, DNAbinder 및 DNABIND의 세 가지 방법의 실제 값 출력도 제공됩니다. PredSS를 사용하기 위한 동기는 단백질 접이식 비율 [38] 및 운동 유형 [39], 결합 잔기 [40] 및 촉매 부위 [41]를 포함하여 단백질 기능 예측에 대한 이점을 보여 준 여러 연구에서 비롯됩니다. SPINE-X는 나선(H), 가닥(E) 및 코일(C)과 같은 세 가지 유형의 보조 구조를 예측합니다.

SS 기반 피쳐는 총 3개의 보조 구조 콘텐츠에 의해 코딩됩니다. 유전자 조절에 있어 중요한 역할을 하기 때문에 DNA 결합 단백질의 측정을 위한 효율적인 방법을 개발하는 것은 단백질 기능에 대한 우리의 이해를 발전시키는 데 매우 중요하기 때문에 매우 요구되고 있습니다. 본 연구에서는, DNA 결합 단백질의 예측을 위한 새로운 방법을 제안하였고, 앞으로 의외로 최선의 검색 전략을 사용하여 랜덤 포리스트및 래퍼 기반 기능 선택을 이용한 기능 순위를 수행하였다. 이 피처는 1차 서열, 예측 된 보조 구조, 예측 된 상대 용매 접근성 및 위치 특정 점수 매기기 매트릭스의 정보를 포함합니다. DBPPred라고 불리는 제안된 방법은 의사 결정 트리, 로지스틱 회귀, k-near near 이웃, 다항식 커널이 있는 지원 벡터 머신을 포함하여 5개의 다른 분류자를 능가했기 때문에 가우시안 순진한 베이즈를 기본 분류자로 사용했습니다. 방사형 기초 기능을 갖춘 벡터 머신을 지원합니다. 그 결과, 제안된 DBPPred는 교육 벤치마크 데이터 집합 PDB594에서 10번의 실행을 통해 5배 교차 유효성 검사에 따라 0.791의 가장 높은 평균 정확도와 0.583의 평균 MCC를 산출합니다. 그 후, 전체 PDB594 데이터 세트및 다른 5가지 기존 방법(iDNA-Prot, DNA-Prot, DNAbinder, DNABIND 및 DBD-Threader 포함)에 의해 학습된 제안된 모델에 의한 독립 데이터 집합 PDB186에 대한 블라인드 테스트를 수행하여 제안된 DBPPred는 0.769, MCC는 0.538, AUC는 0.790의 가장 높은 정확도를 산출했습니다.