Remote homology detection of pr oteins using 3D models enriched with physicochemical pr operties.
Portada
Citas bibliográficas
Código QR
Autor corporativo
Recolector de datos
Otros/Desconocido
Director audiovisual
Editor/Compilador
Editores
Tipo de Material
Fecha
Cita bibliográfica
Título de serie/ reporte/ volumen/ colección
Resumen en español
(Eng) This article introduces a new method for remote homology detection called remote-3DP. He remote 3DP method is based on both predicted 3D information and the physicochemical properties of the amino acids. The method considers only 10 structural models to represent a protein and distinguish the remote counterparts of non-remote ones in 54 SCOP families. The low dimensionality of the representation allows use different classification techniques and find out which one works best for each family. In this article, shows that by including a physicochemical property together with the 3D information in a local structural element, fact improves the accuracy of remote homology detection. The ROC score for a set of models that includes the hydropathy index reaching a score of 0. 953 for the SCOP 1.53 data set. In addition, it is proposed an assembly model that uses the outputs obtained for the 10 properties to make a consensus decision. The consensus strategy achieves a ROC score of 0.963 on the SCOP 1.53 data set, surpassing the Current methods based on sequence composition whose accuracy ranges from 0.87 to 0.92.
Resumen en español
(Spa) En este artículo se presenta un nuevo método para la detección de homología remota llamado remote-3DP. El método remote 3DP se basa tanto en información 3D predicha como en las propiedades fisicoquímicas de los aminoácidos. El método considera tan sólo 10 modelos estructurales para representar una proteína y distinguir los homólogos remotos de los no remotos en 54 familias SCOP. La baja dimensionalidad de la representación permite usar diferentes técnicas de clasificación y descubrir cuál funciona mejor para cada familia. En este artículo, se muestra que al incluir una propiedad fisicoquímica junto con la información 3D en un elemento estructural local, de hecho mejora la exactitud de la detección de homología remota. El puntaje ROC para un conjunto de modelos que incluye el índice de hidropatía alcanza un puntaje de 0. 953 para el conjunto de datos SCOP 1.53. Además, se propone un modelo de ensamble que utiliza las salidas obtenidas para las 10 propiedades y así tomar una decisión consenso. La estrategia consenso alcanza un puntaje ROC de 0.963 sobre el conjunto de datos SCOP 1.53, sobrepasando los métodos actuales basados en la composición de la secuencia cuya exactitud varía de 0.87 a 0.92.