Representação de proteínas
usando geometria hiperbólica
Palabras clave:
Geometria Hiperbólica, Representação de Proteínas, Redução de Dimensionalidade, RMSD, EmbeddingsResumen
Exploramos o uso do espaço hiperbólico na análise de estruturas de proteínas. A estrutura tridimensional de uma proteína é crucial para determinar suas interações moleculares. Para analisar a distribuição das estruturas de proteínas conhecidas, utilizamos a Root Mean Square Deviation (RMSD) como uma medida de dissimilaridade e empregamos técnicas de redução de dimensionalidade ao problema. Através de métodos computacionais, buscamos representações de baixa dimensão para o conjunto de proteínas, permitindo a inferência de funções das proteínas com base em suas proximidades a outras proteínas no espaço de representação. Embora o mapeamento de proteínas para um espaço de dimensão menor tenha sido realizado com sucesso no espaço euclidiano, a distorção inerente às técnicas de redução de dimensionalidade pode afetar a qualidade do resultado. Exploramos o uso do espaço hiperbólico, o qual permite representações de grafos com estruturas hierárquicas com distorção arbitrariamente baixa, como uma escolha mais adaptada para um espaço de representação para o nosso mapa. Nossos experimentos iniciais indicam que a qualidade do espaço hiperbólico como espaço de representação é, de fato, melhor do que a qualidade do espaço euclidiano.
Descargas
Citas
J. Hou, S.-R. Jun, C. Zhang e S.-H. Kim. “Global mapping of the protein structure space and application in structure-based inference of protein function”. Em: Proceedings of the National Academy of Sciences 102.10 (2005), pp. 3651–3656. doi: 10.1073/pnas.0409772102. eprint: https://www.pnas.org/doi/pdf/10.1073/pnas.0409772102. url: https://www.pnas.org/doi/abs/10.1073/pnas.0409772102.
I. Kufareva e R. Abagyan. “Methods of Protein Structure Comparison”. Em: Homology Modeling: Methods and Protocols. Ed. por Andrew J. W. Orry e Ruben Abagyan. Totowa, NJ: Humana Press, 2012, pp. 231–257. isbn: 978-1-61779-588-6. doi: 10.1007/978-1-61779-588-6_10. url: https://doi.org/10.1007/978-1-61779-588-6_10.
M. Nickel e D. Kiela. “Learning Continuous Hierarchies in the Lorentz Model of Hyperbolic Geometry”. Em: International Conference on Machine Learning. 2018.
C. De Sa, A. Gu, C. Ré e F. Sala. “Representation Tradeoffs for Hyperbolic Embeddings”. Em: Proceedings of the 35th International Conference on Machine Learning. Ed. por Jennifer Dy e Andreas Krause. Vol. 80. Proceedings of Machine Learning Research. PMLR, out. de 2018, pp. 4460–4469. url: https://proceedings.mlr.press/v80/sala18a.html.