Applicability of semi-supervised learning assumptions for gene ontology terms prediction

التفاصيل البيبلوغرافية
العنوان: Applicability of semi-supervised learning assumptions for gene ontology terms prediction
المؤلفون: Jorge Alberto Jaramillo Garzon, Alexandre Perera I Lluna, César Germán Castellanos Domínguez
المساهمون: Universitat Politècnica de Catalunya. Departament d'Enginyeria de Sistemes, Automàtica i Informàtica Industrial, Universitat Politècnica de Catalunya. SISBIO - Senyals i Sistemes Biomèdics, Universidad de Antioquia
المصدر: Recercat. Dipósit de la Recerca de Catalunya
instname
Revista Facultad de Ingeniería, Iss 79, Pp 19-32 (2016)
UPCommons. Portal del coneixement obert de la UPC
Universitat Politècnica de Catalunya (UPC)
مصطلحات موضوعية: 0301 basic medicine, ontología genética, semi-supervised learning, Informàtica::Intel·ligència artificial::Aprenentatge automàtic [Àrees temàtiques de la UPC], Computer science, predicción de funciones proteicas, Semi-supervised learning, computer.software_genre, Machine learning, lcsh:Technology, Task (project management), 03 medical and health sciences, Annotation, Aprenentatge automàtic, Protein function prediction, aprendizaje semisupervisado, business.industry, Gene ontology, Unlabelled data, lcsh:T, General Engineering, Online machine learning, bioinformatics, máquinas de vectores de soporte, Semi-supervised learning, gene ontology, support vector machines, protein function prediction. Aprendizaje semisupervisado, ontología genética, máquinas de vectores de soporte, predicción de funciones proteicas, Support vector machine, 030104 developmental biology, ComputingMethodologies_PATTERNRECOGNITION, lcsh:TA1-2040, gene ontology, Artificial intelligence, Data mining, business, lcsh:Engineering (General). Civil engineering (General), computer
الوصف: La Ontología Genética (GO) es uno de los recursos más importantes en la bioinformática, el cual busca proporcionar un marco de trabajo unificado para la anotación biológica de genes y proteínas de todas las especies. La predicción de términos GO es una tarea esencial en bioinformática, pero el número de secuencias etiquetadas que se encuentran disponibles es insuficiente en muchos casos para entrenar sistemas confiables de aprendizaje de máquina. El aprendizaje semi-supervisado aparece entonces como una poderosa solución que explota la información contenida en los datos no etiquetados, con el fin de mejorar las estimaciones de las aplicaciones supervisadas tradicionales. Sin embargo, los métodos semi-supervisados deben hacer suposiciones fuertes sobre la naturaleza de los datos de entrenamiento y, por lo tanto, el desempeño de los predictores es altamente dependiente de estas suposiciones. En este artículo se presenta un análisis de la aplicabilidad de las diferentes suposiciones del aprendizaje semi-supervisado en la tarea específica de predicción de términos GO, con el fin de proveer elementos de juicio que permitan escoger las herramientas más adecuadas para términos GO específicos. Los resultados muestran que los métodos semi-supervisados superan significativamente a los métodos tradicionales supervisados y que los desempeños más altos son alcanzados cuando se implementa la suposición de cluster. Además se comprueba experimentalmente que las suposiciones de cluster y manifold son complementarias entre sí y se realiza un análisis de cuáles términos GO pueden ser más susceptibles de ser correctamente predichos usando cada una de éstas.
وصف الملف: application/pdf
URL الوصول: https://explore.openaire.eu/search/publication?articleId=doi_dedup___::a487c140a211743dc7911ee5ac2ac86d
http://hdl.handle.net/2117/102271
حقوق: OPEN
رقم الأكسشن: edsair.doi.dedup.....a487c140a211743dc7911ee5ac2ac86d
قاعدة البيانات: OpenAIRE