Stratified/PCA: Un método de procesamiento de datos variables para la construcción de modelos de redes neuronales
Resumen
Este artículo describe un método para reducir observaciones y variables contenidas en grandes archivos de datos a nuevos conjuntos de datos cuyo tamaño es mucho más reducido. Estos nuevos conjuntos son confiables para mejorar tanto en calidad como en tiempo, la construcción de los modelos de redes neuronales. El método, Stratified/PCA utiliza la técnica de muestreo estratificado y análisis de componentes principales para reducir eficientemente la cantidad original de datos y variables, manteniendo a su vez, la mayor cantidad de información presente en los datos originales. El desempeño de las redes neuronales construidas con estos conjuntos reducidos de datos ha sido bastante similar al obtenido con el conjunto original de los datos. Por otro lado, la técnica de estratificación usada en Stratified/PCA mostró ser más consistente en la selección de los datos que la técnica aleatoria (convencionalmente más utilizada). Se realizaron comparaciones de reducción de datos usando solamente estratificación y el método Stratified/PCA.
Palabras clave
Texto completo:
PDFReferencias
Carpenter W. and M. E. Hoffman (1997). “Selecting the architecture of a class
of back-propagation neural networks used as approximators”. Artificial
Intelligence for Engineering Design. Analysis and Manufacturing. No. 11,
pp. 33-34.
Cheng Russel and Teresa Davenport (1989). “The problem of dimensionality in
stratified sampling”. Management Science. Vol. 35. No 11, pp. 1278-1296.
Cochran, William (1963). “Sampling techniques”. Second edition. John
Willey & Sons, Inc. New York.
Collantes, Joanna; G. Orlandoni; Gerardo. Colmenares y F. Rivas (2002).
“Predicción con Redes Neuronales Artificiales: Comparación con las
Metodologías de Box y Jenkins. (Revistas técnicas de investigación).
Universidad del Zulia, Vol 27. 2004 Mimeografía. Mérida, Venezuela.
Colmenares, Gerardo. and R. Pérez (1998). A Data Reduction Method to
Train, Test, and Validate Neural Networks. Proceedings IEEE Southeastcon
‘98. pp. 277-280.
Colmenares Gerardo. (1999). Reducing Samples and Variables to Train, Test,
and Validate Neural Networks. Doctoral Dissertation. University of South
Florida. Tampa.
Don, S. and J. Babu (1992). Exploratory Data Analysis using Inductive
Partitioning and Regression Trees. Ind. Eng. Chem. Res. 31, pp. 1989-
Haykin, Simon (1994). Neural Networks. A comprehensive foundation.
Macmillan College Publishing Company, Inc.
Hecht-Nielsen, Robert (1990). Neurocomputing. Addison-Wesley Publishing
Company, Inc.
Jolliffe, I. T. (1986). Principal Component Analysis. Springer-Verlag.
Kaiser, H. F. (1960). The application of electronic computers to factor analysis.
Educ. Psychol. Meas. Vol. 20. pp. 141-151.
Majcen, Nineta; Karmen Rager-Kanduc; Marjana Novic and Jure Zupan
(1995). Modeling of Property Prediction from Multicomponent
Analytical Data Using Different Neural Networks. Anal. Chem. Vol. 67.
pp. 2154-2161.
Mardia, K. V.; J. T. Kent and J. M. Bibby (1979). Multivariate Analysis.
Academic Press. London.
Milton, Sande (1986). “A sample size formula for multiple regression studies”.
Public American Association for Public Opinion Researc. Opinion Quarterly.
Vol. 50. pp. 112-118. University of Chicago press.
Neuralware, Inc. (1995). NeuralWorks Predict: Complete Solution for Neural
Data Modeling.
Pelletier, Bertrand and Jean-Pierre Chanut (1991). Strate: A microcomputer
program for designing optimal stratified sampling in the marine
environment by dynamic programming-II. Program and example.
Computers & Geosciences. Vol. 17. No. 2, pp. 179-196.
Smith, Murray (1993). Neural Networks for statistical modeling. Van Nostrand
Reinhold. New York.
Sovan, Lek; Marc Delacoste; Philippe Baran; Ioannis Dimopoulos; Jacques
Lauga and Stéphane Aulagnier (1996). “Application of neural networks
to modeling nonlinear relationships in ecology”. Elsevier, Ecological
Modeling. pp. 39-54.
Sukhatme, Pandurang (1963). Sampling theory of surveys with applications.
Bangalore press, India.
Xue Z., Wang (1999). Data mining and knowledge discovery for process
monitoring and control. Springer-Verlag. Great Britain.
Enlaces refback
- No hay ningún enlace refback.
ISSN 1315-2467 ISSNe 2343-5704
Redes Sociales
Twitter: @revecono
Facebook: Revecono
Instagram: @revecono
Se encuentra actualmente indizada en: | |||
![]() | ![]() | ![]() | |
![]() | ![]() | ||
![]() | ![]() | ![]() | |
![]() | ![]() | ![]() |
Todos los documentos publicados en esta revista se distribuyen bajo una
Licencia Creative Commons Atribución -No Comercial- Compartir Igual 4.0 Internacional.
Por lo que el envío, procesamiento y publicación de artículos en la revista es totalmente gratuito.