Coyuntura de la agricultura en Italia: metodología para un análisis textual en medios digitales
Resumen
Este estudio tiene como objetivo presentar una metodología replicable basada en técnicas de procesamiento de lenguaje natural (PLN) para el análisis automatizado del discurso mediático y aplicar dicha metodología al caso del sector agrario en Italia durante el primer semestre de 2024. Se analizaron 164 noticias de siete medios italianos con el fin de identificar los temas centrales, emociones predominantes y patrones discursivos presentes. Se emplearon herramientas de PLN en R para limpiar, tokenizar y vectorizar el corpus textual y luego se aplicaron modelos estadísticos como TF-IDF (acrónimo inglés de Frecuencia de término-Frecuencia inversa de documentos) y Latent Dirichlet Allocation (LDA) para identificar temáticas, además de utilizar el NRC Emotion Lexicon para clasificar emociones. El análisis temático basado en LDA identificó dos ejes centrales en la cobertura mediática: la gestión institucional del sector agroalimentario italiano y las protestas de los agricultores en la Unión Europea. El primer grupo refleja un enfoque sobre el desarrollo del sector, destacando temas como la innovación tecnológica y las políticas públicas, mientras que el segundo se centra en las manifestaciones de los agricultores y las respuestas institucionales. El análisis de sentimientos (sentiment analysis) reveló una predominancia de emociones como confianza (30%), anticipación (18%) y miedo (13%). Los picos de carga emocional negativa ocurrieron en los meses de febrero y marzo, asociados a crisis y protestas, mientras que las noticias más positivas se concentraron a finales de abril, coincidiendo con temas de innovación y cooperación internacional. Los resultados obtenidos contribuyen significativamente a la comprensión de cómo los medios construyen la narrativa sobre el sector agrario. Además, se destacan las emociones que influyen en la percepción pública, lo que puede ser de utilidad para encontrar referenciales de políticas en los medios de comunicación en este sector. Este estudio pone en evidencia el potencial del PLN para analizar discursos mediáticos, ofreciendo una base sólida para futuras investigaciones sobre la representación de la agricultura en los medios y su impacto en la opinión pública.
Palabras clave
Texto completo:
PDFReferencias
Aho, A. V. (1990). Algorithms for finding patterns in strings. En J. van Leeuwen (Ed.), Algorithms and Complexity (pp. 255-300). Elsevier Science Publishers B.V. https://doi.org/10.1016/B978-0-444-88071-0.50010-2
Baker, L. M., & Irani, T. (2014). The impact of new media on policy affecting agriculture. Journal of Applied Communications, 98(3), Art. 3. https://doi.org/10.4148/1051-0834.1083
Blei, D. M., Y. Ng, A., & Jordan, M. I. (2003). Latent Dirichlet Allocation. Journal of Machine Learning Research, 3, 993-1022. http://www.jmlr.org/papers/volume3/blei03a/blei03a.pdf
Bouchet-Valat, M. (2023). SnowballC: Snowball stemmers based on the C “libstemmer” UTF-8 Library. R package version 0.7.1. https://CRAN.R-project.org/package=SnowballC
Cambria, E., Schuller, B., Xia, Y., & Havasi, C. (2013). New avenues in opinion mining and sentiment analysis. IEEE Intelligent Systems, 28(2), 15-21. https://doi.org/10.1109/MIS.2013.30
Feinerer, I., & Hornik, K. (2024). _tm: Text Mining Package_. R package version 0.7-15. https://CRAN.R-project.org/package=tm
Feinerer, I., Hornik, K., & Meyer, D. (2008). Text mining infrastructure in R. Journal of Statistical Software, 25(5), 1-54. https://doi.org/10.18637/jss.v025.i05
Fitzgerald, M. (2012). Introducing regular expressions: Unraveling regular expressions, step-by-step. O’Reilly Media, Ed.
Gan, J., & Qi, Y. (2021). Selection of the optimal number of topics for LDA topic model—Taking patent policy analysis as an example. Entropy, 23(10), 1301. https://doi.org/10.3390/E23101301
Grefenstette, G. (1999). Tokenization. En H. van Halteren (Ed.), Syntactic wordclass tagging. text, speech and language technology, vol 9 (pp. 117-133). Springer. https://doi.org/10.1007/978-94-015-9273-4_9
Haller, L., Specht, A. R., & Buck, E. B. (2019). Exploring the impact of Ohio agricultural Organizations’ social media use on traditional media coverage of agriculture. Journal of Applied Communications, 103(4), Art. 4. https://doi.org/10.4148/1051-0834.2264
Happer, C., & Philo, G. (2013). The role of the media in the construction of public belief and social change. Journal of Social and Political Psychology, 1(1), 321-336. https://doi.org/10.5964/jspp.v1i1.96
Istat (Istituto Nazionale di Statistica). (2024). Rapporto annuale 2024 La situazione del Paese. Istat. https://www.istat.it/produzione-editoriale/rapporto-annuale-2024-la-situazione-del-paese-2/
Jockers, M. (2023). Extracts sentiment and sentiment-Derived plot arcs from text [R package syuzhet version 1.0.7]. CRAN: Contributed Packages. https://doi.org/10.32614/CRAN.PACKAGE.SYUZHET
Jockers, M. L. (2015). Syuzhet: Extract sentiment and plot arcs from text. GitHub. https://github.com/mjockers/syuzhet
Kr Yadav, M., Kumar Darji, R., & Kumar Yadav, M. (2024). Impact of mass media in agriculture: An overview. Agricultural and Biological Research, 40(04), 1232-1235. https://doi.org/10.35248/0970-1907.24.40.1232-1235 / https://www.abrinternationaljournal.org/articles/impact-of-mass-media-in-agriculture-an-overview-110379.html
Liu, B. (2012). Sentiment lexicon generation. En B. Ling (Ed.), Sentiment Analysis and Opinion Mining. Synthesis Lectures on Human Language Technologies (pp. 79-89). Springer. https://doi.org/10.1007/978-3-031-02145-9_6
Liu, B. (2017). Many facets of sentiment analysis. En E. Cambria, D. Das, S. Bandyopadhyay, & A. Feraco (Eds.), A practical guide to sentiment analysis (pp. 11-39). Springer. https://doi.org/10.1007/978-3-319-55394-8_2
Mohammad, S. M. (2020). Sentiment analysis: Automatically detecting valence, emotions, and other affectual states from text. arXiv:2005.11882 [cs.CL].
Mohammad, S. M., & Turney, P. D. (2013). Crowdsourcing a word-emotion association Lexicon. arXiv:1308.6297 [cs.CL]. http://arxiv.org/abs/1308.6297
Mohr, S., & Höhler, J. (2023). Media coverage of digitalization in agriculture - an analysis of media content. Technological Forecasting and Social Change, 187, 122238. https://doi.org/10.1016/j.techfore.2022.122238
Pang, B., & Lee, L. (2008). Opinion mining and sentiment analysis. Foundations and Trends in Information Retrieval, 2(1-2), 1-135. https://doi.org/10.1561/1500000011
Plutchik, R. (1980). A general psycho evolutionary theory of emotion. En R. Plutchik & H. Kellerman (Eds.), Emotion: Theory, research, and experience (pp. 3-33). Elsevier. https://doi.org/10.1016/B978-0-12-558701-3.50007-7
Qaiser, S., & Ali, R. (2018). Text mining: use of TF-IDF to examine the relevance of words to documents. International Journal of Computer Applications, 181(1), 25-29. https://doi.org/10.5120/ijca2018917395
R Core Team. (2022). R: A language and environment for statistical computing. R package version 4.2.0. https://www.R-project.org
Sarica, S., & Luo, J. (2021). Stopwords in technical language processing. PLOS ONE, 16(8), e0254937. https://doi.org/10.1371/JOURNAL.PONE.0254937
Silge, J., & Robinson, D. (2017). Text mining with R: A tidy approach (1a. ed.). O’reailly. https://www.tidytextmining.com/
Silge, J., & Robinson, D. (2016). tidytext: Text mining and analysis using tidy data principles in R. The Journal of Open Source Software, 1(3), 37. https://doi.org/10.21105/joss.00037
Straka, M., & Straková, J. (2017). Tokenizing, POS tagging, lemmatizing and parsing UD 2.0 with UDPipe. En Proceedings of the CoNLL 2017 shared task: Multilingual parsing from raw text to universal dependencies (pp. 88-99). Institute of Formal and Applied Linguistics. http://ufal.mff.cuni.cz/udpipe
Wickham, H., François, R., Henry, L., Müller, K., & Vaughan, D. (2023). dplyr: A grammar of data manipulation. R package version 1.2.1. https://CRAN.R-project.org/package=dplyr
ISSN Electrónico: 2244-8128
ISSN Impreso: 1316-0354
ISSN L: 1316-0354
DOI: https://doi.org/10.53766/Agroalim
![]()
Todos los documentos publicados en esta revista se distribuyen bajo una
Licencia Creative Commons Atribución -No Comercial- Compartir Igual 4.0 Internacional.
Por lo que el envío, procesamiento y publicación de artículos en la revista es totalmente gratuito.
![]() | ![]() | ![]() | |
| | ![]() | ![]() | ![]() |
![]() | ![]() | ![]() |












