El CORPES alcanza los 438 millones de formas tras incorporar más de 15 000 textos y 13 millones de palabras ortográficas

25/7/2025 | Real Academia Española (RAE)

La Real Academia Española (RAE) ha publicado la versión 1.3 del Corpus del Español del Siglo XXI (CORPES), que ya cuenta con más de 405 000 documentos y 438 millones de formas ortográficas, procedentes tanto de textos escritos como de transcripciones orales. Esta nueva entrega supone un incremento de más de 13 millones de formas con respecto a la versión anterior, publicada en noviembre de 2024.

Una de las mejoras más importantes de esta actualización es la revisión de los metadatos correspondientes a los textos orales, que suponen ahora más de cinco millones de palabras ortográficas. Esta revisión ha permitido optimizar la calidad de la información existente. Además, algunos archivos ofrecen el sonido alineado correspondiente a la transcripción; en otros es posible la descarga del archivo de audio, además de la visualización del vídeo de acuerdo con la procedencia del texto fuente.

Más en rae.es

COMPARTE

También podría interesarle

Por qué mueren las lenguas (y por qué el español se salvará)

25/7/2025 | Rafael del Moral (El Confidencial) La primera lengua del mundo en número de …

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Powered by themekiller.com anime4online.com animextoon.com apk4phone.com tengag.com moviekillers.com