webislam

Miercoles 26 Noviembre 2014 | Al-Arbia 03 Safar 1436
2044 usuarios en linea | Español English عربي

WebIslam.com

» Artículos

?=0

El uso de los corpus lingüísticos

Solución de los problemas didácticos del español en las secciones de LEA de las universidades de Senegal

23/03/2013 - Autor: Seydou Mamadou Dia - Fuente: Webislam
  • 1me gusta o estoy de acuerdo
  • Compartir en meneame
  • Compartir en facebook
  • Descargar PDF
  • Imprimir
  • Envia a un amigo
  • Estadisticas de la publicación


Corpus

El objetivo de este artículo es hacer hincapié en la necesidad de solución innovadora, de optimización de los niveles en global y de mejora a la investigación y a la docencia del español en las secciones de LEA  de las universidades de Senegal que, hoy en día presentan reales problemas, y muchísimas dificultades y carencias en ello tanto entre los profesores como los estudiantes. Y sobre todo promover el uso del corpus lingüístico en las LEA en Senegal.

El uso de corpus lingüísticos, con sus múltiples ventajas como herramienta en línea de asistencia a la investigación y a la didáctica del español, viene a ser una solución innovadora, asequible por su gratuidad para este país francófono que lleva enseñando el español como lengua extranjera desde 1957 en sus universidades, y que el 75% de los estudiantes lo escogen como segunda lengua en las secciones de LEA por delante del portugués, del alemán y árabe.

Introducción

La expansión de las TIC  hasta en los países más desfavorecidos, su progreso en el manejo computarizado tanto de textos escritos como de trascripción oral con su fácil y rápido acceso y además fiable es incomparable. Este avance descomunal del momento dio lugar así a la creación de una herramienta útil e innovadora que son los corpus lingüísticos que podríamos llevar a las aulas para el proceso de enseñanza-aprendizaje del español como lengua extranjera y para la investigación sobre todo de los países no hispanohablantes tal como el Senegal para paliar a sus dificultades en la docencia del español.

Al respecto cito y a la vez rindo homenaje al difunto El Hadji Amadou Ndoye reconocido escritor y profesor de español en la UCAD , al que fue mi riguroso y eminente profesor hasta la licenciatura, por su eterna preocupación por la enseñanza de la lengua de Cervantes. En su ponencia sobre La enseñanza del español en África: una oportunidad y un reto, en el IV congreso internacional de la lengua española, Cartagena 2007, mencionaba las dificultades didácticas y de aprendizaje del español en Senegal: “Hoy, en Senegal, más de 70.000 alumnos cursan clases de español en condiciones difíciles. (…) Pese a nuestras penurias y flaquezas evidentes, crece el alumnado, (…)”. Realidad que puedo confirmar basándose en mi experiencia propia como profesor vacataire (interino) 2011-2012 en la universidad de Thies-Senegal/UFR SES /Sección de LEA y Sección de Turismo.

Desde los años 60, los corpus informatizados contribuyeron de manera significativa en la investigación lingüística y procuraron a los investigadores grandes volúmenes de datos para estudiar la lengua a través de muestras reales y precisas en uso, dejando atrás el uso de los métodos intuitivos tradicionales como medio para establecer ciertos principios lingüísticos. En los últimos años, el acceso a los corpus lingüísticos abrió una nueva vía con fines pedagógicos en el aprendizaje y la enseñanza de las lenguas extranjeras y en general de las lenguas.

El propósito de este artículo es brindar una solución innovadora a los estudiantes y a los profesores para la investigación y la enseñanza del español en las secciones de LEA de las universidades de Senegal a través del uso de los corpus lingüísticos. Cabe recordar que la didáctica de las lenguas extranjeras se planteó en el congreso internacional de TALC (Teaching and Lenguaje Corpora).

En este presente trabajo, planteamos en primer lugar los estudios del español en las secciones de LEA en Senegal. A continuación definiremos la noción de corpus y expondremos los tipos y características de corpus para la didáctica del español. Luego veremos el uso de corpus del español de Mark Davies  como solución moderna y eficaz en la enseñanza del español en las LEA, antes de resaltar  el uso de corpus oral como cercanía lingüística en el aula de comprensión española en las LEA con el CORLEC  y el C-Oral-ROM . Y en anexo metemos el ejemplo de búsqueda del CREA : el uso del pretérito. Por último exponemos algunas desventajas del uso de los corpus en las LEA en Senegal.

Los estudios del español en las LEA en Senegal

Se trata del estudio de las lenguas extranjeras introducidas en Senegal en los principios de los años 90 y heredado del sistema francés por ser ex colonia francesa; el objetivo de la formación en LEA es contribuir en satisfacer las necesidades de comunicación de las empresas, lo que constituye una particularidad para con los departamentos tradicionales de lenguas como el de lenguas y civilizaciones románicas de la UCAD.
Es relevante mencionar aquí que los estudios de LEA en Senegal se iniciaron con la creación del Instituto de Lenguas extranjeras aplicadas (ILEA) albergado en la facultad de Letras y Ciencias Humanas de la Universidad Cheikh Anta Diop de Dakar, con los siguientes objetivos:

     . Ofertar una formación especializada en lenguas extranjeras, orientadas hacia canales que participan en el desarrollo integral;
     . Favorecer la emergencia de ejecutivos y administrativos en las universidades, empresarios competentes para la explotación de las lenguas extranjeras, teniendo en cuenta las preocupaciones del mundo de los negocios;
    . Usar las lenguas extranjeras como vector de tecnologías nuevas imprescindibles para la gestión de empresas modernas.
    . Promover los estudios et la investigación en lenguas extranjeras

También cabe señalar en los estudios de LEA, la existencia de una lengua A (inglés) y de una lengua B (español,alemán,árabe o portugués). El español constituye la lengua B más escogida, con 75%  de estudiantes por ejemplo.

Luego, han sido creados otros departamentos en las universidades públicas de Senegal. Es el caso por exemplo de la sección de LEA de la universidad Gaston Berger de San Luis en 1990, de la sección LEA en la universidad de Thies y del departamento de LEA de la universidad de Ziguinchor región sur de Senegal, que inició sus clases en 2007.

Y si tomamos el caso de la sección de LEA de la Universidad de Thies, que apenas  lleva 5 años de existencia y pese a que en su apartado Competencias  al terminar la formación en el nuevo programa de estudios del español como lengua extranjera aplicada, las condiciones de enseñanza-aprendizaje tanto para los profesores como los estudiantes siguen siendo dificiles. Pero el afán de innovar no falta con varios programas en curso como el de Estudios a Distancia con su plataforma muy ambiciosa por cierto ya que asistí en el semiario de formación del 28 de marzo de 2011 en el CCDD/Thies , presidido por el rector y animado por el DEPVU  Dr Mouhamadoune Seck.

Dicha inicitiva era para resolver el problema de los efectivos y sobre todo familiarizar a los profesores y a los estudiantes con las TIC que la mayoría de entre ellos desconocen la existencia en ellas de una de las más útiles herramientas de didáctica e investigación que son los corpus ligüísticos. Y que las aplicaciones de los mismos en la enseñanza han sido ya abordadas por muchos estudiosos como San Mateo 2003, Sinclair 2004 por ejemplo e incluso han dado lugar al congreso internacional TALC (Teaching and Language Corpus).

Cabe destacar también el programa SAMA PC  (MI PC) lanzado también en la Universidad de Ziguinchor, con el apoyo del gobierno de Senegal, del banco mundial, de intel, Samsung, Ecobank ; propone facilitar y dotar de un ordenador portátil a cada estudiante por un precio de ganga. Tales programas apoyarían nuestro objetivo en este presente artículo sin duda. Además nos permitirían reorientar las habilidades didácticas y pedagógicas del profesor frente a los  tradicionales  métodos de investigación para elaborar las temáticas y los planes de estudios que dejan un enfoque no adecuado y una metodología desajustada al perfil del alumno senegalés aprendiente del español como lengua extranjera aplicada que sin duda alguna se refleja en su nivel de adquisición de la misma.

Como bien lo ha señalado el jefe de departamento de LEA de la UT en nuestra entrevista del 22 de marzo de 2011 :«lo que los profesores (enseignants) hacen no está del todo adecuado con las líneas directrices que enmarcamos durante los encuentros didácticos » .

Y por experiencia propia durante el año que daba clases allí, todo está debido a la escasez de medios, a las carencias en la formación de los profesores que casi todos son interinos (vacataires) y vienen de los liceos y por cierto muy apañados y empeñados en la dura tarea de defensa y propaganda de la lengua de Cervantes, pues hace falta colaborar para faclitar este éxito con ambiciones innovadoras razón de este artículo.

Definición de corpus

En esta parte de nuestro trabajo toca definir el concepto de corpus que casi todos los estudiosos de esta rama se proponían a definirlo pero siempre coinciden en que son una colección extensa de muestras reales de textos de varios tipos tanto escritos como de transcripción oral y en formato electrónico de una o varias lenguas en uso que sirven para el estudio del lenguaje como de la pragmática enfocado a un tipo de lenguaje en concreto o especifico.

No podríamos seguir sin mencionar esta definición de referencia:

Según el Diccionario de la Real Academia Española (DRAE, 22ª edición), un corpus es “conjunto lo más extenso y ordenado posible de datos o textos científicos, literarios, etc., que pueden servir de base a una investigación”.

Y para terminar pasamos a la definición muy estandarizada ofrecida por el grupo de trabajo dedicado a los corpus textuales de EAGLES (Expert Advisory Group on Lenguage Engineering Standars (1996ª:4)

“Corpus: A collection of pieces of language that are selected and ordered according to explicit linguistic criteria in order to be used as a sample of the language.”

Esta definición nos brinda ciertos aspectos relevantes que seguro todos los estudiosos estarían de acuerdo. Los textos que componen el corpus deben estar producidos en situaciones reales ("pieces of language") y guiados por una serie de criterios lingüísticos explícitos para asegurar la representatividad de una lengua
Por añadidura diríamos que los corpus permiten al usuario hacer diferentes búsquedas entre grandes cantidades de textos electrónicos.

Tipos y características de corpus para la enseñanza del español en las LEA
En este apartado resaltaríamos algunos tipos de corpus y vislumbrar  a la vez sus características enfocadas en la enseñanza del español como lengua extranjera y que se podría llevar a las aulas de las secciones de LEA de las universidades de Senegal.
Como lo hemos señalado en la definición del concepto de corpus para simplificar hay generalmente dos tipos: el corpus monolingüe y  el corpus bilingüe o  trilingüe; que reflejan la realidad lingüística y el contexto en el que se usa la o las lenguas.

Según la finalidad u objetivo que se busca, podríamos encontrar una gran variedad de corpus hoy en día en la red y en su mayoría de uso gratis.

Particularmente, podemos encontrar un corpus de un país en concreto como  el corpus del español de la Argentina, el Corpus Histórico del Español  entre los siglos XVI y XIX de México (CHEM), el Corpus Oral y Sonoro del español Rural (COSER)  que registra la lengua hablada por transcripciones de habitantes de una u otra región geográfica para no citar más que estos.

A continuación veremos los siguientes corpus cuyas informaciones y datos están sacados directamente de la  Real Academia Española: “www.rae.es”.

Los corpus de la Real Academia Española

El banco de datos de la Real Academia Española está formado por dos grandes corpus textuales: el Corpus de Referencia del Español Actual (CREA, escrito y oral) y el Corpus Diacrónico del Español (CORDE). Entre ambos poseen alrededor de 400 millones de formas de todos los períodos del español, tanto de España como de América y, por lo tanto, constituyen uno de los recursos más importantes para el estudio del español en todo el mundo hispano. Ambos corpus permiten obtener datos reales sobre la consulta realizada, y nos facilitan la combinación de distintos criterios de selección.
Algunas búsquedas que se pueden realizar:

- Combinar palabras.
- Comprobar las frecuencias de aparición de un término.
- Consultar el uso de palabras y expresiones.
- Averiguar la época o el país en el cual el empleo de una palabra o frase resulta más frecuente.
Combinación de variables:
- Autor.
- Obra.
- Año o intervalo de años.
- Área temática.
- País.

Por medio de la aplicación del CREA y del CORDE podemos obtener también diferentes datos de la consulta efectuada como:

- Número total de textos.
- Distribución cronológica.
- Ámbito de aparición.
- Sesgos temáticos.
- Referencia bibliográfica.

El Corpus del siglo XXI

Es un proyecto de la RAE  en colaboración con las veintiuna instituciones que forman la Asociación de Academias de la Lengua Española. El trabajo servirá como fuente para los proyectos académicos y proporcionará materiales básicos para la investigación lexicográfica y gramatical del español.

Otro corpus muy útil creado por Mark Davies cuya información está extraída en: “http://www.corpusdelespanol.org/x.asp”

El Corpus del español (CDE), almacena una colección de más 20.000 textos orales y escritos que ofrecen una buena representación del español utilizado desde el siglo XIII hasta el siglo XX. Estos textos, son una muestra del uso real de la lengua, y pone a nuestra disposición más de 100 millones de palabras para la creación de materiales didácticos y para el desarrollo de investigaciones lingüísticas. El (CDE), con una interfaz en español y otra en inglés para utilizar la que más nos convenga, nos permite hacer búsquedas de palabras exactas o frases por medio de comodines, etiquetas, lemas o categoría gramatical. De igual manera, se pueden combinar todas estas herramientas para hacer una búsqueda más avanzada. Por otro lado, en este corpus podemos también, a través de una suscripción gratuita, hacer búsquedas por las frecuencias de uso de palabras. A su vez, nos permite comparar las frecuencias entre textos orales o escritos (sean de ficción, prensa o registro académico). Otro tipo de comparación que se puede buscar en este corpus es por campos semánticos, sinónimos, etc. No cabe duda de que el Corpus del español es una poderosa herramienta para hacer un sinfín de investigaciones o, lo que más nos interesa aquí en el ámbito pedagógico, para la realización de materiales didácticos para el aula de Español como Lengua Extranjera lo que pretendemos en este presente artículo.

A continuación veremos el modo de uso de este corpus  como solución moderna y eficaz en la enseñanza del español en las LEA en Senegal.

Y al final sigue el COSER como ejemplo de herramienta útil para investigaciones y diseño de cursos sobre las diversas formas de hablar en la Península Ibérica por ejemplo.

Toda esta Información y datos están extraídos del Corpus Oral y Sonoro del Español Rural (COSER) dirigido por Inés Fernández-Ordóñez  “www.ffil.uam.es/coser/contenido.php?es”.

El Corpus Oral y Sonoro del Español Rural (COSER)

Dirigido desde la Universidad Autónoma de Madrid por Inés Fernández-Ordóñez (RAE), se empezó a compilar en 1990 para el estudio de la variación dialectal del español en la Península Ibérica.

Algunas de sus características generales:

• Formado por grabaciones de la lengua hablada en enclaves rurales de la Península Ibérica.
• Se distingue de otros corpus orales del español en que registra el habla de individuos cuya vida transcurre en un entorno rural.
• Constituye un complemento de los materiales recolectados en los atlas lingüísticos del español peninsular.
• Informantes: Hablantes rurales, con una edad media global de 72 años (74 en los hombres y 71 en las mujeres), de escasa escolarización y naturales del lugar en que son entrevistados.
• Metodología empleada: “Ha sido la de la entrevista sociolingüística, dirigida por parte de los encuestadores hacia ciertos temas de la vida tradicional en el campo” (Fernández-Ordóñez 2004).
• Entrevistas: en 754 enclaves rurales del centro y de la mitad norte de la Península Ibérica. Consta cerca de 950 horas de grabación.
• Fenómenos dialectales: Posee muestras sonoras breves, con su transcripción correspondiente, que ilustran diferentes empleos dialectales de la gramática y del léxico del español rural.
• Novedad: A diferencia de otros corpus orales dialectales, en los que sólo se brinda al usuario breves muestras sonoras, el COSER ofrece, como muestra de las diversas formas de hablar en la Península Ibérica, las grabaciones en formato audio con sus respectivas transcripciones a disposición de cualquier usuario.

Uso del corpus del español de Mark Davies como solución moderna y eficaz en la enseñanza del español en las LEA

Uso del Corpus del español

El uso del CDE se puede presentar como algo complejo, pero con las actualizaciones de aspectos técnicos se facilita la investigación de los usuarios. Quienes a su vez deben de ser cuidadosos al escribir las palabras, lemas, etiquetas y demás componentes que permiten recuperar los datos deseados. Sin embargo, siguiendo las pautas sacadas del Corpus del español “www.corpusdelespanol.org/x.asp”.que a continuación se presentan el corpus sería lo suyo.

Con tener nociones básicas de su uso se podría sacar mucho provecho para la elaboración de materiales didácticos fiables, contextualizados y contrastados y en un tiempo record para la enseñanza del español como lengua extranjera. Así que su utilidad inmensa solucionaría los severos problemas en la docencia del español en los departamentos de LEA en Senegal.

Y sólo basta registrarse sin coste alguno y voila.

Las Secciones del CDE

Para facilitar la explicación, enumeramos cada una de las secciones que se encuentran en la primera página que encontramos al comenzar una consulta:

• Mostrar.
• Buscar.
• Secciones.
• Ver opciones.
• “Sumario de resultados” (no tiene un título particular visible).
• Resultados.

Sección 1
Al pulsar en el signo de interrogación, que se encuentra al lado derecho, nos aparece la descripción de cada una de las opciones y funciones que forman esta sección. No obstante, explicamos brevemente en qué consiste cada una de ellas.

Para realizar una búsqueda, se debe seleccionar en la sección 1 si se desea obtener los resultados en tabla, en gráficos o si se quiere obtener, por ejemplo, la comparación de palabras. Es de destacar que las soluciones en la tabla podría ser la mejor opción, porque es la que nos permite recuperar los datos con mayor facilidad. Esta opción nos muestra los resultados en la sección 5, clasificados desde el siglo XIII hasta el siglo XX. De igual manera, en la sección 5, encontramos la clasificación por textos académicos, periodísticos, de ficción (novelas) y orales. En la opción de gráficos, como su nombre lo indica, encontramos la clasificación por medio de gráficos que nos facilita hacer la comparación de frecuencias de uso de la palabra que buscamos entre los diferentes siglos.

La opción comparación de palabras, nos permite diferenciar el uso de dos palabras cuyos significados son similares (por ejemplo, saber y conocer).

Sección 2
En esta sección se coloca, en el espacio designado para este fin, la(s) palabra(s) que deseamos buscar. En la misma, encontramos la opción que nos permite escribir el contexto en el cual aparecería dicha palabra. Es decir, buscar la palabra que consultamos acompañada de otro vocablo, preposición, artículo, etc. Para que aparezca el espacio específico que permite introducir esta información (necesario para colocar los datos que determinan el contexto), es imprescindible pulsar en el signo de interrogación que se encuentra a la derecha de la palabra contexto. La manera de colocar esta información es muy específica. Para tal fin, es necesario utilizar las etiquetas, es decir, la codificación diseñada para este corpus. Al elegir en el signo de interrogación, que se encuentra a la derecha de categoría gramatical (abreviado, CAT GRAM), nos aparece una lista de opciones que nos facilita seleccionar la categoría gramatical de la palabra que queremos que acompañe a la palabra que buscamos. Si volvemos a pulsar en el signo de interrogación, aparecerá en la sección 6 la lista de etiquetas necesarias para la búsqueda. Junto con el espacio designado para colocar las etiquetas, aparecen dos números, que se pueden cambiar a números menores o mayores. Estos números nos permiten indicar la cantidad de palabras que pueden existir entre la palabra que buscamos y la palabra que acompaña. Para agilizar la búsqueda, encontramos en esta sección la útil opción Lista usuario. Esta opción, nos permite crear un historial de las palabras que queramos almacenar durante la búsqueda, y que podamos volver a consultar en otro momento que sea necesario. Estas listas se guardan bajo un nombre particular sin la necesidad de claves; es decir, no es confidencial. Al lado de esta opción, tenemos los botones Buscar y Borrar. Obviamente, el primer botón sirve para lanzar la búsqueda con los datos indicados y el segundo para eliminar todos los datos que se hayan colocado y así empezar una nueva búsqueda desde el comienzo.

Sección 3
A continuación, encontramos la opción llamada Secciones. Esta nos permite delimitar nuestra búsqueda según el siglo (o los siglos) en el cual fue utilizada la palabra que consultamos. Además, encontramos la frecuencia mínima que queramos que aparezca el lema en los siglos indicados, esto es, si la palabra sólo aparece en tres textos en determinado siglo, el CDE no incluiría estos en los resultados. Por supuesto, podemos aumentar el número de frecuencia que deseamos.

Sección 4
Al seleccionar el signo de interrogación que se encuentra a la derecha de la palabra Opciones, aparecen en la sección 6 cuatro opciones de preferencias que nos permiten personalizar la presentación de los resultados que se obtendrán.

Sección 5
En esta sección, los resultados de la búsqueda lanzada aparecen en una lista, ya sea por frecuencia, gráficos o por comparación de palabras, según la opción que se haya escogido en la sección 1. Los resultados que se muestran son enlaces que nos permiten ver en la sección 6 un fragmento del texto en que se encuentran la palabra que hemos buscado.

Sección 6
Nos brinda la lista enumerada de los resultados de las búsquedas, indicando en números arábigos el siglo en el cual se produjo el texto; el guión y la letra que acompaña indica el tipo de texto (oral, ficción, científico, etc.). A la derecha, vemos el título del texto y posteriormente una línea del texto. Al pulsar en el número que representa el siglo o en el título, aparecerá un fragmento más extenso.

En general mediante los corpus, se podría enseñar la lengua a través de ejemplos reales de uso, porque esta excelente herramienta informática nos ofrece el contexto cultural y situacional de los términos. Los corpus informáticos, como recurso léxico de consulta, nos proporcionan la posibilidad de interactuar en conjunto con diferentes libros de textos y otros materiales pedagógicos, convirtiéndose de esta manera en una fuente de ideas inagotable.

Con su fácil acceso y gratuito, el uso de los corpus nos permite la creación de actividades inductivas. De esta manera, los estudiantes serían aprendices activos en el aula y en casa, facilitándose así su motivación y su participación. Por esta razón, vale la pena incitar a los profesores de español y a los estudiantes de la lengua de cervantes sobre todo a usarlos para optimizar los niveles de los estudiantes de Senegal para cumplir con las competencias enmarcadas al terminar su formación en LEA.

Uso del Corpus Oral solución a la cercanía lingüística en el aula de Comprensión oral en las LEA de Senegal: el CORLEC y el C-Oral-ROM

El corpus oral ofrece en su conjunto un material más que idóneo para la elaboración de actividades de identificación de los rasgos de una lengua oral, así como el desarrollo de la comprensión auditiva y de estrategias socio-lingüísticos. El uso de la espontaneidad de los hablantes nativos en distintos temas nos permite a los no hispanohablantes estar en contacto real de la lengua oral y de cómo se expresan los nativos de manera general en su día a día. Y eso resultaría una cercanía lingüística sin límite si se le saca provecho para trabajar las destrezas de comunicación y auditivas en las aulas de comprensión en las LEA en Senegal.

A continuación el CORLEC con una breve presentación extraída directamente de “http://www.lllf.uam.es/ESP/Corlec.html”.

Cabe notar que es de uso libre y se puede descargar en el PC y voila.
Corpus Oral de Referencia de la Lengua Española Contemporánea CORLEC

1. Descripción del Corpus Textual

TÍTULO: CORPUS ORAL DE REFERENCIA DEL ESPAÑOL CONTEMPORÁNEO
DEFINICIÓN: Base de datos textual (corpus de lengua hablada): transliteración de textos grabados en cintas de audio del registro oral. 1.100.000 de palabras transliteradas en soporte informático.
GRUPO DE INVESTIGACIÓN:

Director:
Francisco Marcos Marín: Catedrático de Lingüística General de la Universidad Autónoma de Madrid.
Recolección de material en cintas de audio y transcripción:

Almudena Ballester Carrillo
Carmen Santamaría García
Elena Pertierra Torreño
Otilia BrandÆo Cardoso dos Santos
Pedro Luis Díez Orzas

La base de datos textuales denominada Corpus Oral de Referencia del Español Contemporáneo comenzó a elaborarse en enero de 1991, finalizando su realización en febrero de 1992. Se elaboró en la Universidad Autónoma de Madrid con una ayuda de IBM España dentro del programa de cooperación entre IBM España y la Cátedra de Lingüística General de la UAM.
________________________________________
2. Criterios de registro sonoro, transcripción y etiquetado de textos
2.1 Criterios de recogida de textos (registro sonoro)
    El corpus oral ha de recoger textos de todo tipo, desde conversaciones hasta presentaciones de índole más académica (no leídas), de acuerdo con unos requisitos y dentro de una banda de frecuencias de tipos textuales previamente determinada. En los aspectos generales, se rige por los criterios que hemos presentado anteriormente, en esta exposición.

El equipo recolector de textos orales debe tener en cuenta también seis criterios para definir los textos que se integrarán en la base de datos:

1. Oralidad
2. Espontaneidad
3. Adecuación
4. Representatividad
5. Autenticidad
6. Estándar

En lo referente a la transcripción, se debe insistir en que se trata de una transcripción ortográfica, por lo que este criterio es el determinante. Cuando en la expresión oral se hayan suprimido segmentos que deben represen- tarse ortográficamente (como la d del participio en la terminación -ado, p. ej.) se arbitra un sistema de representación que permite recuperar la informa- ción ortográfica (ver el apartado de etiquetas); pero sin perder la informa- ción relevante desde el punto de vista de la oralidad, para los efectos de cadenas de segmentos en estadísticas, por ejemplo.

En lo que se refiere al corpus oral, los tipos de texto representativos son los siguientes:

TIPO TEXTUAL
o Administrativos
o Científicos
o Conversacionales o familiares
o Educativos
o Humanísticos
o Instrucciones (megafonía)
o Jurídicos
o Lúdicos (concursos, etc.)
o Políticos
o Periodísticos:

  • Debates
  • Deportes
  • Documentales
  • Entrevistas
  • Noticiario
  • Publicitarios
  • Religiosos
  • Técnicos

3.2 Cómputo aproximado de palabras

Número de palabras

Administrativos y políticos  ......................................  61.200
Científicos  ......................................  36.000
Conversacionales o familiares  ...................................... 269.500
Educativos  ......................................  58.300
Humanísticos  ......................................  61.200
Instrucciones (megafonía)  ......................................   6.600
Jurídicos  ......................................  35.200
Lúdicos (concursos, etc.)  ......................................  61.200
Periodísticos:  
Debates  ......................................  93.500
Deportes  ......................................  58.300
Documentales  ......................................  28.600
Entrevistas  ...................................... 171.200
Noticiario  ......................................  72.600
Publicitarios  ......................................  30.800
Religiosos  ......................................  12.100
Técnicos  ......................................  43.100
TOTAL ESTIMADO  ...................................... 1.100.000 palabras

Y este siguiente corpus oral con un nivel de audio excepcional referirse a las muestras en: “http://www.lllf.uam.es/ESP/Muestra%20Coralrom/efamdl37.html”, nos permite a los universitarios de las secciones de LEA español vivir la lengua de manera mucho más efectiva a través de las conversaciones, debates, entrevistas… de los nativos. Pues rompiendo así los tradicionales métodos en la asignatura de comprensión oral que es leer un trozo de texto y dejar una serie de preguntas como siempre.

Señalamos que estos corpus son una herramienta más para la cercanía lingüística a través del sonido. Desgraciadamente este presente C-Oral-ROM es de uso restringido pero explotando las múltiples vías a través de la cooperación internacional o reunir lo que hace falta de parte de las autoridades administrativas y gubernamentales se podría conseguir y hacer de él un buen uso en el marco de los grandes retos innovadores en la docencia del español en las LEA en Senegal.

C-ORAL-ROM

Información y datos sacados de: “http://www.lllf.uam.es/ESP/Coralrom.html”.
C-ORAL-ROM es un corpus multilingüe de lengua espontánea en las cuatro lenguas romance principales: francés, italiano, portugués y español. El proyecto fue financiado por la UE bajo el V Framework Programme (IST-2000-26228) y el consorcio está formado por nueve socios coordinados por la Universidad de Florencia. La característica más significativa de C-ORAL-ROM es su espontaneidad: los textos se han grabado en su contexto real y sin guión. Cada subcorpus consta de 300.000 palabras con la misma distribución textual para asegurar la comparabilidad y la representatividad. El recurso se presenta en varios formatos: una transcripción ortográfica, una versión etiquetada en XML y el alineamiento de sonido y texto. Además, se proporcionan una anotación lingüística parcial de los textos y programas para manejar los recursos y los estudios cuantitativos.

Algunos inconvenientes del uso del corpus lingüístico en las LEA en Senegal

Los corpus lingüísticos oral o escrito, paralelos o comparable, monolingüe, bilingüe o trilingüe pueden ser de gran apoyo y muy útiles para el diseño de materiales didácticos o para el uso en el aula de Español como Lengua Extranjera en los departamentos de LEA de las universidades de Senegal. Sin embargo, hay que saber que al principio su utilización no siempre es fácil, como lo plasma el dicho Todo es empezar y esto podría acarrear ciertos desánimos entre los estudiantes y entre los mismos profesores que elaboran materiales. La falta de experiencia en el uso de los corpus o en el manejo de internet ocasionarían también ciertas incomodidades menos mal que poco a poquito hila la vieja el  copo.

Además, se agrega para los problemas que se pueden plantear con los corpus orales y por consiguiente en su uso, el apartado 2.3 sacado directamente de la descripción del CORLEC: “http://www.lllf.uam.es/ESP/Info%20Corlec.html”

2.3 Algunos de los problemas que presentan los corpus orales

La principal dificultad que presentan los corpus orales es también una de sus características distintivas: la espontaneidad. Los hablantes no se sujetan a ningún tipo de regla estilística, retórica, ni siquiera gramatical en ocasiones, por lo que es frecuente encontrar palabras en un orden distinto del "normal"; repeticiones, muletillas, cortes bruscos dentro del acto comunicativo... y, por supuesto, cortes de palabras, palabras "inventadas", ininteligibles, o que no se ajustan desde luego a los cánones de, por ejemplo, un diccionario. Algunos de estos rasgos especiales se citan y estudian a continuación.

Pese a todo, difícil es de negar que el uso los corpus lingüísticos es muy funcional y tienen más ventajas que desventajas.

El otro problema que hay que subrayar aquí en este apartado es de índole coyuntural del país que nos interesa en este artículo. Con su condición de país en vía de desarrollo, Senegal el país de la Teranga  presenta enormes dificultades en el dominio de las energías con los apagones incesantes que intentan remediar con los grupos electrógenos. Además, la falta de recursos para poder acceder a internet y dotarse de un ordenador, de paso saludamos el ambicioso programa SAMA PC (MI PC) lanzado en las universidades del cual hablaba más arriba en este presente artículo.

Conclusión

Los múltiples problemas de Docencia y el nivel bajo de los estudiantes en los departamentos de LEA de las universidades de Senegal han motivado las preocupaciones actuales de las autoridades universitarias incluso los profesores ahora más que nunca por la aplicación de unas competencias innovadoras en las aulas de Lenguas extranjeras aplicadas particularmente en la enseñanza del español.

Tras mi recién experiencia en las aulas de las secciones de LEA y Turismo de la Universidad de Thies, sentí la necesidad de aportar mi granito de arena en este proceso de modernización y mejora de la didáctica de la lengua de cervantes que se defendió siempre de capa y espada como solía decir el difunto Sr Ndoye al que dedicamos este artículo como homenaje. “Hasta siempre Maestro”.

Solucionar los problemas de docencia del español en Senegal nunca será una tarea fácil, sin embargo aportar parte de la solución es el objetivo de este artículo que pretende incitar a la introducción del uso de los corpus lingüísticos para el español como lengua extranjera aplicada en las aulas.

Como se sabe las TIC nos han brindado una de las mejores herramientas aplicable a la didáctica de las lenguas como la que nos toca en este trabajo. Con un respaldo académico confortable, los corpus lingüísticos han sido motivos de muchos estudios en cuanto a su aplicabilidad en la enseñanza de las lenguas. En esto destacamos los trabajos de Sinclair por ejemplo.

Creemos que los corpus aportarían un gran alivio entre los profesores y los estudiantes del español en las secciones de LEA y sobre todo les permitirían renovar los tradicionales métodos de enseñanza en esta tierra francófona que lleva varias décadas con la enseñanza del ELE .

Fuente de documentación e inspiración tanto para profesores como estudiantes, los corpus nos permiten reducir de manera considerable el tiempo de dedicación para el diseño de las cursos con ejemplos reales de las millones de muestras de textos escritos y de transcripción oral que están compilados y almacenados de manera informatizada, y también facilitan la didáctica inductiva entre los estudiantes fuera de las aulas o en casa.

Además les permitirán conocer de forma fácil y rápida las convenciones genéricas según las diferentes lenguas y el ámbito de especialidad, tanto en el nivel contextual (tipo textual, campo, etc.) como en el textual (organización formal, aspectos terminológicos, etc.).

A pesar de que su manejo puede ser complejo allí en Senegal, los corpus pueden ser una manera muy interesante de conocer el uso real de la lengua española. De acuerdo con las últimas tendencias sobre los materiales de enseñanza que tratan de utilizar textos que se asemejen lo más posible a textos reales Senegal necesita optimizar los niveles. Por consiguiente, el contenido de los corpus, tal y como lo hemos visto a lo largo de este artículo “Procede directamente del uso del lenguaje, y no de la norma académica o lo gramaticalmente correcto, que puede falsear el modelo de lengua que se aprende”. Campillos Llanos (2005-2006)

El fácil acceso y gratuito de los corpus lingüísticos deberían animar a los actores de la enseñanza en Senegal a invertir esfuerzos en favorecer la coyuntura actual para que se pueda sacar provecho y así mejorar los niveles en las secciones de LEA.

Bibliografía
Curso de “Lingüística de corpus” del Máster de Traducción e investigación, universidad Jaume Primer, Castellón, España, 2011.
Campillos Llanos, L. 2005-2006. Adaptación del corpus C-ORAL-ROM a la enseñanza de español para extranjeros. Madrid: Universidad Autónoma de
Madrid documento en línea:
“www.mepsyd.es/redele/Biblioteca2007/LeonardoCampillos/Memoria.pdf”.
Davies, Mark. (2002) Corpus del Español: 100 million words, 1200s-1900s. Available online at “http://www.corpusdelespanol.org”.
El Hadji Amadou Ndoye: IV congreso internacional de la lengua española. Paneles y ponencias, Cartagena 2007 .Fuente Centro virtual Cervantes
Entretien avec le responsable de filière Langues Etrangères appliqués (LEA) de l’UFR Sciences Economiques et Sociales de l´Université de Thiès.
Fernández-Ordóñez, I. (dir.). 2004-2009. Corpus Oral y Sonoro del Español Rural (COSER). Madrid: Universidad Autónoma de Madrid, en línea:
“www.ffil.uam.es/coser/contenido.php?es”.
Fernández-Ordóñez, I. 2004. “Nuevas perspectivas en el estudio de la variación dialectal del español: el Corpus Oral y Sonoro del Español Rural”, en Actes du XXIV Congrès de Linguistique et Philologie Romanes (Aberystwyth, Wales, 2-5 August 2004), documento en línea:
“http://pidweb.ii.uam.es/coser/publicaciones/ines/5_es.pdf”.
NDOYE, A. (2005): “La enseñanza del español en Senegal” El español en el Mundo”. Anuario del Instituto Cervantes, Instituto Cervantes, Madrid.
Nouveau Programme d´études de LEA de l´Université de Thiès
Pérez Hernández, M. Ch. 2002. “Explotación de los córpora textuales informatizados para la creación de bases de datos terminológicas basadas en el conocimiento”. Estudios de Lingüística Española (ELiEs) 18, documento en línea: “http://elies. rediris. es/elies18/index. html”.
Projet de création d´un Institut de Langues Etrangères Appliquées (LEA) à la faculté des lettres et Sciences humaines (Ref. : 012/ cres/ FL- 90)
Real Academia Española. 2005. Corpus Diacrónico del Español (CORDE). Madrid: RAE.
Real Academia Española. 2005. Corpus de Referencia del Español Actual (CREA). Madrid: RAE.
San Mateo, A. 2003. “Los corpus lingüísticos y la enseñanza de ELE”.
Frecuencia-L 22: 52-58.
Sinclair, J. 1996. Preliminary recommendations on Corpus Typology.
Sinclair, J. (ed.) 2004. How to use corpora in language teaching.
Amsterdam: John Benjamins.
Technical report EAGLES (Expert Advisory Group on Language Engineering Standards), documento en línea:
“http://www.ilc.cnr.it/EAGLES96/corpustyp/corpustyp.html”.

Anuncios



Escribir comentario

Debes iniciar sesión para escribir comentarios.

Si no estás registrado puedes registrarte en un minuto.

  • Esta es la opinión de los internautas, no de Webislam
  • No están permitidos comentarios discriminatorios, injuriantes o contrarios a la ley
  • Céntrate en el tema, escribe correctamente y no escribas todo en mayúsculas
  • Eliminaremos los comentarios fuera de tema, inapropiados o ilegibles

play
play
play
play
Colabora


Junta Islámica - Avda. Trassierra, 52 - 14011 - Córdoba - España - Teléfono: (+34) 957 634 071

Certificados de calidad: XHTML, CSS, RSS, 508, TABLELESS, WCAG TAW

 

Junta Islámica
http://www.webislam.com/articulos/84563-el_uso_de_los_corpus_linguisticos.html