Foto: Secretaría Xeral de Política Lingüística

A versión 3.0 do Corpus de Referencia do Galego Actual (CORGA) está xa dispoñible, sen necesidade de rexistro previo e de balde, para a súa consulta en liña. Contén 36,8 millóns de palabras, das que algo máis de 570.000 son formas diferentes. O proxecto desenvólvese no Centro Ramón Piñeiro para a Investigación e Humanidades no marco do convenio subscrito entre a Universidade de Santiago de Compostela e a Consellería de Cultura, Educación e Ordenación Universitaria.



A presentación da nova versión tivo lugar este venres no Centro Ramón Piñeiro e nela interviñeron a directora do proxecto e profesora da USC, Marisol López; o secretario da RAE e tamén docente na USC, Guillermo Rojo; o secretario xeral de Política Lingüística, Valentín García; e o catedrático de Filoloxía Románica da USC e coordinador científico do Centro Ramón Piñeiro, Manolo González. Os coordinadores da parte lingüística e informática do CORGA, Eva Domínguez e Mario Barcala, respectivamente, fixeron ademais unha breve demostración do funcionamento do proxecto.

O CORGA é un corpus documental integrado por distintos tipos de textos, dende xornais, semanarios, revistas, blogs, ensaios, novelas e relatos curtos ata obras de teatro e guións televisivos. Os documentos codifícanse na linguaxe estándar XML e abranguen cronoloxicamente dende 1975 ata a actualidade. Nesta nova versión unifícanse os dous sistemas de consulta en liña dispoñibles anteriormente (o do CORGA e o do CORGAetq) nun único sistema que dá cabida ás diferentes aproximacións de busca. A amplitude de documentos dos que consta así como os criterios empregados na súa selección permiten considerar este corpus representativo do uso lingüístico do galego actual.

Á vangarda dos corpus
Entre as numerosas novidades que achega esta versión destaca a incorporación dunha pequena mostra representativa do rexistro oral da década dos 90, en cuxas transcricións se aliña o texto coa voz, de xeito que no sistema de recuperación de información o usuario ten non só a posibilidade de realizar pescudas en textos orais, senón tamén a posibilidade de escoitar o fragmento que corresponde ao contexto dos resultados obtidos.

Porén, sen dúbida, a característica máis sobresaínte desta versión do corpus é a etiquetaxe automática da totalidade dos documentos que o conforman empregando o Etiquetador/Lematizador do Galego Actual (XIADA), desenvolvido conxuntamente polo CIRP e o grupo COLE das universidades da Coruña e Vigo.

Deste xeito, a mera representación gráfica non restrinxe a potencialidade das consultas e pódese buscar no corpus, con ou sen expresións regulares, por palabra completa, parte dunha palabra ou varias palabras ou partes, contiguas ou non. Mais tamén é posible facer procuras por categoría gramatical, trazos morfolóxicos ou lemas, podendo empregar ademais como parámetros selectores os diversos criterios de clasificación textual, os cales poden combinarse entre si en función das necesidades/desexos do usuario: período temporal, tipo de documento, área temática, parte do documento etc. Así, o CORGA presenta un motor de busca excepcionalmente potente que sitúa o galego na vangarda dos corpus lingüísticos.

Entre outras melloras destacables figuran o incremento do volume textual coa inclusión de novos documentos pertencentes aos últimos lustros; o emprego dunha interfaz gráfica amigable que salienta a visualización dos resultados mediante concordancias e gráficas, as múltiples posibilidades de ordenación dos resultados ou a opción de deshabilitar a sensibilidade a acentos e maiúsculas nas procuras; a clasificación tipolóxica dos documentos, ou a engádega de abundante información nas páxinas estáticas sobre o corpus: descrición, documentos que o integran, historial de versións, publicacións que o referencian, guía de uso, descarga das listaxes de palabras, elementos gramaticais, lemas ou etiquetas etc.

Os recursos relacionados con este proxecto destínanse ás persoas interesadas no estudo da lingua galega actual nos diferentes eidos, fornecéndoos con ferramentas que lles permitan obter datos de diversa índole relacionados co emprego da lingua e desenvolver ferramentas de análise do galego cada vez máis sofisticadas.

  • El futuro en la Xunta de Galicia de Feijóo y Mar Sánchez Sierra podría estar en los documentos de Pemex-Barreras que tiene el periodista Miguel Delgado.

    Xornal Galicia A Coruña Lugo Ourense Pontevedra Vigo Santiago Localidades[…]

    El futuro en la Xunta de Galicia de Feijóo y Mar Sánchez Sierra podría estar en los documentos de Pemex-Barreras que tiene el periodista Miguel Delgado.  Siguen cayendo imputados por corrupción de Pemex en México y comunica al periodista Miguel Delgado que el Presidente de la Xunta esta siendo investigado por la fiscalía de México. Tras una larga investigación sobre los viajes de Feijóo y Mar Sánchez Sierra a México desde el año 2013 en que empezó la corrupción en la petrolera de México dueña de los Astilleros Barreras de Vigo en lo que intermedió Feijóo y Mar Sánchez Sierra dejaron un rastro tan amplio y de impunidad que ahora según la fiscalía mexicana están directamente bajo investigación sumarial en México y que podrían sumarse a los principales imputados en la corrupción de la petrolera mexicana con fuertes vínculos en Vigo, Celta y Astilleros Barreras.Nuevo detenido en Pemex Miguel Ángel Lozada Aguilar que podría estar vinculado a la trama gallega en Astilleros Barreras, sumándose a los íntimos amigos de Feijóo ex Presidente Peña Nieto o Lozoya perseguidos por la Interpol por saquear la petrolera mexicana dueña[…]

Comparadores y Simuladores de Hipoteca

Según los datos que nos llegan desde el INE, ya...

Tu dieta necesita apoyo de Meritene para cubrir necesidades nutricionales

Llevar una dieta balanceada es una de las principales bases...

La ley hipotecaria vuelve a afectar a la firma de nuevos contratos

La contratación de hipotecas ha seguido bajando durante estos últimos...

César Acuña delega en Luis Valdez atacar al Dr. Miguel Gallardo

Dr. (PhD) Miguel Gallardo PERITO Tel.  (+34) 902998352 E-mail: apedanica.ong@gmail.com Asociación...

Consejos para crear un Call Center

Son muchos los negocios hoy en día que ven en...

Micrófonos con falsos interruptores espían a invitados a tertulias televisivas

Dr. (PhD) Miguel Gallardo PERITO Tel.  (+34) 902998352 E-mail: apedanica.ong@gmail.com Asociación...

Anunciantes de CONFIEP en programas mermeleros del Perú serán identificados desde España

Dr. (PhD) Miguel Gallardo PERITO Tel.  (+34) 902998352 E-mail: apedanica.ong@gmail.com Asociación...

Actualidad Ibérica Comisionólogos de comisionistas, comisariados y comisarios. Hacia la comisionología y su Ética

Dr. (PhD) Miguel Gallardo PERITO Tel.  (+34) 902998352 E-mail: apedanica.ong@gmail.com Asociación...

Aspectos a tener en cuenta al elegir un software call center

El aspecto de la comunicación siempre ha contado con una...

Otros articulos relacionados.....
esafsqarhyazeubebgcazh-CNzh-TWhrcsdanlenettlfifrglkadeelhtiwhihuisidgaitjakolvltmkmsmtnofaplptrorusrskslswsvthtrukurvicyyi