Estudio basado en corpus sobre el perfil de vocabulario del lenguaje Shahmukhi Punjabi.

  •  Muhammad Farukh Arslan
  • Muhammad Asim Mehmood
  • Shaukat Hayat. 
Palabras clave: adjetivo, adverbio, corpus, sustantivo, etiquetado POS, Shahmukhi Punjabi

Resumen

Esta investigación es sobre el desarrollo del Perfil de Vocabulario con la ayuda de compilar un corpus de dos millones de palabras de Shahmukhi Punjabi. Un corpus de Shahmukhi Punjabi se transcribió a Gurmukhi Punjabi para el etiquetado de partes del habla. El corpus fue analizado con la ayuda de Antconc. La lista de frecuencias y la lista de diferentes ítemes de vocabulario según sus categorías gramaticales se estudiaron en el corpus desarrollado. Se ha observado que las palabras del idioma Punjabi tienen muchos casos y formas diferentes como contrarias al idioma inglés y similares al idioma Urdu. Los sustantivos, verbos y adjetivos varían según el número y el género. En el corpus también se encontraron abreviaturas y palabras de préstamo del idioma inglés. 

Publicado
2019-08-01
Sección
Artículos