Desarrollo de marcas diacríticas para los nombres y verbos de Punjabi Shahmukhi.

  •  Muhammad Ahmad Hashmi
  • Muhammad Asim Mahmood
  • Muhammad Ilyas Mahmood. 
Palabras clave: digitalización, diacríticos, Procesamiento del Lenguaje Natural (PNL), Punjabi Shahmukhi, WordNet

Resumen

El estudio ha sido diseñado para aplicar marcas diacríticas a 1000 palabras del Punjabi, incluidos 800 nombres y 200 verbos. El corpus de 2 millones de palabras ha sido tomado de diferentes libros, periódicos, revistas, artículos y novelas. Punjabi Shahmukhi carece de recursos digitales en línea para desarrollar diferentes herramientas del Procesamiento de Lenguaje Natural (PLN), lo que ayudaría a reconocer su estado internacional. Punjabi Shahmukhi tiene una escritura "Perso-árabe" y ha sido ignorada por los lingüistas para digitalizar su literatura. El estudio es significativo ya que servirá para el desarrollo de wordnet, ayudando a desarrollar un etiquetador de la parte del habla del Punjabi Shahmukhi, digitalizará su literatura y ayudará a los maestros y no nativos a desarrollarse una armonía intercultural. 

Publicado
2019-08-01
Sección
Artículos