Desarrollo de marcas diacríticas para los nombres y verbos de Punjabi Shahmukhi.
Resumen
El estudio ha sido diseñado para aplicar marcas diacríticas a 1000 palabras del Punjabi, incluidos 800 nombres y 200 verbos. El corpus de 2 millones de palabras ha sido tomado de diferentes libros, periódicos, revistas, artículos y novelas. Punjabi Shahmukhi carece de recursos digitales en línea para desarrollar diferentes herramientas del Procesamiento de Lenguaje Natural (PLN), lo que ayudaría a reconocer su estado internacional. Punjabi Shahmukhi tiene una escritura "Perso-árabe" y ha sido ignorada por los lingüistas para digitalizar su literatura. El estudio es significativo ya que servirá para el desarrollo de wordnet, ayudando a desarrollar un etiquetador de la parte del habla del Punjabi Shahmukhi, digitalizará su literatura y ayudará a los maestros y no nativos a desarrollarse una armonía intercultural.