Necesito ayuda con la siguiente tarea:
Se adjunta planilla Task.
-Programación Python y utilizando librería NLP (Fuzzy Matching o la opción que mejor funcione)
-La primera parte es relacionar cada celda de la columna "Topic Name" (columna F) de pestaña TASK3B con "subcategories" (columna B) de la pestaña TASK3A y que complete la columna A de TASK3A "category" con el dato que corresponda de la columna D "Category" en pestaña TASK3B.
-La segunda parte es (en pestaña TASK3B) asignar cada Topic a subcategory más adecuada de las diversas que se haya identificado en el paso anterior. En el caso que haya varias subcategory adecuadas es viable duplicar la línea.
-Los topics que tienen un "Companies Searching" (columna B, TASK3B) mayor requiere un especial cariño y en cambio si hay errores en los que tiene menos companies searching no tendría tanto impacto.
El entregable que se requiere es el script, planilla excel procesada y un pequeño documento en word (pocas hojas) documentando el proceso de elaboración (etapas, prueba, ensayo, error, éxito)
Hola, te puedo ayudar a desarrollar la tarea que tienes y para asegurar el éxito de la misma nos podemos reunir para ver el avance y determinar si debemos realizar algún ajuste antes de enviarte la entrega final.
Puedo ayudarte, soy tesista en la carrera ade matemática pura y he trabajo bastante con la manipulación de datos. Aplicó a diario mis conocimientos de Python para manipular datos y trabajo en la parte de estadística.