Projeto de mineração de dados em Notas Fiscais Eletrônicas (NFE)
Conda 4.11.0 or latest Docker 20.10.14 or latest
In terminal, type:
./setup.shThe above script will setup a conda environment to run scripts and also build a docker image to run fastText.
conda activate egov- RUN
pre_processamento/pre_proc_anvisa.ipynb - RUN
pre_processamento/pre_proc_medicamentos.ipynb - RUN
data_augmentation/medicamentos_augmentation.sh - RUN
data_augmentation/anvisa_prod_augmentation.sh - RUN
data_augmentation/anvisa_pa_augmentation.sh - MOVE
datasets/medicamentos/medicamentos_aumentado.csvTOdatasets/medicamentos/augmented/medicamentos_aumentado.csv - MOVE
datasets/avisa/anvisa_principio_ativo_aumentado.csvTOdatasets/anvisa/augmented/anvisa_principio_ativo_aumentado.csv - MOVE
datasets/avisa/anvisa_produto_aumentado.csvTOdatasets/anvisa/augmented/anvisa_produto_aumentado.csv - RUN
pre_processamento/pre_proc_anvisa_augmented.ipynb - RUN
pre_processamento/pre_proc_medicamentos_augmented.ipynb - RUN
ean_key_map_builder(not implemented) - RUN
pre_processamento/mapeamento_ean_chave.ipynb - RUN
oversampling/oversampling.py - RUN
training/train_test_split.py
docker run --rm -it -v $PWD:/home fasttext /bin/bashfasttext supervised -input datasets/data.train.txt -output model/modelfasttext test model/model.bin datasets/data.test.txtThe output of test will be displayed similar as below, where P@1 and R@1 are Precision and Recall values respectively.
N 734
P@1 0.00681
R@1 0.00681fasttext predict model/model.bin datasets/data.test.txtIn fastText docker container prompt, type:
exitTo deactivate conda environment, type:
conda deactivate