SIMILARITY OF NORMATIVE TEXTS:
AN ESSAY ON BUDGET LAWS
Keywords:
“AGRUPAMENTO E CATEGORIZAÇÃO DE DOCUMENTOS JURÍDICOS” .Abstract
1. introduction
There is a sedimented scientific doctrine around the numerical calculation of the similarity of documents. Such verification is of importance for Internet searches, a demand that precipitated the mentioned theorization. Thus, a "searched" text source is compared computationally with a list of "searched" texts, pointing out, after all, an index of similarity or proximity that is used to order the results. Mutatis mutandis, the same technique can be used for any text - understood as ordered sequences of words - including legal texts.
This possibility, however, has not yet been explored. We intend to investigate, in this brief essay, the calculation of textual similarity known as "cossene distance", defined, with support in the concepts of the Master's dissertation "AGRUPTION AND CATEGORIZATION OF LEGAL DOCUMENTS" .
Translated with www.DeepL.com/Translator (free version)
Downloads
References
FURQUIM, Luis Otávio de Colla. Agrupamento e Categorização de Documentos Jurídicos. Dissertação de Mestrado. Porto Alegre: PUC/RS, 2011.
GREGHI, Juliana Galvani; MARTINS Ronaldo Teixeira; NUNES, Maria das Graças Volpe. DIADORIM – A Lexical Database for Brazilian Portuguese. In: Interrnational Conference on Language Resources and Evaluation LREC 2002, Las Palmas de Gran Canaria Proceedings of the Third International Conference on Language Resources and Ecaluation, Manuel G. Rodríguez and Carmem P.S. Araujo (eds), 2002, v. IV, p. 1346-1350. Obtido de Núcleo Interinstitucional de Linguística Computacional – Universidade de São Paulo, http://nilc.icmc.usp.br/nilc/download/GreghiMartinsNunes.pdf
Gonçalves, T., Quaresma, P.: A Preliminary Approach to the Multilabel Classification Problem of Portuguese Juridical Documents. In: Pires, F. M., Abreu, S. P. (eds.) EPIA 2003. LNCS (LNAI), vol. 2902, pp. 435-444. Springer, Heidelberg, 2003.
Muniz, M., Nunes, M.: A Construção de Recursos Linguístico-computacionais para o Português do Brasil: o Projeto de Unitex-PB. Tese de Mestrado, Universidade de São Paulo. Instituto de Ciências Matemáticas e de Computação, São Carlos, SP (2004)
FURQUIM, Luis Otávio de Colla; DE LIMA, Vera Lúcia Strube. Clustering and categorization of Brazilian portuguese legal documents. In Proceedings of the 10th international conference on Computational Processing of the Portuguese Language (PROPOR'12), Helena Caseli, Aline Villavicencio, António Teixeira, and Fernando Perdigão (Eds.). Springer-Verlag, Berlin, Heidelberg, 2012, p. 272-283.
Downloads
Published
Issue
Section
License
Os direitos autorais dos artigos publicados nesta revista são de propriedade dos autores, com direitos de primeira publicação para o periódico. Em virtude da aparecerem nesta revista de acesso público, os artigos são de uso gratuito, com atribuições próprias, para fins educacionais e não-comerciais.