O JusDataPredict analisa uma tese jurĂdica em um determinado juĂzo e fornece uma probabilidade de ĂŞxito, alĂ©m de apresentar as decisões mais similares para análise de consistĂŞncia jurisprudencial.
O Problema
A tomada de decisões no campo jurĂdico — seja ao propor uma ação, negociar um acordo ou elaborar uma defesa — Ă© um processo inerentemente arriscado e demorado. Advogados e clientes dependem da interpretação de um vasto e disperso histĂłrico de decisões judiciais (jurisprudĂŞncia), buscando previsibilidade em um ambiente de incertezas.
A Solução
O JusDataPredict traduz a complexidade legal em probabilidade estatĂstica. Utilizando um dataset de decisões judiciais, a ferramenta emprega modelos de Machine Learning para calcular a probabilidade de sucesso de uma causa e utiliza NLP para encontrar os precedentes mais relevantes, transformando dados histĂłricos em inteligĂŞncia estratĂ©gica.
Funcionalidades-Chave:
-
Predição de Risco: Calcula a probabilidade de ĂŞxito de uma tese jurĂdica com base no histĂłrico de decisões de um juĂzo especĂfico.
-
Classificação de Risco: Traduz a probabilidade em um nĂvel de risco de fácil compreensĂŁo ("Baixo", "MĂ©dio" ou "Alto").
-
Análise de Consistência: Utiliza similaridade de cossenos para buscar e ranquear as 5 decisões mais parecidas com o caso em análise, permitindo ao advogado verificar se a jurisprudência local é consistente ou divergente.
Interface Interativa: Um painel de controle simples, construĂdo com Streamlit, para facilitar a entrada de dados e a visualização dos resultados.
Tecnologias Utilizadas
Este projeto foi construĂdo com as seguintes tecnologias:
- Linguagem: Python 3.9+
- Framework Web: Streamlit
- Machine Learning: Scikit-learn
- Manipulação de Dados: Pandas
- Serialização de Modelos: Joblib
Estrutura do Projeto
jusdatapredict/
│
├── data/
│ └── jurisprudencia.csv # Dataset (sintético, neste MVP)
│
├── models/ # Modelos e artefatos salvos pelo script de treino
│ ├── risk_prediction_model.joblib
│ ├── similarity_vectorizer.joblib
│ ├── cosine_similarity_matrix.joblib
| ├── label_encoder.joblib
│ └── jurisprudencia_df.joblib
│
├── scripts/
│ └── train_model.py # Script para treinar e salvar os modelos de IA
│
├── app.py # Aplicação principal do Streamlit
│
├── requirements.txt # Dependências do projeto
│
└── README.md # Documentação do projeto
Siga os passos abaixo para configurar e rodar o projeto em sua máquina local.
python -m venv .venvsource .venv/bin/activatepip install -r requirements.txtGere o dataset sintético:
Este MVP utiliza um dataset gerado por script para simular dados reais. Execute o script de criação de dados:
python create_data.pyIsso criará a pasta data/ com o arquivo jurisprudencia.csv.
Treine os modelos de Machine Learning:
Entre na pasta scripts/e execute o cĂłdigo:
python train_model.pyO script irá processar os dados, treinar os modelos de predição e similaridade, e salvá-los na pasta models/.
Execute a aplicação Streamlit:
Com os modelos treinados, você já pode iniciar a aplicação.
streamlit run app.pyA aplicação será aberta automaticamente no seu navegador padrão!
Módulo de Predição de Risco
- Input: O advogado insere a Tese JurĂdica e seleciona o JuĂzo.
- Pré-processamento: Os textos são combinados e transformados em um vetor numérico pelo
TfidfVectorizer, que foi treinado previamente. - Predição: O vetor Ă© entĂŁo alimentado no modelo de RegressĂŁo LogĂstica treinado, que calcula a probabilidade da classe "Procedente".
- Output: A probabilidade é exibida como uma porcentagem e classificada como "Baixo", "Médio" ou "Alto Risco".
Módulo de Análise de Consistência
- Input: A Tese JurĂdica inserida pelo usuário.
- Vetorização: A tese é transformada em um vetor numérico usando o mesmo TfidfVectorizer (focado apenas em teses).
- Cálculo de Similaridade: A similaridade de cossenos é calculada entre o vetor da nova tese e todos os vetores de teses do dataset original.
- Ranking: O sistema identifica os 5 vetores com a maior pontuação de similaridade.
- Output: As 5 decisões correspondentes são recuperadas e exibidas, permitindo uma análise contextual da jurisprudência.
Após iniciar a aplicação, você verá uma interface na barra lateral esquerda:
- Selecione um JuĂzo da lista.
- Descreva a Tese JurĂdica no campo de texto.
- Clique no botĂŁo "Analisar Risco e ConsistĂŞncia".
O painel principal será atualizado com a probabilidade de ĂŞxito, o nĂvel de risco e uma lista expansĂvel com as 5 decisões mais relevantes para o seu caso.
Este projeto está licenciado sob a Licença MIT. Consulte o arquivo LICENSE para mais detalhes.


