Project that captures information about all Dark Souls 3 (DS3) weapons and performs textual analysis on.
Project of the discipline Projeto Integrador IV of the 4º semester of the course of Technology in Big Data for Business at FATEC Ipiranga. Supervised by Marco Mazzei.
O projeto tem como objetivo capturar informações da wiki de Dark Souls 3 referente as armas encontradas no jogo e realizar uma análise sobre o texto encontrado.
Dentro do projeto foi aplicado a técnica de Topic Modelling
A modelagem de tópicos é o processo de extrair os principais temas de um determinado corpus de dados de texto.
Wikipedia: No aprendizado de máquina e no processamento de linguagem natural, um modelo de tópico é um tipo de modelo estatístico para descobrir os "tópicos" abstratos que ocorrem em uma coleção de documentos.
For the use of the project, some prerequisites will be necessary.
- Python
- You can download here: Python
- Here is a step-by-step installation tutorial. (Tutorial)
- Tutorial with Miniconda. (Tutorial)
- Poetry
- You can install here: Poetry
- Apache Spark
- Follow the step by step: Spark
-
Clone this repo.
git clone https://github.com/Arekushi/ds3-scraping-text-analysis.git
-
Install packages with
Poetrypoetry install
-
Download the
FAT JARfromSpark NLPand put it wherever you want- You can find here: https://github.com/JohnSnowLabs/spark-nlp/releases
-
Go to
./src/config/settings.tomland editspark_nlp_jar_pathvalue to your path.spark_nlp_jar_path = 'C:\\spark\\jars\\spark-nlp-assembly-4.2.4.jar'
-
Execute:
python ./main.py
-
Done, the whole process has been completed 🎉
- You can see the results inside the
./src/datafolder
- You can see the results inside the
Will be added soon...
Will be added soon...
Here in this link you can see all the material I used to build the project. 😉
Alexandre Ferreira de Lima |
|---|