VANA/VANA-python/subtitles_processing/README.md

677 B

subtitles_processing

Paket zur Aufbereitung der Untertitel.

subtitles-processing.py

Normalisiert die Untertitel einer Episode. Die timecodes werden umgespeichert, damit immer ganze Sätze pro Zeile vorhanden sind.

python src/normalize_subtitles/subtitles-processing.py -a <"normalize"> -ep <int>

count_words.py

Zählt die Wortanzahl pro Satz.

python src/normalize_subtitles/count_words.py -ep <int>

sentence_sentiment.py

Rechnet die Sentimente pro Satz.

python src/normalize_subtitles/sentence_sentiment.py -ep <int>

topics.py

Generiert Topics mittels LDA.

python src/normalize_subtitles/topics.py -ep <int>