diff --git a/reports/zwischenbericht.pdf b/reports/zwischenbericht.pdf new file mode 100644 index 0000000..7b5a074 Binary files /dev/null and b/reports/zwischenbericht.pdf differ diff --git a/reports/zwischenbericht.tex b/reports/zwischenbericht.tex new file mode 100644 index 0000000..e677fe6 --- /dev/null +++ b/reports/zwischenbericht.tex @@ -0,0 +1,40 @@ +\documentclass{article} + +\begin{document} + \section*{Was wurde bisher gemacht?} + \begin{itemize} + \item Website scrapen + \item Protokolle fetchen + \item Protokolle parsen + \end{itemize} + \section*{Wie ist der Zustand aktuell?} + Protokolle sind heruntergeladen und geparsed in einzelnen Tabellen, die noch zusammengeführt werden müssen. + Es gibt noch ein paar Issues, aber das meiste was wir haben funktioniert auch soweit. + \section*{Was muss noch gemacht werden?} + \begin{itemize} + \item Parsen verbessern (muss nicht alles gemacht werden, aber wäre vielleicht schön) + \begin{itemize} + \item Ordnungskommentare des Bundestagspräsidenten herausfiltern + \item Kommentare extrahieren und in Kategorien einteilen, z.B. Kategorie Beifall mit Liste der applaudierenden Parteien + \item Metadaten vom Anfang extrahieren + \item Fehler bereinigen + \end{itemize} + \item Tabellen der einzelnen Sitzungen kombinieren zu globalen Tabellen + \item Daten auf bestimmte Fragestellungen untersuchen + \begin{itemize} + \item Wer redet am häufigsten / längsten? + \item Was ist typisches Vokabular für einzelne Fraktionen? + \item Welche Fraktion gibt / bekommt den meisten Beifall / die meisten Zwischenrufe? + \item Ab wann wird Pandemie-Vokabular (Virus, Corona, Maske, $\dots$ ) genutzt? + \item Hat die Pandemie andere Themen wie Klimawandel verdrängt? + \end{itemize} + \item Ergebnisse visualisieren + \end{itemize} + \section*{Wie sieht der Plan für die nächsten Wochen aus?} + \begin{itemize} + \item[-24.07.] Klausurenphase + \item[25.07.-31.07.] Datenanalyse + \item[01.08.-07.08.] Visualisierung, Bugfixes und Improvements + \item[08.08.-11.08.] Präsentation machen + \end{itemize} +\end{document} \ No newline at end of file