|
|
|
@@ -0,0 +1,40 @@ |
|
|
|
\documentclass{article} |
|
|
|
|
|
|
|
\begin{document} |
|
|
|
\section*{Was wurde bisher gemacht?} |
|
|
|
\begin{itemize} |
|
|
|
\item Website scrapen |
|
|
|
\item Protokolle fetchen |
|
|
|
\item Protokolle parsen |
|
|
|
\end{itemize} |
|
|
|
\section*{Wie ist der Zustand aktuell?} |
|
|
|
Protokolle sind heruntergeladen und geparsed in einzelnen Tabellen, die noch zusammengeführt werden müssen. |
|
|
|
Es gibt noch ein paar Issues, aber das meiste was wir haben funktioniert auch soweit. |
|
|
|
\section*{Was muss noch gemacht werden?} |
|
|
|
\begin{itemize} |
|
|
|
\item Parsen verbessern (muss nicht alles gemacht werden, aber wäre vielleicht schön) |
|
|
|
\begin{itemize} |
|
|
|
\item Ordnungskommentare des Bundestagspräsidenten herausfiltern |
|
|
|
\item Kommentare extrahieren und in Kategorien einteilen, z.B. Kategorie Beifall mit Liste der applaudierenden Parteien |
|
|
|
\item Metadaten vom Anfang extrahieren |
|
|
|
\item Fehler bereinigen |
|
|
|
\end{itemize} |
|
|
|
\item Tabellen der einzelnen Sitzungen kombinieren zu globalen Tabellen |
|
|
|
\item Daten auf bestimmte Fragestellungen untersuchen |
|
|
|
\begin{itemize} |
|
|
|
\item Wer redet am häufigsten / längsten? |
|
|
|
\item Was ist typisches Vokabular für einzelne Fraktionen? |
|
|
|
\item Welche Fraktion gibt / bekommt den meisten Beifall / die meisten Zwischenrufe? |
|
|
|
\item Ab wann wird Pandemie-Vokabular (Virus, Corona, Maske, $\dots$ ) genutzt? |
|
|
|
\item Hat die Pandemie andere Themen wie Klimawandel verdrängt? |
|
|
|
\end{itemize} |
|
|
|
\item Ergebnisse visualisieren |
|
|
|
\end{itemize} |
|
|
|
\section*{Wie sieht der Plan für die nächsten Wochen aus?} |
|
|
|
\begin{itemize} |
|
|
|
\item[-24.07.] Klausurenphase |
|
|
|
\item[25.07.-31.07.] Datenanalyse |
|
|
|
\item[01.08.-07.08.] Visualisierung, Bugfixes und Improvements |
|
|
|
\item[08.08.-11.08.] Präsentation machen |
|
|
|
\end{itemize} |
|
|
|
\end{document} |