| @@ -6,20 +6,24 @@ | |||||
| \item Website scrapen | \item Website scrapen | ||||
| \item Protokolle fetchen | \item Protokolle fetchen | ||||
| \item Protokolle parsen | \item Protokolle parsen | ||||
| \begin{itemize} | |||||
| \item Redner ermitteln | |||||
| \item Redebeiträge extrahieren | |||||
| \item Ordnungskommentare filtern | |||||
| \item Kommentare extrahieren | |||||
| \end{itemize} | |||||
| \end{itemize} | \end{itemize} | ||||
| \section*{Wie ist der Zustand aktuell?} | \section*{Wie ist der Zustand aktuell?} | ||||
| Protokolle sind heruntergeladen und geparsed in einzelnen Tabellen, die noch zusammengeführt werden müssen. | |||||
| Protokolle sind heruntergeladen und geparsed in einer großen Tabelle. | |||||
| Es gibt noch ein paar Issues, aber das meiste was wir haben funktioniert auch soweit. | Es gibt noch ein paar Issues, aber das meiste was wir haben funktioniert auch soweit. | ||||
| \section*{Was muss noch gemacht werden?} | \section*{Was muss noch gemacht werden?} | ||||
| \begin{itemize} | \begin{itemize} | ||||
| \item Parsen verbessern (muss nicht alles gemacht werden, aber wäre vielleicht schön) | \item Parsen verbessern (muss nicht alles gemacht werden, aber wäre vielleicht schön) | ||||
| \begin{itemize} | \begin{itemize} | ||||
| \item Ordnungskommentare des Bundestagspräsidenten herausfiltern | |||||
| \item Kommentare extrahieren und in Kategorien einteilen, z.B. Kategorie Beifall mit Liste der applaudierenden Parteien | |||||
| \item Kommentare in Kategorien einteilen, z.B. Kategorie Beifall mit Liste der applaudierenden Parteien | |||||
| \item Metadaten vom Anfang extrahieren | \item Metadaten vom Anfang extrahieren | ||||
| \item Fehler bereinigen | \item Fehler bereinigen | ||||
| \end{itemize} | \end{itemize} | ||||
| \item Tabellen der einzelnen Sitzungen kombinieren zu globalen Tabellen | |||||
| \item Daten auf bestimmte Fragestellungen untersuchen | \item Daten auf bestimmte Fragestellungen untersuchen | ||||
| \begin{itemize} | \begin{itemize} | ||||
| \item Wer redet am häufigsten / längsten? | \item Wer redet am häufigsten / längsten? | ||||