|
|
|
@@ -6,20 +6,24 @@ |
|
|
|
\item Website scrapen |
|
|
|
\item Protokolle fetchen |
|
|
|
\item Protokolle parsen |
|
|
|
\begin{itemize} |
|
|
|
\item Redner ermitteln |
|
|
|
\item Redebeiträge extrahieren |
|
|
|
\item Ordnungskommentare filtern |
|
|
|
\item Kommentare extrahieren |
|
|
|
\end{itemize} |
|
|
|
\end{itemize} |
|
|
|
\section*{Wie ist der Zustand aktuell?} |
|
|
|
Protokolle sind heruntergeladen und geparsed in einzelnen Tabellen, die noch zusammengeführt werden müssen. |
|
|
|
Protokolle sind heruntergeladen und geparsed in einer großen Tabelle. |
|
|
|
Es gibt noch ein paar Issues, aber das meiste was wir haben funktioniert auch soweit. |
|
|
|
\section*{Was muss noch gemacht werden?} |
|
|
|
\begin{itemize} |
|
|
|
\item Parsen verbessern (muss nicht alles gemacht werden, aber wäre vielleicht schön) |
|
|
|
\begin{itemize} |
|
|
|
\item Ordnungskommentare des Bundestagspräsidenten herausfiltern |
|
|
|
\item Kommentare extrahieren und in Kategorien einteilen, z.B. Kategorie Beifall mit Liste der applaudierenden Parteien |
|
|
|
\item Kommentare in Kategorien einteilen, z.B. Kategorie Beifall mit Liste der applaudierenden Parteien |
|
|
|
\item Metadaten vom Anfang extrahieren |
|
|
|
\item Fehler bereinigen |
|
|
|
\end{itemize} |
|
|
|
\item Tabellen der einzelnen Sitzungen kombinieren zu globalen Tabellen |
|
|
|
\item Daten auf bestimmte Fragestellungen untersuchen |
|
|
|
\begin{itemize} |
|
|
|
\item Wer redet am häufigsten / längsten? |
|
|
|
|